Home Actualidad CONFIABILIDAD DE RED PARTE II

Por Gilberto “GG” Guitarte

En una encuesta muy reciente hecha a empresas proveedoras de servicios de banda ancha por parte de CALIX, dos factores críticos fueron más que resaltados y calificados por las mismas, a saber:

El 61% destacó que el desafío más grande que poseen es la CONFIABILIDAD y por ende la DISPONIBILIDAD de LA RED.

El 54% de las encuestadas agregó como desafío importante la MEJORA de la EXPERIENCIA DE CLIENTES USUARIOS (o QoE por Quality Experience en inglés).

Me permito agregar -aunque sea obvio- que trabajar sobre el primer factor va a mejorar necesariamente al segundo, más allá de lo lograble; también gracias a diferentes tipos de servicios traídos a la mesa por los creativos de marketing.

En el artículo anterior de todofibraoptica.com de marzo 2022, vimos la Parte I de Confiabilidad de Red Óptica, Probabilidad de Falla y Vida Útil, donde nos focalizamos en la fibra óptica propiamente dicha, en los cables ópticos y el medioambiente en los cuales operan. En esta Parte II nos centramos en el resto de los componentes ópticos pasivos de la red física (de ahora en adelante COPs) como: conectores, armarios de planta externa, cajas de empalme o de distribución terminal, divisores ópticos pasivos, etc.

Dos de los organismos que han conducido con éxito ensayos y estudios para determinar científicamente la confiabilidad de los COPs son sin duda IEC y Telcordia, cada uno de ellos focalizado en distintos conceptos y diferentes funcionalidades. Destaco que IEC en su norma 62005- Parte 2 se concentra mayormente en el análisis cuantitativo de confiabilidad basado en ensayos acelerados de Temperatura y Humedad, ambos en Regímenes Estables (cada una mantenida en los mismos valores constantes durante la duración total del ensayo). Es importante aclarar que IEC 62005-2 se concentra exclusivamente en COPs permanentemente acoplados y con predicciones válidas para aquellos que no experimentan una variación mayor en ΔT± 15 ◦C sobre la Temp Media de Operación para la que fueron diseñados y, por lo tanto, otros factores como la vibración o la presencia de solventes orgánicos, el acople y desacople repetitivo de  elementos de red por razones operativas o de ensayos de campo, requieren otros tipos de ensayos de vida útil y funcionalidad (ver TELCORDIA GR-326 para conectores en particular o GR-1221 para confiabilidad de COPs por ejemplo).

Entonces con IEC 62005-2 lo que intentamos establecer es una guía para ensayos que producen Fallas por Desgaste al final de la Vida Útil para poder estimar justamente esta última, y nos focalizamos por el momento en ello.

Distribución de Fallas:

La experiencia ha mostrado que se puede aplicar una distribución normal logarítmica a la ocurrencia de fallas por desgaste final. Eso quiere decir que el logaritmo natural (o sea en base e) de los tiempos de falla, poseen un distribución Gaussiana o Normal, donde el parámetro de dispersión SIGMA es el desvío estándar de la misma. La Función de Distribución de Probabilidades para una Normal Logarítmica está dada por la ecuación siguiente,

Ecuación 1

Donde,

tm=t50 es la Mediana de los Tiempos de Falla (MTF, o Median Time to Failure en inglés) que se requiere para que fallen el 50% de las muestras bajo ensayo.

σ = es el desvío estándar de ln(t).

A lo largo del estándar IEC 62005-2, las tasas de falla esperadas se representan en FITs (recordar que 1 FIT es una falla en 10E+9 horas-dispositivo). Desde el punto de vista de un Sistema o Sistema de Red, la tasa de fallas esperada tiene mucho más valor y sentido que la MTF (tiempo en el que la mitad de los COPs de determinado tipo habrán fallado).

Para sobre estrés térmico se aplica la ecuación de Arrhenius:

Ecuación 2

en la que

t50 es la mediana de los tiempos de falla para el 50% de las muestras

R0 es el coeficiente

k es la constante de Boltzman (8,6×10 E-5 expresada en eV/K, o electronvoltios/K)

T es la temperatura en Kelvins (K)

EA es la Energía de Activación expresada en eV

Para la humedad, que es el segundo condicionante de tiempos de falla, no hay una correlación universalmente aceptada; salvo que exista evidencia contundente que demuestre lo contrario, se puede utilizar la siguiente expresión:

Ecuación 3

 donde

n     es el parámetro de activación de Humedad

HR   es la Humedad Relativa Porcentual (%)

Lo mínimo aceptable como tamaño de muestra, en base a experiencia comprobada para COPs del área de telecomunicaciones, es de 25 para cada ensayo a manera de obtener resultados significativos y, el muestreo debe ser construido aleatoriamente de manera de evitar problemas que tal vez sean de un batch específico de producción. Para ambientes o escenarios de mayor criticidad en la falla como para aplicaciones satelitales o submarinas, se recomienda un tamaño mínimo de la muestra de 200 dispositivos.

Es importante que el mecanismo de falla sea entendido por completo. El estándar IEC62005-3 menciona las modalidades de falla típicas para una serie de COPs, y lista el mecanismo de fallaque está normalmente asociado con la modalidad de falla observada.

En el ejemplo que daremos a continuación, asumimos que los mecanismos de falla dominantes han sido perfectamente identificados y que se ha observado que los mismos se aceleran debido a temperatura elevada y a humedad elevada.

Utilizamos para el ejemplo una matriz de condiciones de ensayo en régimen constante y estable donde las tres primeras investigan el efecto de humedad a temperatura constante (T=85C con HR=45%,65%, y 85%), y las tres últimas muestran el efecto de incremento de temperatura a humedad constante (HR=85%, con T=85C, 75C, y 65C) y con al menos 25 muestras para cada condición de ensayo.

Análisis de resultados:

Se utiliza como criterio de falla un valor de variable que tenga sentido en los requisitos a cumplir por parte de la funcionalidad del elemento de red bajo ensayo. En este ejemplo, elegimos un incremento en la Pérdida por Inserción del dispositivo bajo ensayo, de 1 dBEn términos generales se comprueba que para los COPs resulta efectiva una extrapolación posterior en el tiempo, basado en la segunda mitad de los resultados de ensayo, ya que se observa siempre que los resultados de los primeros cientos de horas son de tasa de falla muy variable hasta que se estabilizan en una tendencia que resulta obvia (ver FIG. 1).

La anterior, muestra que luego de unas 4000 horas de ensayo, los COPs no han fallado todavía pero que se realiza una extrapolación para el incremento de Atenuación mencionado como criterio de falla de 1 dB, cerca de las 7000 hs de ensayo. Si el dispositivo bajo ensayo tiene varios puertos de entrada y varios de salida (como por ejemplo un divisor óptico 2:16) se deben medir todos los caminos ópticos posibles. Si, por ejemplo, el camino entre uno de los puertos de entrada y uno de los de salida ha variado en más de 1 dB, se debe considerar al COP como fallado, aunque los demás caminos ópticos no hayan experimentado todavía un incremento de 1 dB en la Pérdida por Inserción.

Una vez que se ha establecido el Tiempo hasta la falla de cada COP bajo ensayo, se puede establecer la mediana del tiempo de falla o sea MTF.

Supongamos para el ejemplo, que obtenemos los siguientes resultados:

CondiciónTemperatura (C)Temperatura (K)MTF (h)
C853588000
D7534816900
E6533839300

Calculamos las inversas de T(1/358K, 1/348K, y 1/338K) o sea (0,00279  0,00287 y 0,00296) y, podemos ahora plotear la siguiente correlación entre MTF y 1/T (Ver Fig. 2)

Como el eje X es 1/T, de la ecuación t50=R0 exp(-EA/kT) antes mencionada, resulta que el multiplicador de X es EA/k (Energía de activación / constante de Boltzman). De la curva ajustada arriba se determina que el multiplicador de x es 9622.

Luego EA= 9622 *k =9622* 0,000086eV= 0,8 eV.

Repetimos un proceso similar con la Humedad Relativa HR (manteniendo T= cte =85C):

CondiciόnHumedad Relativa (%)MTF (h)
A4512000
B6540000
C851000

En este caso, el ajuste de la curva exponencial t50= R0 exp (- n HR2 ) produce automáticamente el valor de n como -0,0005. (Ver Fig.3)

                                                                  

 Extrapolación para condiciones reales de servicio:

Ahora que tenemos los valores de EA y de podemos combinar las dos ecuaciones que definen t50 como función de (1/T) por un lado, y función de HR2 por otro, o sea,

Ecuación 4

donde,

t50(1)           es la mediana de los tiempos hasta falla en condiciones de T(1) y HR(1)

t50(2)           es la mediana de los tiempos hasta falla en condiciones de T(2) y HR(2)

k                    es la constante de Boltzman (8,6×10 E-5 expresada en eV/K)

T1                  es la Temperatura de Servicio real en grados Kelvin (K)

HR(servicio)   es la Humedad Relativa de Servicio real en porcentual (%)

T2                   es la Temperatura de ensayo de vida ύtil de en grados Kelvin (K)

HR(ensayo)     es la Humedad Relativa del ensayo de vida ύtil en porcentual (%)

Podemos ahora, en base a la determinación de EA, n, yMTF (llamada t50 en la formula), en condiciones de ensayo de vida útil, estimar la MTF en condiciones reales de TEMPERATURA y HUMEDAD RELATIVA de servicio. Hay que recordar que estos tres valores son determinados empíricamente para un tipo de COP en particular y en condiciones de ensayo particulares pero constantes, continuas y estables.

Como ejemplo simple, con los valores anteriores, podemos determinar la siguiente tabla de MTFs en una localidad típica de Europa Occidental, en base también a condiciones típicamente encontradas en dicha localidad:

Medioambiente de operación“Condición equivalente” de régimen de servicio estable  (◦C/HR%)MTF calculada con la ecuación anterior (h)
Oficina Central o Cabecera25/4024,9 E+6
Caja de Pared o Vereda15/932,17 E+6
Peor caso subterráneo25/851,5   E+6

Las condiciones ambientales equivalentes de servicio se ven “benignas” en cuanto a temperaturas porque hablamos de una localidad en particular en el caso de exteriores, y hablamos de un ambiente acondicionado permanentemente estable en el caso de una Oficina Central o Cabecera con HVAC.

¡NO CAER EN EL ERROR de imaginar que esto es válido por igual para los COPs en forma independiente de la calidad de materiales utilizados y de lo estricto de las tolerancias y los requerimientos con los que fueron que fueron manufacturados!

Los COPs de mala calidad, ya sea por materiales reciclados o económicos o fabricados sin rigor de proceso industrial, poseerán distintos valores de EA, n y, por ende, de t(50) y MTF manifestándose así su menor vida útil esperada y mayor probabilidad de falla por desgaste en servicio para iguales condiciones de servicio que los COPs de calidad superior.

Cálculo de la Tasa de Fallas o Régimen de Fallas (λ) :

El cálculo de la tasa de fallas λ a partir de la MTF, requiere que se conozca el coeficiente de dispersión σ y que sea constante con la Temperatura. La tasa de fallas puede calcularse con un programa matemático o una planilla del tipo EXCEL utilizando la denominada función de error. Para la Distribución normal Logarítmica la Tasa de Falla instantánea para un determinado valor dado del tiempo t transcurrido, se calcula a partir de la siguiente expresión:

Ecuación 5

donde

λ(t)          es la tasa instantánea de fallas , por horas-dispositivo, al tiempo t

t              es el tiempo

tm= t50           es la mediana de los tiempos de falla para que fallen el 50% de las muestras

σ             es el factor de dispersión

La Tasa de Falla se puede expresar en FITs con la ecuación siguiente ya explicada en la 3er edición de la revista todofibraoptica.com, a saber:

Tasa Instantánea de Fallas en FITs = λ(t)* E+9   (ecuación 6)

Para determinar el factor de dispersión σ, se toman los valores de los TTF (tiempo hasta la falla en condiciones de régimen estable y constante de T y HR) para el ensayo de al menos 25 muestras, se ordenan en una tabla por orden creciente en horas hasta la falla y a cada una de la muestras se le asigna un número ordinal ascendente también del n=1,n=2,n=3,etc.,  hasta el n= 25=N . Luego obtenemos los logaritmos naturales de los TTF y ellos serán los valores de una distribución Y=ln(TTF). De la cual determinamos luego la función inversa de la distribución normal acumulada estándar. (En algunos programas de cálculo matemático similares al EXCEL, es la función NORMSINV(n/N+1) donde n es el número asignado a cada muestra y N es el tamaño de la muestra, en este caso N= 25). Por el método de cuadrados mínimos, se ajusta una recta en un gráfico xy, que se observa obedece a la función y = σx+ln t(50) , pudiendo despejar entonces el valor buscado de σ.

Imaginemos que se ha hecho una serie de ensayos para un tipo de COP determinado, a una condición de régimen estable T=25C / HR=85%. Se calculó luego la MTF usando la ecuación (4) y con ella se determinó que t(50) = 1,5E+6 horas (1.500.000 h). El ensayo de vida útil arrojó un valor de σ0,85. Usando estos valores y las ecuaciones (5) y (6) se calcularon los λ(t) y los FITs de la siguiente tabla y su gráfica correspondiente a continuación (Ver Fig.4)

t (años)Tasa de Fallas (FITs)
10,00
20,03
52
1020
1559
20110
25167
30223
Figura 4

Este ejemplo muestra que dicho COP no tiene ningún periodo de fallas constante en el tiempo, pero, que se puede esperar del mismo que ocurran muy pocas fallas durante los primeros 5 a 10 años de vida en servicio (permanentemente acoplado).

Conclusión:

En esta parte II del tema de Confiabilidad de Red Óptica, Probabilidad de Falla y Vida Útil, intentamos mostrar la justificación por la cual las firmas con prestigio de calidad y renombre en la industria diseñan Elementos de Red que posibilitan una vida útil por desgaste de al menos 20 a 30 años. Y, si consideramos válidos los resultados de la encuesta mencionada al principio de este artículo, resulta casi imposible imaginarse que una Operadora de Servicios de Banda Ancha se permita arriesgar el perder una base importante de clientes por degradación de la QoE, debido a que tal vez algún funcionario de esta decida “ahorrar” costos de adquisición en algunos de los elementos que componen el enlace óptico.

Cuando alguien tiene ceguera técnica y no puede ver o darse cuenta de que la Confiabilidad de la Red depende sin excepción de la confiabilidad de todos y cada uno de los elementos componentes de la misma, provoca que el personal de Operación y Mantenimiento incurra en mayores costes de reparación y restauración de servicio. Pero además de este efecto no deseado, lo que ha ocurrido es que ha sufrido también la QoE de los clientes, y estos dos acontecimientos queridos lectores, son los que se mencionan al principio como los dos más importantes para permitir el descanso y el sueño de las Operadoras de Red… ¿o no?

En la tercera y última parte de este gran tema, trataré de compartir con ustedes algunos conceptos sobre fallas aleatorias y algunas experiencias interesantes sobre la relación entre la “ceguera técnica”, el CAPEX, el OPEX y la QoE de los clientes.

El Ingeniero Gilberto “GG” Guitarte “es un experimentado líder de fibra óptica, fue presidente del Fiber to the Home Council Latin America (ahora Fiber Broadband Association LATAM Chapter). Actualmente es instructor certificado por la Fiber Optic Association (FOA) y consultor en Redes de Acceso de Fibra y Redes Pasivas Ópticas (Passive Optical LANs).

Related Articles