Detectando por qué la Slack se bajo

Cómo los administradores de TI con Meraki Insight sabían lo que estaba mal antes que nadie.

El viernes por la tarde, es posible que haya experimentado Slack corriendo (mucho) más lento de lo habitual. Si es así, no estabas solo. Muchas personas en Internet notaron que los mensajes y las notificaciones de Slack se retrasaron ligeramente.

Como siempre, Meraki Insight detectó este problema en tiempo real. Los ingenieros de red que usaban MI podían identificar fácilmente la causa raíz del problema (pista: no era la red).

La primera señal de problemas fue una alerta.

Si hace clic en el enlace de alerta para obtener más información, verá que el tiempo de respuesta para Slack superó los 30 segundos (!!) varias veces durante el día.

Finalmente, MI hace que sea realmente simple identificar quién está afectado. En este caso, resulta que solo unos pocos servidores Slack se vieron afectados, y un dominio fue especialmente lento. Como resultado, no todos los clientes / usuarios se vieron afectados, e incluso aquellos que experimentaron lentitud probablemente solo vieron algunas funciones funcionando lentamente, mientras que otras funcionaron como se esperaba.

(Clientes)

Efectivamente, más tarde en el día, Slack salió con más detalles.

En particular, Slack señaló que “durante este tiempo, aproximadamente el 10-25% de los trabajos resultaron en errores o fallas. Para las 10:00 a.m. PDT, restauramos completamente la entrega de mensajes y redujimos las tasas de error a menos del 5% a medida que el equipo continuó trabajando en una recuperación completa «.

Un ingeniero que estaba usando MI habría diagnosticado fácilmente este problema en tiempo real e identificado por qué algunos usuarios se vieron afectados mientras que otros no, antes de que Slack publicara detalles de su interrupción.

Sumérgete en Meraki Insight registrándote en un seminario web.