Google emite disculpas e informe del incidente por la interrupción de la nube que duró varias horas

Seleccione idioma

Spanish

Down Icon

Seleccione país

America

Down Icon

Google emite disculpas e informe del incidente por la interrupción de la nube que duró varias horas

Google emite disculpas e informe del incidente por la interrupción de la nube que duró varias horas

Google se disculpó por una interrupción importante que, según la compañía, fue causada por múltiples capas de actualizaciones recientes defectuosas.

La compañía publicó un informe de incidentes el viernes por la noche que explicaba las horas de inactividad del jueves. Más de 70 servicios en la nube de Google dejaron de funcionar correctamente en todo el mundo , lo que provocó la caída o interrupción de docenas de servicios de terceros, incluido Cloudflare. , OpenAI y Shopify Gmail, Google Calendar, Google Drive, Google Meet y otros productos propios también funcionaron mal.

"Nos disculpamos profundamente por el impacto que esta interrupción ha tenido", escribió Google en el informe del incidente. "Los clientes de Google Cloud y sus usuarios confían sus negocios a Google, y haremos lo posible por mejorar. Nos disculpamos por el impacto que esto ha tenido no solo en los negocios de nuestros clientes y sus usuarios, sino también en la confianza en nuestros sistemas. Nos comprometemos a implementar mejoras para evitar interrupciones como esta en el futuro".

Thomas Kurian, director ejecutivo de la unidad de nube de Google, también publicó sobre la interrupción en una publicación en X el jueves, diciendo "lamentamos la interrupción que esto causó a nuestros clientes".

En mayo, Google añadió una nueva función a sus "verificaciones de política de cuotas" para evaluar las solicitudes entrantes automatizadas. Sin embargo, esta nueva función no se probó inmediatamente en situaciones reales, según el informe del incidente. Como resultado, los sistemas de la empresa no pudieron gestionar correctamente los datos de la nueva función, que incluía entradas en blanco. Estas entradas en blanco se enviaron a todas las regiones de centros de datos de Google Cloud, lo que provocó los fallos, según la empresa.

Los ingenieros solucionaron el problema en 10 minutos, según la empresa. Sin embargo, el incidente se prolongó durante siete horas, y la caída provocó una sobrecarga en algunas regiones más extensas.

Al lanzar la función, Google no utilizó indicadores de características, una práctica cada vez más común en la industria que permite una implementación lenta para minimizar el impacto en caso de problemas. Los indicadores de características habrían detectado el problema antes de que la función estuviera disponible de forma generalizada, según Google.

En el futuro, Google cambiará su arquitectura para que, si un sistema falla, pueda seguir funcionando sin problemas, según la compañía. Google también afirmó que auditará todos los sistemas y mejorará sus comunicaciones, tanto automatizadas como humanas, para que nuestros clientes reciban la información necesaria lo antes posible para reaccionar ante los problemas.

— Jordan Novet de CNBC contribuyó a este informe.

MIRA: Las adquisiciones de Google destacan la reducción de costos de la tecnología en medio del auge del gasto en capital en inteligencia artificial

CNBC

CNBC

Noticias similares

Todas las noticias
Animated ArrowAnimated ArrowAnimated Arrow