La caída de Babilonia es una advertencia para los unicornios de IA
Babylon's fall is a warning to AI unicorns
A finales de 2016, Hugh Harvey trabajaba como médico consultor en el Servicio Nacional de Salud del Reino Unido. Harvey había incursionado en el aprendizaje automático mientras realizaba un doctorado en investigación y había visto el potencial de la inteligencia artificial para revolucionar la atención médica. Pero sentía firmemente que la introducción de la IA en la medicina no vendría desde el NHS, sino desde la industria. Así que cuando surgió una oportunidad en una nueva startup de salud tecnológica llamada Babylon Health, Harvey se postuló.
Fundada en Londres en 2013 por Ali Parsa, un ex banquero británico-iraní, Babylon tenía un objetivo ambicioso: quería hacer por la atención médica lo que Google hizo por la información; es decir, hacerla gratuita y fácilmente accesible para todos. Para cuando Harvey se unió a la empresa en 2016, ya había recaudado decenas de millones en financiamiento de capital de riesgo, aunque en ese momento solo había desarrollado una aplicación que permitía a los pacientes tener videollamadas con sus médicos. Útil, sí, pero no exactamente revolucionario. El valor de la compañía radicaba en su gran ambición de agregar un verificador de síntomas impulsado por IA, que aceleraría o incluso automatizaría los diagnósticos.
Acostumbrado a las condiciones frugales del perpetuamente deficitario NHS, Harvey dice que quedó impresionado por las lujosas instalaciones: una computadora portátil esperándolo en su escritorio, una oficina elegante en el exclusivo South Kensington, cervezas y pizzas gratuitas en la oficina durante el almuerzo. Pero pronto, Harvey pudo echar un vistazo al software que estaba detrás de toda la emoción. Lo que le mostraron fue un montón de hojas de cálculo de Excel que contenían rutas de decisiones clínicas escritas por médicos jóvenes de la compañía. Básicamente, habían dividido el cuerpo en diferentes partes y, según la parte del cuerpo en la que hiciera clic el usuario, la aplicación seguiría lo que llamaban “flujos clínicos” o árboles de decisiones. “Pensé, bueno, esto no es realmente inteligencia artificial”, recuerda Harvey.
Pero en los años siguientes, la exageración alrededor de Babylon siguió creciendo. Firmó contratos con el NHS y proveedores de seguros de salud británicos. El gigante tecnológico chino Tencent firmó un acuerdo para ofrecer servicios a través de WeChat. El fondo soberano de Arabia Saudita invirtió 550 millones de dólares. Para cuando salió a bolsa en la Bolsa de Nueva York en 2021, Babylon tenía un valor de 4.2 mil millones de dólares. Pero las cosas ya se estaban desmoronando. Las pérdidas de la compañía se estaban acumulando a medida que gastaba mucho en busca de crecimiento. El precio de sus acciones rápidamente se desplomó. A mediados de agosto de este año, después de que un acuerdo de rescate fracasara, se anunció que la parte del negocio en el Reino Unido se declaraba en quiebra, un proceso similar a la protección por bancarrota en los Estados Unidos. La compañía cerró su sede en Estados Unidos, despidió a scores de empleados y también se declaró en quiebra allí.
ENBLE habló con tres ex empleados de Babylon Health para descubrir qué salió tan mal para la favorita del panorama de salud tecnológica “digital primero”. Lo que dicen sobre el colapso de la compañía, en un momento en que el interés de los inversores de capital de riesgo en IA y atención médica está en su punto más alto, es una advertencia sobre los peligros de respaldar la exageración en lugar de la entrega.
- La mañana siguiente Los planes de Amazon para otro evento de ventas
- La caída de Web3 y el surgimiento del Internet 3D
- Elon Musk podría cobrarle a todos por Twitter/X próximamente
Ni Parsa ni Babylon Health respondieron a varias solicitudes de comentarios.
Parsa nombró su compañía en honor a la antigua ciudad de Babilonia, que, según el historiador griego Heródoto, tenía una plaza donde los ciudadanos se reunían para compartir consejos sobre cómo tratar sus dolencias.
Los ex empleados dicen que Parsa estaba obsesionado con el “blitzscaling”, el tipo de crecimiento acelerado empresarial popularizado por el cofundador de LinkedIn, Reid Hoffman. La compañía llevaba a cabo contrataciones descontroladas, según dicen los ex empleados, y los equipos a menudo trabajaban en proyectos superpuestos. En un momento, tres equipos estaban trabajando en tres versiones diferentes y mutuamente incompatibles del verificador de síntomas, dice un ex empleado que habló bajo condición de anonimato. El empleado dice que una vez encontró a un gerente de productos vagando por el edificio en su segundo día en la compañía. Lo habían dejado buscando un equipo con el que trabajar porque nadie lo había incorporado o le había dicho dónde debería estar. “Supuso que era una especie de ‘desafío’ de incorporación encontrar un equipo para unirse”, dice el empleado.
El equipo directivo experimentó muchos cambios. Los líderes de alto nivel se iban a retiros en Antigua, lo cual no era ampliamente conocido por el personal, hasta que se filtró en un canal público de Slack. Parsa “una vez hizo una presentación desde Antigua fingiendo estar en su oficina”, dice un ex empleado. Los ex empleados dicen que el estilo de liderazgo de Parsa era “idiosincrásico” y “ocasionalmente megalómano”. En un momento, Parsa intentó prohibir Microsoft PowerPoint en la compañía. Los trabajadores, a quienes Parsa llamaba babilonios, fueron reprendidos por el CEO por irse a las 5:30 p.m., dice Harvey.
La prisa de Parsa por escalar superó la capacidad de Babylon Health para lanzar productos terminados, según ex empleados. Después de unirse, la compañía le aseguró a Harvey que su equipo de ciencia de datos estaba trabajando en un gráfico de conocimiento, que conecta fragmentos de conocimiento mediante probabilidades. Lo que parecía era Harvey y sus colegas clínicos respondiendo miles de preguntas médicas, como “¿Cuál es la probabilidad de que alguien con ictericia tenga hepatitis?” Las preguntas se volvieron cada vez más detalladas; por ejemplo, ¿cuál es la probabilidad de que alguien tenga dos semanas de ictericia y tenga hepatitis B?
“Las preguntas se volvieron cada vez más ridículas y sin relación”, dice Harvey, “y aún así no era realmente IA”. (Otro ex empleado de Babylon Health, que trabajó en el equipo de IA, dice que es probable que el equipo de aprendizaje automático simplemente le mostrara a Harvey hojas de cálculo de Excel por simplicidad, pero admite que el modelo de árbol de decisiones no era “particularmente sofisticado”.)
En un momento, la BBC tenía programado visitar la oficina para grabar la tecnología. Pero había un problema: la aplicación aún no se había terminado. Solo se había modelado para gastroenterología; básicamente, problemas estomacales. No tenía interfaz, por lo que Harvey recuerda que un científico de datos tuvo que dormir en la oficina durante varias noches y los fines de semana mientras corrían para construir algo que pareciera una aplicación. “Pero todos sabíamos … que no es el producto que estamos construyendo”, dice Harvey. “Esto es una maqueta de algo que se ha reunido apresuradamente con muchas horas de trabajo para demostrar a la BBC”. El relato de Harvey fue corroborado por otro ex empleado.
La aplicación de verificación de síntomas de Babylon, llamada GP at Hand, se lanzó en 2017, prometiendo ayudar a abordar las largas listas de espera del NHS automatizando algunas consultas de pacientes.
El papel de Harvey en Babylon era obtener la aprobación de los reguladores de que la aplicación podía usarse para triar a los pacientes, una evaluación preliminar que determina cuán urgente es que un paciente sea atendido por un médico. Pero esta no era la línea oficial. Parsa estaba diciendo públicamente en 2017 que podía diagnosticar a los pacientes: una afirmación mucho más grandiosa. Harvey dice que Parsa se le acercaba casi a diario para preguntar si ya habían obtenido el permiso regulatorio. Harvey explicaba que lo obtendrían, pero solo para triaje.
Más tarde ese año, la compañía afirmó que su IA tenía un mejor rendimiento que los humanos en un examen utilizado para evaluar la capacidad de diagnóstico de los médicos (una afirmación que fue rápidamente cuestionada por expertos). Para entonces, Harvey había renunciado y regresado al NHS como radiólogo consultor. Pero la aplicación GP at Hand creció en popularidad, aunque no sin críticas de profesionales de la salud.
Una de las primeras personas en alertar sobre la efectividad de la IA de Babylon Health fue un oncólogo consultor del NHS, David Watkins. Tuiteando al principio bajo el seudónimo @DrMurphy11, Watkins documentaba regularmente en línea las desviaciones inusuales de la norma clínica que el bot tomaría, como preguntarle a una mujer de 66 años preocupada por un bulto en el seno si estaba embarazada o amamantando, y no detectar los síntomas de un ataque al corazón. La compañía lo llamó “troll” en un comunicado público. Pero las preocupaciones de Watkins también se compartieron dentro de la empresa y, al parecer, por el regulador médico del Reino Unido.
Un informe de 2017 de la Comisión de Calidad de Atención, el regulador de servicios de salud y atención social en Inglaterra, puso en duda la seguridad y eficacia de los servicios de la compañía, por lo que Babylon amenazó con demandar. En 2019, ENBLE informó que Babylon le costaba al NHS más de £26 millones ($32 millones). Luego, en 2020, la compañía admitió que su aplicación GP at Hand había sufrido una violación de datos que permitía a los usuarios ver docenas de consultas en video realizadas por otros pacientes. Y, aunque su servicio estaba siendo adoptado en todo el país, Babylon Health luchaba por hacer que su modelo funcionara financieramente en el Reino Unido. Parsa culpó su fracaso a problemas estructurales dentro del NHS que significaron que nunca logró obtener ganancias. Terminó su último contrato con el NHS en agosto del año pasado.
Pero Parsa siempre había tenido ambiciones de ir global. La compañía se estableció en Canadá, pero vendió sus operaciones allí en 2021 como parte de un acuerdo de licencia. El mismo año, una investigación del gobierno canadiense encontró que la aplicación no cumplía con las regulaciones de privacidad del país. Babylon centró su atención en los Estados Unidos, donde podía ganar más dinero a través de los programas de seguros de salud Medicaid y Medicare. Parsa incluso se mudó allí.
Pero la aventura en Estados Unidos también estaba condenada al fracaso. Estaba ingresando a un mercado muy saturado y no estaba listo para competir. “Aquí hay muchas empresas de telemedicina a gran escala que han estado aquí mucho más tiempo que Babylon”, dice Christina Farr, inversora en tecnología de la salud en OMERS Ventures en San Francisco.
Un ex empleado dice que Parsa no entendía completamente que Estados Unidos era un mercado maduro. La gota que colmó el vaso para el empleado fue cuando vio que se estaba elaborando un contrato para brindar servicios de telemedicina en Missouri a través de Medicaid. Básicamente, Babylon asumiría toda la responsabilidad financiera y la responsabilidad financiera de una aseguradora de salud, pero sin ninguna de las primas exorbitantes que se requieren para cubrir ese tipo de responsabilidad. “Yo dije, ‘No, absolutamente no'”, dice el ex empleado. “‘Esto va a ser un desastre, y no quiero estar aquí cuando eso suceda'”. Renunció.
Incluso el debut de la empresa en el mercado de valores rápidamente fue en declive. En los 18 meses después de su listado, sus acciones cayeron un 99 por ciento. Parsa describió esta caída en picada como un “desastre increíble e incontrolable”. No fue sorprendente. Aunque Babylon estaba generando ingresos, estaba perdiendo mucho dinero. En 2022, la empresa perdió 221 millones de dólares. En los primeros tres meses de 2023, perdió otros 63 millones de dólares. En mayo de 2023, el mayor prestamista de la empresa, Albacore Capital, la llevó a privado e intentó fusionarla con otra empresa de tecnología de la salud, MindMaze. La fusión fracasó a principios de agosto.
Babylon no es la primera empresa en la intersección de la IA y la atención médica que lucha por pasar del entusiasmo al éxito comercial. Su destino “plantea preguntas sobre cómo comercializar la IA en la atención médica”, dice David Wong, profesor asociado de informática de la salud y ciencia de datos en la Universidad de Leeds en el Reino Unido. Wong señala otro fracaso: el colapso de Sensyne Health, una startup de IA, que costó a dos fideicomisos del NHS 18 millones de dólares cuando fue retirada de la Bolsa de Valores de Londres en 2022. Ese mismo año, IBM abandonó Watson Health. Olive AI, una startup de automatización de atención médica valorada en 4 mil millones de dólares en 2021, despidió a un tercio de su personal en febrero de 2023.
Los expertos dicen que la razón por la que empresas como Babylon fracasan es simplemente porque es difícil reemplazar a los clínicos de carne y hueso con un algoritmo, y hay una discrepancia inherente entre la cultura de moverse rápido y romper cosas de las startups tecnológicas y la de la atención médica, donde el cuidado de los pacientes requiere reflexión y contexto.
“Creo que probablemente la parte complicada del mundo de las startups es que hay muchas personas con ideas y la mayoría de ellas no funcionarán”, dice Wong. “Y creo que si hubiera más clínicos a bordo, la mayoría de ellos te dirían rápidamente cuáles tienen posibilidades de funcionar y cuáles no”.