La IA generativa está haciendo que las empresas tengan aún más sed de tus datos

La IA generativa aumenta la demanda de tus datos por parte de las empresas

Zoom, la empresa que normalizó asistir a reuniones de negocios en pijama, se vio obligada a desactivar el silencio esta semana para tranquilizar a los usuarios de que no utilizaría datos personales para entrenar inteligencia artificial sin su consentimiento.

Un usuario avispado de Hacker News notó la semana pasada que una actualización de los términos y condiciones de Zoom en marzo parecía darle a la empresa vía libre para recopilar voz, video y otros datos, y alimentarlos en sistemas de aprendizaje automático.

Los nuevos términos indicaban que los clientes “consentían al acceso, uso, recopilación, creación, modificación, distribución, procesamiento, compartición, mantenimiento y almacenamiento de los datos generados por el servicio de Zoom” para propósitos que incluían “aprendizaje automático o inteligencia artificial (incluida la capacitación y ajuste de algoritmos y modelos)”.

Este descubrimiento provocó artículos críticos y publicaciones enojadas en las redes sociales. Pronto, Zoom retrocedió. El lunes, la directora de producto de Zoom, Smita Hasham, escribió una entrada de blog que decía: “No utilizaremos contenido de audio, video o chat de los clientes para entrenar nuestros modelos de inteligencia artificial sin su consentimiento”. La empresa también actualizó sus términos para decir lo mismo.

Esas actualizaciones parecen suficientemente tranquilizadoras, pero por supuesto muchos usuarios de Zoom o administradores de cuentas empresariales podrían hacer clic en “Aceptar” a los términos sin darse cuenta completamente de lo que están entregando. Y los empleados obligados a usar Zoom pueden no ser conscientes de la elección que ha hecho su empleador. Un abogado señala que los términos aún permiten que Zoom recopile muchos datos sin consentimiento (Zoom no respondió a una solicitud de comentario).

El alboroto muestra la falta de protecciones de datos significativas en un momento en que el auge de la IA generativa ha hecho que la industria tecnológica tenga aún más hambre de datos de lo que ya tenía. Las empresas han llegado a ver la IA generativa como una especie de monstruo al que se debe alimentar a toda costa, incluso si no siempre está claro para qué se necesita exactamente esos datos o qué podrían llegar a hacer esos futuros sistemas de IA.

El ascenso de los generadores de imágenes de IA como DALL-E 2 y Midjourny, seguido de ChatGPT y otros chatbots ingeniosos pero defectuosos, fue posible gracias a grandes cantidades de datos de entrenamiento, muchos de ellos con derechos de autor, que se obtuvieron de la web. Y toda clase de empresas están buscando actualmente utilizar los datos que poseen, o que generan sus clientes y usuarios, para construir herramientas de IA generativas.

Zoom ya está subido al carro de la IA generativa. En junio, la empresa introdujo dos funciones de generación de texto para resumir reuniones y redactar correos electrónicos sobre ellas. Zoom podría utilizar datos de las reuniones de video de sus usuarios para desarrollar algoritmos más sofisticados. Estos podrían resumir o analizar el comportamiento de las personas en las reuniones, o incluso representar una imagen virtual de alguien cuya conexión se cayó temporalmente o que no ha tenido tiempo de ducharse.

El problema con el esfuerzo de Zoom por obtener más datos es que refleja la situación general cuando se trata de nuestros datos personales. Muchas empresas tecnológicas ya se benefician de nuestra información, y muchas de ellas, como Zoom, ahora están buscando formas de obtener más datos para proyectos de IA generativa. Y sin embargo, depende de nosotros, los usuarios, tratar de controlar lo que están haciendo.

“Las empresas tienen un deseo extremo de recopilar la mayor cantidad de datos posible”, dice Janet Haven, directora ejecutiva del grupo de expertos Data and Society. “Este es el modelo de negocio: recopilar datos y construir productos en torno a esos datos, o vender esos datos a intermediarios de datos”.

Estados Unidos carece de una ley federal de privacidad, lo que deja a los consumidores más expuestos al hambre de datos inspirado por ChatGPT que las personas en la Unión Europea. La legislación propuesta, como la Ley Estadounidense de Privacidad y Protección de Datos, ofrece cierta esperanza de proporcionar normas federales más estrictas sobre la recopilación y uso de datos, y la Declaración de Derechos de IA de la administración Biden también solicita la protección de datos por defecto. Pero por ahora, la resistencia pública como respuesta a los movimientos de Zoom es la forma más efectiva de frenar el apetito de datos de las empresas. Desafortunadamente, este no es un mecanismo confiable para detectar todas las decisiones cuestionables de las empresas que intentan competir en IA.

En una época en la que las tecnologías nuevas más emocionantes y elogiadas se construyen sobre montañas de datos recopilados de los consumidores, a menudo de formas éticamente cuestionables, parece que las nuevas protecciones no pueden llegar lo suficientemente pronto. “Cada persona debe tomar medidas para protegerse”, dice Havens. “Esto es contrario a la idea de que este es un problema social”.