La carrera armamentista de detección de IA está en marcha

The AI detection arms race is underway.

Edward Tian no se consideraba a sí mismo como un escritor. Como estudiante de informática en Princeton, había tomado algunas clases de periodismo, donde aprendió los conceptos básicos de la redacción, y su actitud alegre y su curiosidad de experimentador lo hicieron querido por sus profesores y compañeros de clase. Pero describe su estilo de escritura en ese momento como “bastante malo”: fórmulaico y torpe. Uno de sus profesores de periodismo dijo que Tian era bueno en “reconocimiento de patrones”, lo cual fue útil al producir noticias. Así que Tian se sorprendió cuando, en su segundo año, logró obtener un lugar en el exclusivo seminario de escritura de no ficción de John McPhee.

Cada semana, 16 estudiantes se reunían para escuchar al legendario escritor de The New Yorker desmenuzar su oficio. McPhee asignaba ejercicios que los obligaban a pensar rigurosamente en las palabras: describir una obra de arte moderno en el campus, o acortar el Discurso de Gettysburg. Usando un proyector y diapositivas, McPhee compartía diagramas dibujados a mano que ilustraban las diferentes formas en que estructuraba sus ensayos: una línea recta, un triángulo, una espiral. Tian recuerda que McPhee decía que no podía enseñar a sus estudiantes cómo escribir, pero al menos podía ayudarles a encontrar su propia voz única.

Este artículo aparece en el número de octubre de 2023. Suscríbete a ENBLE.

Fotografía: Jessica Chou

Si McPhee despertó una visión romántica del lenguaje en Tian, la informática ofrecía una perspectiva diferente: el lenguaje como estadísticas. Durante la pandemia, se tomó un año libre para trabajar en la BBC y hacer prácticas en Bellingcat, un proyecto de periodismo de código abierto, donde escribió código para detectar bots de Twitter. Como estudiante de tercer año, tomó clases sobre aprendizaje automático y procesamiento del lenguaje natural. Y en el otoño de 2022, comenzó a trabajar en su tesis de último año sobre la detección de las diferencias entre el texto generado por IA y el escrito por humanos.

Cuando ChatGPT debutó en noviembre, Tian se encontró en una posición inusual. Mientras el mundo se volvía loco por este nuevo chatbot radicalmente mejorado, Tian ya estaba familiarizado con la tecnología subyacente de GPT-3. Y como periodista que había trabajado para desenmascarar campañas de desinformación, comprendía las implicaciones del contenido generado por IA para la industria.

Mientras estaba en Toronto durante las vacaciones de invierno, Tian comenzó a jugar con un nuevo programa: un detector de ChatGPT. Se instaló en su café favorito, bebiendo té de jazmín, y se quedó despierto hasta tarde programando en su habitación. Su idea era simple. El software escanearía un texto en busca de dos factores: “perplejidad”, la aleatoriedad en la elección de palabras; y “explosividad”, la complejidad o variación de las oraciones. La escritura humana tiende a obtener una calificación más alta que la escritura de IA en ambos aspectos, lo que permitió a Tian adivinar cómo se había creado un texto. Tian llamó a la herramienta GPTZero: el “cero” señalaba la verdad, un retorno a lo básico, y lo puso en línea la noche del 2 de enero. Publicó un enlace en Twitter con una breve introducción. El objetivo era combatir el “incremento del plagio de IA”, escribió. “¿Los profesores de secundaria querrán que los estudiantes usen ChatGPT para escribir sus ensayos de historia? Probablemente no”. Luego se fue a dormir.

Tian se despertó al día siguiente con cientos de retweets y respuestas. Había tanto tráfico en el servidor que muchos usuarios no podían acceder a él. “Fue totalmente loco”, dice Tian. “Mi teléfono no paraba de sonar”. Un amigo lo felicitó por ganar internet. Los adolescentes en TikTok lo llamaron un soplón. “Gran parte del odio inicial fue como, ‘Este chico es un delator, no tiene vida, nunca ha tenido novia'”, dice Tian con una sonrisa. “Cosas típicas”. (Tian tiene novia). En cuestión de días, recibía llamadas de periodistas de todo el mundo, apareciendo eventualmente en programas como NPR, el South China Morning Post y Anderson Cooper 360. En una semana, su tuit original había alcanzado más de 7 millones de vistas.

GPTZero fue un nuevo giro en la narrativa mediática en torno a ChatGPT, que había inspirado una preocupación generalizada en la industria y una proliferación de titulares generados por IA. (En 2019, los investigadores habían creado un detector para el texto de GPT-2, pero el de Tian fue el primero en apuntar a ChatGPT). Los profesores agradecieron a Tian por su trabajo, agradecidos de poder finalmente confirmar sus sospechas sobre ensayos sospechosos de los estudiantes. ¿Había encontrado la humanidad su salvador frente a la invasión de los robots?

El programa de Tian fue una especie de pistoletazo de salida. Ahora la carrera estaba en marcha para crear la herramienta definitiva de detección de IA. En un mundo cada vez más saturado de contenido generado por IA, se pensaba que necesitaríamos distinguir lo hecho por máquinas de lo hecho por humanos. GPTZero representaba la promesa de que efectivamente será posible distinguir uno del otro y la convicción de que la diferencia importa. Durante su gira mediática, Tian, sonriente, sincero, el alumno modelo encarnado, se explayó sobre esta reconfortante visión de que, por sofisticadas que se vuelvan las herramientas generativas de IA, siempre podremos desenmascararlas. Hay algo irreducible en la escritura humana, dijo Tian: “Tiene un elemento que nunca se puede reducir a números”.

La vida en Internet siempre ha sido una batalla entre los falsificadores y los detectores de falsificaciones, con ambos bandos obteniendo beneficios de este enfrentamiento. Los primeros filtros de spam filtraban correos electrónicos en busca de palabras clave, bloqueando mensajes con frases como “¡GRATIS!” o “ser mayor de 21 años”, y eventualmente aprendieron a filtrar estilos completos de escritura. Los spammers respondieron rodeando sus mensajes con fragmentos de lenguaje similar al humano extraídos de libros antiguos y mezclados. (Este tipo de mensaje, llamado “litspam”, se convirtió en un género en sí mismo). Conforme los motores de búsqueda se volvieron más populares, los creadores que buscaban mejorar el ranking de sus páginas recurrieron a la “saturación de palabras clave” -repetir la misma palabra una y otra vez- para obtener prioridad. Los motores de búsqueda respondieron disminuyendo el ranking de esos sitios. Después de que Google introdujo su algoritmo de PageRank, que favorecía a los sitios web con muchos enlaces entrantes, los spammers crearon ecosistemas enteros de páginas que se apoyaban mutuamente.

A finales del milenio, surgió la herramienta captcha para distinguir humanos de bots en base a su capacidad para interpretar imágenes de texto distorsionado. Una vez que algunos bots pudieron manejar esto, captcha agregó otros métodos de detección que incluían analizar imágenes de motocicletas y trenes, así como detectar el movimiento del mouse y otros comportamientos del usuario. (En una prueba reciente, una versión temprana de GPT-4 demostró que sabía cómo contratar a una persona en Taskrabbit para completar un captcha en su nombre). El destino de empresas enteras ha dependido de la capacidad para detectar falsificaciones: Elon Musk, en un intento por salirse de su trato para comprar Twitter, citó un detector de bots para respaldar su argumento de que Twitter había tergiversado el número de bots en su sitio.

La IA generativa intensificó la situación. Mientras que los grandes modelos de lenguaje y los generadores de texto a imagen han estado evolucionando constantemente durante la última década, en 2022 hubo una explosión de herramientas amigables para el consumidor como ChatGPT y Dall-E. Los pesimistas argumentan que pronto podríamos ahogarnos en un tsunami de medios sintéticos. “En unos pocos años, la gran mayoría de las fotos, videos y textos que encontraremos en Internet podrían ser generados por IA”, advirtió el columnista de tecnología del New York Times, Kevin Roose, el año pasado. The Atlantic imaginó un inminente “textopocalipsis” mientras luchamos por filtrar el ruido generativo. Las campañas políticas están aprovechando las herramientas de IA para crear anuncios, mientras que Amazon está inundado de libros escritos por ChatGPT (muchos de ellos sobre IA). Navegar por las reseñas de productos ya se siente como la prueba de Turing más molesta del mundo. El siguiente paso es claro: si pensabas que los correos electrónicos de príncipes nigerianos eran malos, espera a ver a los chatbots de príncipes nigerianos.

Poco después de que Tian lanzara GPTZero, apareció una ola de productos similares. OpenAI lanzó su propia herramienta de detección a fines de enero, mientras que Turnitin, el gigante contra el plagio, presentó un clasificador en abril. Todos compartían una metodología básica, pero cada modelo estaba entrenado con diferentes conjuntos de datos. (Por ejemplo, Turnitin se centró en la escritura de estudiantes). Como resultado, la precisión variaba enormemente, desde el reclamo de OpenAI de un 26 por ciento de precisión para detectar texto escrito por IA, hasta la afirmación más optimista de una empresa llamada Winston AI de un 99.6 por ciento. Para mantenerse por delante de la competencia, Tian tendría que seguir mejorando GPTZero, idear su próximo producto y terminar la universidad al mismo tiempo.

De inmediato, Tian reclutó a su amigo de la escuela secundaria, Alex Cui, como CTO y, en las semanas siguientes, incorporó a un puñado de programadores de Princeton y Canadá. Luego, en primavera, incorporó a un trío de programadores de Uganda, a quienes había conocido cuatro años antes mientras trabajaba para una startup que capacitaba a ingenieros en África. (Siendo un ciudadano global, Tian nació en Tokio y vivió en Beijing hasta los 4 años antes de que sus padres, ambos ingenieros chinos, trasladaran a la familia a Ontario). Juntos, el equipo comenzó a trabajar en su próxima aplicación: una extensión de Chrome que escanearía el texto de una página web y determinaría si era generado por IA.

Otra amenaza para GPTZero era GPTZero. Casi de inmediato después de su lanzamiento, los escépticos en las redes sociales comenzaron a publicar ejemplos vergonzosos de la herramienta clasificando incorrectamente textos. Alguien señaló que marcaba partes de la Constitución de Estados Unidos como posiblemente escritas por IA. La burla dio paso a la indignación cuando comenzaron a inundar Reddit historias de estudiantes acusados injustamente de hacer trampa debido a GPTZero. En un momento dado, un padre de uno de estos estudiantes se comunicó con Soheil Feizi, profesor de ciencias de la computación en la Universidad de Maryland. “Estaban realmente furiosos”, dijo Feizi. El otoño pasado, antes del debut de GPTZero, Feizi y algunos otros colegas de Maryland comenzaron a elaborar un proyecto de investigación sobre los problemas con los detectores de IA, que sospechaba que podrían no ser confiables. Ahora, GPTZero y sus imitadores lo hicieron pensar que podrían causar más daño que bien.

Otro dolor de cabeza para Tian fue la cantidad de estudiantes astutos que encontraban formas de evadir el detector. Una persona en Twitter instruyó a los usuarios a insertar un espacio de ancho cero antes de cada “e” en un texto generado por ChatGPT. Un usuario de TikTok escribió un programa que eludía la detección reemplazando ciertas letras del inglés por sus equivalentes en cirílico. Otros comenzaron a pasar su texto de IA a través de QuillBot, una herramienta popular de parafraseo. Tian solucionó estos problemas, pero las soluciones alternativas seguían apareciendo. Era solo cuestión de tiempo antes de que alguien lanzara un producto rival: un anti-detector.

En marzo temprano, un estudiante de primer año de la Universidad de Stanford llamado Joseph Semrai y algunos amigos iban en coche por la Pacific Coast Highway hacia Los Ángeles cuando se quedaron fuera de su Zipcar en Ventura. Caminaron hasta un Starbucks cercano y esperaron asistencia en carretera. Pero a medida que la espera se prolongaba durante horas, Semrai y un amigo se preguntaron cómo compensar el tiempo perdido. Semrai tenía un ensayo que entregar la semana siguiente para una clase de redacción obligatoria para estudiantes de primer año. Era su tipo de tarea menos favorito: un ensayo formulado destinado a mostrar el razonamiento lógico. “Es un proceso bastante algorítmico”, dice Semrai.

ChatGPT era la solución obvia. Pero en ese momento, sus respuestas tendían a limitarse a unos pocos párrafos, por lo que generar un ensayo de longitud completa sería un proceso multietapa. Semrai quería crear una herramienta que pudiera escribir el trabajo en un solo impulso. También sabía que existía la posibilidad de que fuera detectado por GPTZero. Con el aliento de su amigo, Semrai sacó su portátil y creó un script que escribiría un ensayo basado en una consigna, pasaría el texto por GPTZero y luego ajustaría la redacción hasta que la IA ya no fuera detectable, utilizando básicamente GPTZero en su contra.

Unos días después, Semrai presentó su programa en el Día de Demostración de Amigos y Familiares, una especie de exposición para la comunidad de desarrolladores universitarios de Stanford. Parado frente a un salón lleno de compañeros de clase, le pidió a la audiencia un tema para el ensayo, alguien sugirió “alta cocina” en California, y lo escribió en el cuadro de consigna. Después de unos segundos, el programa produjo un ensayo de ocho párrafos, no original pero coherente, con obras citadas. “No digo que vaya a entregar este trabajo”, dijo Semrai, entre risas. “Pero ahí lo tienen. No sé, ahorra tiempo”. Llamó a la herramienta WorkNinja y la lanzó en la tienda de aplicaciones dos meses después. Con la ayuda de una campaña promocional con la influencer de la Generación Z David Dobrik y un sorteo de 10 Teslas para los usuarios que se registraran, recibió más de 350,000 descargas en la primera semana; según Semrai, las inscripciones se han reducido desde entonces a unos pocos cientos al día. (Semrai no quiso decir quién financió la campaña, solo que fue un importante inversor ángel de Silicon Valley).

La apariencia tranquila y serena de Semrai oculta una intensidad latente. Mientras que Tian salta y se emociona a lo largo del mundo, Semrai parece estar enfocado y serio. El joven de 19 años habla con seguridad y en tono propio de un emprendedor del Valle del Silicio que ve el mundo en términos de problemas por resolver, terminando casi cada frase con un “¿verdad?”. Al escucharlo hablar sobre fosos defensivos y la “curva en S” del crecimiento social, es fácil olvidar que no puede beber legalmente. Pero luego, ocasionalmente, dice algo que revela al universitario ingenuo, abierto al mundo y aún descubriendo su lugar en él. Como cuando él y un amigo caminaron por el muelle de Santa Mónica hasta las 3 a. m., “hablando sobre lo que valoramos”. Semrai piensa mucho en cómo encontrar equilibrio y felicidad. “Creo que, mientras soy joven, probablemente radica más en explorar el derivado”, dice, “perseguir los altos y bajos”.

Creciendo en Nueva York y luego en Florida, sus padres, un padre bombero de Yonkers y una madre ama de casa de China, le dieron manga ancha. “Durante mi infancia, me dejaron perseguir lo que realmente me emocionaba”, dijo. “La mejor manera de hacerlo era crear cosas en la computadora”. Cuando Semrai tenía 6 años, creó un complemento para asignar niveles de permiso en servidores de Minecraft, y a los 7 años escribió un programa que parcheaba Windows 7 para que se pudiera ejecutar Windows XP en él. “Me hace realmente feliz enviar cosas a las personas”, dice.

Su familia se mudó de Queens a Palm City cuando tenía 9 años, y Semrai notó la diferencia entre los sistemas de escuelas públicas. La alfabetización informática básica que daba por sentada en las escuelas de Nueva York escaseaba en Florida. Comenzó a escribir programas para ayudar a llenar las brechas en la educación, una trayectoria que le permite decir, a los 19 años, que ha estado “trabajando en tecnología educativa toda mi vida”. En el primer año de la escuela secundaria, creó una plataforma de aprendizaje en línea que ganó financiamiento para startups en una competencia local. Antes de la pandemia, había creado un sistema de pases digitales que se convirtió en la base para el rastreo de contactos y fue adoptado por 40 distritos escolares en el sureste.

Semrai es fundamentalmente un tecnóptimista. Dice que cree que debemos acelerar el desarrollo de la tecnología, incluida la inteligencia artificial general, porque en última instancia nos llevará hacia una sociedad de “post-escasez”, una perspectiva a veces descrita como “aceleracionismo efectivo”. (No confundir con el altruismo efectivo, que sostiene que debemos tomar acciones que maximicen los resultados “buenos”, sin importar cómo se definan). El argumento de Semrai a favor de WorkNinja se basa en su propia lógica aceleracionista. En su opinión, las herramientas de escritura de IA son buenas no porque ayuden a los niños a hacer trampa, sino porque obligarán a las escuelas a reformar sus planes de estudio. “Si puedes seguir una fórmula para crear un ensayo, probablemente no sea una buena tarea”, dice. Imagina un futuro en el que cada estudiante pueda obtener el tipo de educación que antes estaba reservado para los aristócratas, a través de tutorías personalizadas de IA. Cuando estaba aprendiendo a programar, Semrai dice que dependía en gran medida de videos de YouTube y foros en internet para responder sus preguntas. “Habría sido más fácil si hubiera tenido un tutor que me guiara”, dice. Ahora que los tutores de IA son reales, ¿por qué ponerles obstáculos?

Joseph Semrai, de 19 años, creador de WorkNinja, una herramienta que genera ensayos escritos por IA.

Ilustración: James Marshall; Fotografía: Charis Morgan

Recientemente utilicé WorkNinja para generar un puñado de ensayos, incluido uno sobre la teoría de la evolución de Darwin. La primera versión que me dio era torpe y repetitiva, pero utilizable, explorando las implicaciones de la teoría para la biología, la genética y la filosofía. GPTZero lo identificó como probablemente generado por IA.

Así que presioné el botón de reformulación de WorkNinja. El texto cambió ligeramente, reemplazando ciertas palabras con sinónimos. Después de tres reformulaciones, GPTZero finalmente le dio al texto su sello de humanidad. (Cuando probé el mismo texto nuevamente unas semanas después, la herramienta lo etiquetó como una mezcla de escritura humana y de IA). El problema era que muchas de las frases reformuladas ya no tenían sentido. Por ejemplo, la siguiente frase:

La teoría de la evolución de Darwin es la idea de que las especies vivas evolucionan con el tiempo debido a su interacción con su entorno.

se había transformado en:

La teoría de la evolución de Darwin es el pensamiento de que las especies vivas adquieren a lo largo del tiempo debido a su interacción con su entorno.

Al menos, cualquier estudiante que busque una forma rápida tendría que corregir su borrador de WorkNinja antes de enviarlo. Pero esto señala un problema real: si incluso este trabajo defectuoso en progreso puede eludir los detectores, ¿qué podría lograr un producto más sólido?

En marzo, Soheil Feizi de la Universidad de Maryland publicó sus hallazgos sobre el rendimiento de los detectores de IA. Argumentó que los problemas de precisión son inevitables, dado el funcionamiento de los detectores de texto de IA. A medida que aumenta la sensibilidad del instrumento para detectar más texto generado por IA, no se puede evitar aumentar el número de falsos positivos a lo que considera un nivel inaceptable. Hasta ahora, dice, es imposible obtener uno sin el otro. Y a medida que la distribución estadística de las palabras en el texto generado por IA se acerca a la de los humanos, es decir, a medida que se vuelve más convincente, dice que los detectores solo serán menos precisos. También descubrió que la reformulación desconcierta a los detectores de IA, haciendo que sus juicios sean “casi aleatorios”. “No creo que el futuro sea prometedor para estos detectores”, dice Feizi.

En cuanto a la “marca de agua”, él dice que tampoco ayuda. Bajo este enfoque, una herramienta de IA generativa como ChatGPT ajusta proactivamente los pesos estadísticos de ciertas palabras “token” intercambiables, por ejemplo, usando “start” en lugar de “begin” o “pick” en lugar de “choose”, de una manera que sería imperceptible para el lector pero fácilmente detectable por un algoritmo. Cualquier texto en el que aparezcan esas palabras con una frecuencia determinada podría ser marcado como generado por una herramienta en particular. Pero Feizi argumenta que con suficiente reformulación, una marca de agua “puede ser eliminada”.

Mientras tanto, él dice que los detectores están perjudicando a los estudiantes. Supongamos que una herramienta de detección tiene una tasa de falsos positivos del 1 por ciento, un supuesto optimista. Eso significa que en un aula de 100 estudiantes, a lo largo de 10 ensayos para llevar a casa, en promedio habrá 10 estudiantes acusados falsamente de hacer trampa. (Feizi dice que una tasa de uno en 1,000 sería aceptable). “Es ridículo pensar en usar herramientas así para controlar el uso de modelos de IA”, dice.

Tian dice que el objetivo de GPTZero no es atrapar a los tramposos, pero hasta ahora ha sido su principal caso de uso. (Los resultados de detección de GPTZero ahora vienen con una advertencia: “Estos resultados no deben usarse para castigar a los estudiantes”). En cuanto a la precisión, Tian dice que el nivel actual de GPTZero es del 96 por ciento cuando se entrena con su conjunto de datos más reciente. Otros detectores presumen de cifras más altas, pero Tian dice que esas afirmaciones son una señal de alerta, ya que significa que están “sobreajustando” sus datos de entrenamiento para que coincidan con las fortalezas de sus herramientas. “Tienes que poner a la IA y al humano en igualdad de condiciones”, dice.

Sorprendentemente, las imágenes, videos y fragmentos de audio generados por IA son mucho más fáciles de detectar, al menos por ahora, que el texto sintético. Reality Defender, una startup respaldada por Y Combinator, se lanzó en 2018 con un enfoque en la detección de imágenes y videos falsos y desde entonces se ha expandido a audio y texto. Intel lanzó una herramienta llamada FakeCatcher, que detecta videos deepfake analizando los patrones de flujo sanguíneo facial visibles solo para la cámara. Una empresa llamada Pindrop utiliza “biometría” de voz para detectar audio falsificado y autenticar a los llamantes en lugar de preguntas de seguridad.

El llamado irresistible de la IA dice: No tiene que ser así. Y cuando consideras los miles de millones de personas que están fuera del exclusivo club de los sufridores de escritores, empiezas a pensar: Tal vez no debería ser así.

El texto generado por IA es más difícil de detectar porque tiene relativamente pocos puntos de datos para analizar, lo que significa menos oportunidades para que la salida de IA se desvíe de la norma humana. Compáralo con FakeCatcher de Intel. Ilke Demir, científica investigadora de Intel que también ha trabajado en películas de Pixar, dice que sería extremadamente difícil crear un conjunto de datos lo suficientemente grande y detallado como para permitir que los deepfakers simulen firmas de flujo sanguíneo para engañar al detector. Cuando le pregunté si eventualmente se podría crear algo así, ella dijo que su equipo anticipa los avances futuros en la tecnología deepfake para estar por delante de ellos.

Ben Colman, CEO de Reality Defender, dice que las herramientas de detección de su compañía son ineludibles en parte porque son privadas. (Hasta ahora, los clientes de la compañía han sido principalmente gobiernos y grandes corporaciones). Con herramientas de acceso público como GPTZero, cualquiera puede pasar un texto por el detector y luego ajustarlo hasta que pase la prueba. Por otro lado, Reality Defender verifica a todas las personas e instituciones que utilizan la herramienta, según afirma Colman. También están atentos al uso sospechoso, por lo que si una cuenta en particular ejecutara pruebas en la misma imagen una y otra vez con el objetivo de evadir la detección, su sistema lo señalaría.

De todas formas, al igual que los cazadores de spam, los espías, los fabricantes de vacunas, los tramposos de ajedrez, los diseñadores de armas y toda la industria de la ciberseguridad, los detectores de IA en todos los medios tendrán que adaptarse constantemente a nuevas técnicas de evasión. Suponiendo, claro está, que la diferencia entre humano y máquina siga importando.

Cuanto más tiempo pasé hablando con Tian y Semrai y sus compañeros de clase, más me pregunté: ¿A alguno de estos jóvenes realmente le gusta escribir? “¡Sí, mucho!” dijo Tian, sonriendo aún más de lo habitual cuando le pregunté en mayo pasado en el campus de Princeton. “Es como un rompecabezas”. Le gusta descubrir cómo encajan las palabras y luego organizar las ideas para que fluyan. “Siento que es divertido hacerlo”. También le encanta el proceso de entrevista, ya que le brinda “una ventana a la vida de las personas, además de un espejo de cómo vives la tuya”.

En la escuela secundaria, Tian dice que escribir se sentía como una tarea. Atribuye a McPhee el haber avivado su amor y ampliado su gusto. En junio, me dijo emocionado que acababa de comprar una copia usada de The Writing Life de Annie Dillard.

Semrai también encontró aburridas y mecánicas las asignaciones de escritura en la escuela secundaria, más centradas en la síntesis de información que en crear algo nuevo. “Habría preferido tareas de formato abierto que hubieran despertado la creatividad”, dice. Pero puso esas habilidades de síntesis en práctica. En su segundo año, escribió un libro de instrucciones de 800 páginas llamado Build for Anything, destinado a “llevar a alguien desde no saber nada hasta saber un poco de casi todo” sobre desarrollo web. (Publicó el libro por su cuenta en Amazon en 2022 y vendió unas pocas cientos de copias). Semrai dijo que es el tipo de prosa en el que ChatGPT ahora se destaca. “No creo que el libro entre en la categoría de escritura significativa”, dice.

Después de casi 20 años de escribir palabras por dinero, puedo decir por experiencia que escribir es agotador. Pregunta a cualquier escritor profesional y te dirá que es lo peor, y no se vuelve más fácil con la práctica. Puedo atestiguar que el entusiasmo y la curiosidad necesarios para escanear perpetuamente el mundo, desenterrar hechos y exprimirlos en busca de significado pueden ser difíciles de mantener. Y eso es antes de tener en cuenta el estado de la industria: tarifas en disminución, páginas en reducción y una disminución de la atención (de los lectores y la mía). Continúo haciéndolo porque, para bien o para mal, ahora es lo que soy. No lo hago por placer, sino porque me parece significativo, al menos para mí.

Algunos escritores romantizan la lucha. McPhee describió una vez que se acostó en una mesa de picnic durante dos semanas, tratando de decidir cómo comenzar un artículo. “El artículo finalmente consistiría en unas cinco mil oraciones, pero durante esas dos semanas no pude escribir ni una sola”, escribió. Otra vez, a los 22 años, se ató a su silla de escritura con un cinturón de bata de baño. Según Thomas Mann, “Un escritor es alguien para quien escribir es más difícil que para otras personas”. “Buscas, te rompes el corazón, la espalda, el cerebro, y luego, solo entonces, te lo entregan”, escribe Annie Dillard en The Writing Life. Ella ofrece esto después de una larga comparación de la escritura con la lucha con un caimán.

La implicación es que cuanto más apretado se siente, más dulce es el jugo; que hay virtud en enfrentarse a la página en blanco, domarla, obligarla a ceder ante la prosa. Así es como suceden los mayores avances, nos decimos a nosotros mismos. El dolor vale la pena, porque así es como nacen las ideas.

El llamado seductor de la IA dice: No tiene que ser así. Y cuando consideras los miles de millones de personas que están fuera del exclusivo club de los escritores sufridores, empiezas a pensar: Tal vez no debería ser así.

May Habib pasó su infancia temprana en Líbano antes de mudarse a Canadá, donde aprendió inglés como segundo idioma. “Me pareció bastante injusto que tanto beneficio recayera en alguien realmente bueno leyendo y escribiendo”, dice. En 2020, fundó Writer, una de varias plataformas híbridas que tiene como objetivo no reemplazar la escritura humana, sino ayudar a las personas, y más precisamente a las marcas, a colaborar mejor con la IA.

Habib dice que cree que hay valor en la mirada fija a la página en blanco. Te ayuda a considerar y descartar ideas y te obliga a organizar tus pensamientos. “Hay tantos beneficios en pasar por el deambular, el rompecabezas mental, el querer matarte mirando el cursor”, dice. “Pero eso debe ser sopesado frente a la velocidad de los milisegundos”.

El propósito de Writer no es escribir por ti, dice, sino hacer que tu escritura sea más rápida, sólida y consistente. Eso podría significar sugerir ediciones en la prosa y estructura, o resaltar qué más se ha escrito sobre el tema y ofrecer contraargumentos. El objetivo, dice, es ayudar a los usuarios a enfocarse menos en la mecánica a nivel de oración y más en las ideas que están tratando de comunicar. Idealmente, este proceso produce un texto que es tan “humano” como si la persona lo hubiera escrito completamente por sí misma. “Si el detector puede detectarlo como escritura de IA, entonces has usado las herramientas de manera incorrecta”, dice.

La noción en blanco y negro de que la escritura es generada por humanos o por IA ya está desapareciendo, dice Ethan Mollick, profesor en la Escuela Wharton de la Universidad de Pensilvania. En cambio, estamos entrando en una era de lo que él llama “escritura centauro”. Claro, pedirle a ChatGPT que escriba un ensayo sobre la historia del Imperio Mongol produce resultados predeciblemente “propio de la IA”, dice. Pero “empieza a escribir, ‘Los detalles en el párrafo tres no están del todo correctos – agrega esta información y haz que el tono sea más como el de The New Yorker'”, dice. “Entonces se convierte en un trabajo híbrido y una escritura de mucha mejor calidad”.

Mollick, quien enseña emprendimiento en Wharton, no solo permite a sus estudiantes utilizar herramientas de IA, sino que lo requiere. “Ahora mi programa de estudios dice que tienes que hacer al menos una cosa imposible”, dice. Si un estudiante no puede programar, tal vez escriba un programa funcional. Si nunca ha hecho trabajo de diseño, puede crear un prototipo visual. “Cada papel que entregas debe ser criticado por al menos cuatro emprendedores famosos a los que simulas”, dice.

Según Mollick, los estudiantes aún tienen que dominar su área de estudio para obtener buenos resultados. El objetivo es hacer que piensen de manera crítica y creativa: “No me importa qué herramienta estén usando para hacerlo, siempre y cuando estén utilizando las herramientas de manera sofisticada y utilizando su mente”.

Mollick reconoce que ChatGPT no es tan bueno como los mejores escritores humanos. Pero puede ayudar al resto de las personas. “Si eras un escritor del cuartil inferior, ahora estás en el percentil 60 al 70”, dice. También libera a ciertos tipos de pensadores de la tiranía del proceso de escritura. “Equiparamos la habilidad de escribir con la inteligencia, pero eso no siempre es cierto”, dice. “De hecho, diría que a menudo no lo es”.

Edward Tian, de 23 años, creador de GPTZero, una herramienta que detecta la escritura generada por IA.

Ilustración: James Marshall; Fotografía: Lauryn Hill

En un día sin nubes en mayo, Tian y yo paseamos por el campus de Princeton; grandes carpas blancas de reunión parecían haber aterrizado como naves espaciales en los céspedes cuidados. A petición mía, Tian invitó a un puñado de compañeros de clase a unirse a nosotros para almorzar en un restaurante de Szechuan fuera del campus y hablar sobre la IA.

Mientras algunas escuelas se apresuraban a prohibir ChatGPT y los CEO de tecnología firmaban cartas advirtiendo sobre el desastre alimentado por la IA, los estudiantes estaban notablemente relajados sobre un futuro asistido por máquinas. (Princeton dejó que los profesores establecieran sus propias reglas básicas). Una de ellas había utilizado recientemente ChatGPT para escribir la sección de agradecimientos de su tesis. Otros, incluido Tian, confiaban en él para completar fragmentos de código mientras programaban. Lydia You, una estudiante de último año y especialización en ciencias de la computación que planea trabajar en periodismo, le había pedido a ChatGPT que escribiera un poema sobre perder cosas al estilo de Elizabeth Bishop, un intento de recrear su famoso poema “One Art”. (“El arte de perder no es difícil de dominar”). El resultado fue “muy similar” al poema original, dijo You, y descubrió que el chatbot hizo un trabajo aún mejor analizando el original y describiendo lo que lo hacía tan conmovedor. “Hemos visto mucho pánico sobre casi todo en nuestras vidas”, dijo You, citando TikTok, Twitter e Internet en sí. “Siento que las personas de nuestra generación son como, podemos descubrir por nosotros mismos cómo usar esto”.

Sophie Amiton, una estudiante de último año de ingeniería mecánica y aeroespacial, intervino: “Además, creo que nuestra generación es más perezosa en muchos aspectos”, dijo, mientras tú asentías en acuerdo. “Veo a mucha más gente que no quiere trabajos tradicionales ahora, no quiere un horario de nueve a cinco”.

“Están desilusionados”, dijiste. “Muchos trabajos son hojas de cálculo”.

“Creo que eso surgió a raíz de la Covid”, continuó Amiton. “La gente reevaluó cuál es el propósito del trabajo, e si puedes usar ChatGPT para facilitar tu vida y, por lo tanto, tener una mejor calidad de vida o equilibrio entre trabajo y vida personal, ¿por qué no usar el atajo?”

Liz, una reciente graduada de Princeton que prefería no usar su apellido, me envió un ensayo que había escrito con la ayuda de ChatGPT para una clase de política global. En lugar de simplemente pedirle que respondiera la pregunta del ensayo, ella introdujo un esquema con puntos de detalle y luego le pidió que escribiera el ensayo basándose en sus notas. Después de un extenso intercambio de ideas, pidiéndole que lo reescribiera y reorganizara, agregara matices aquí y contexto allá, finalmente tuvo un ensayo con el que se sentía cómoda para entregar. Obtuvo una A.

Copié y pegué su ensayo en GPTZero. El veredicto: “Es probable que su texto haya sido escrito completamente por un humano”.

A principios de mayo, solo unas semanas antes de que Tian y sus compañeros se pusieran sus togas de graduación negras, el equipo de GPTZero lanzó la extensión de Chrome que habían estado desarrollando y la llamaron Origen. Origen todavía es rudimentario: tienes que seleccionar el texto de una página web tú mismo y su precisión no es perfecta. Pero Tian espera que algún día la herramienta escanee automáticamente cada sitio web que veas, resaltando el contenido generado por IA, desde texto hasta imágenes y videos, así como cualquier cosa “tóxica” o dudosa desde el punto de vista factual. Él describe a Origen como un “parabrisas” para la autopista de la información, desviando material inútil o dañino y permitiéndonos ver claramente el camino.

Tian era inquebrantablemente optimista sobre la empresa; también se sentía afortunado de graduarse en un trabajo que realmente quería. Muchos de sus amigos habían ingresado a Princeton con planes de ser emprendedores, pero los recortes en el sector tecnológico habían cambiado sus planes.

“Hemos visto mucho pánico sobre casi todo en nuestras vidas. Siento que las personas de nuestra generación pensamos: podemos descubrir por nosotros mismos cómo usar esto”.

Como estudiante de segundo año con tres años más por delante en Stanford, Semrai abordó el verano con una actitud más despreocupada. En una calurosa tarde de jueves de junio, en la azotea del Pier 17 cerca de Wall Street, Semrai, vistiendo una camisa con patrón verde y zapatillas blancas de Nike, me habló animadamente sobre el futuro, o al menos las próximas semanas. Su verano todavía estaba tomando forma. (“Estoy probando mi tesis rápidamente”). Pero por ahora estaba en Nueva York, quedándose con amigos mientras trabajaba en un par de proyectos impulsados por IA. La noche anterior, había dormido en un espacio de coworking en SoHo. Ahora estaba parado en la sección VIP sombreada de un evento organizado por Techstars New York City, un acelerador de startups, mientras cientos de asistentes sudorosos se movían en el resplandor.

Cerca, el alcalde de la ciudad de Nueva York, Eric Adams, estaba en el escenario con gafas de sol y un traje completo, elogiando las glorias de la codificación. “Soy un aficionado a la tecnología”, dijo Adams, antes de animar a los invitados a buscar colaboradores diversos y usar “código fuente” para solucionar problemas sociales como el cáncer y la violencia armada. Luego instó a los solteros en la multitud a encontrar a alguien especial y salir con ellos.

Semrai estaba adoptando un enfoque de “probar y ver qué funciona” para construir. Además de WorkNinja, estaba desarrollando una plataforma de chatbots basada en celebridades reales y entrenada con grandes cantidades de sus datos, con los que los fanáticos podrían interactuar. También estaba prototipando una pulsera que registraría todo lo que decimos y hacemos, a la que Semrai llama una “memoria perfecta”, y ofrecería consejos en tiempo real para facilitar las conversaciones. (Un grupo de compañeros de clase en Stanford creó recientemente un producto relacionado llamado RizzGPT, un dispositivo ocular que ayuda a su usuario a coquetear).

Esperaba que el verano diera lugar a una explosión de aplicaciones de IA, a medida que los jóvenes programadores se mezclan y se cruzan. (Eric Adams estaría de acuerdo). “Creo que se formará una constelación de startups, y dentro de cinco años podremos trazar conexiones entre las personas, el comienzo de un ecosistema”, dijo.

Para el verano, Tian tenía un equipo de 12 empleados y había recaudado $3.5 millones de un puñado de capitalistas de riesgo, incluidos Jack Altman (hermano del CEO de OpenAI, Sam Altman) y Emad Mostaque de Stability AI. Pero a lo largo de nuestras conversaciones, noté que su enfoque de GPTZero/Origen estaba cambiando ligeramente. Ahora, decía, la detección de IA sería solo una parte de la herramienta de demostración de humanidad. Tan importante como eso sería hacer hincapié en la procedencia, o “credenciales del contenido”. La idea es adjuntar una etiqueta criptográfica a un contenido que verifique que fue creado por un humano, según se determine por su proceso de creación, una especie de captcha para archivos digitales. Adobe Photoshop ya adjunta una etiqueta a las fotos que utilizan su nueva herramienta de generación de IA, Firefly. Cualquier persona que vea una imagen puede hacer clic derecho y ver quién la hizo, dónde y cómo. Tian dice que quiere hacer lo mismo para el texto y que ha estado hablando con la Content Authenticity Initiative, un consorcio dedicado a crear un estándar de procedencia en los medios, así como con Microsoft para trabajar juntos.

Se podría interpretar su énfasis en la procedencia como un reconocimiento tácito de que la detección por sí sola no es suficiente. (OpenAI cerró su clasificador de texto en julio “debido a su baja tasa de precisión”). También anticipa un posible cambio de paradigma en cómo nos relacionamos con los medios digitales. Todo el esfuerzo de detección sugiere que los humanos dejan una firma inconfundible en un texto, algo perceptible, de la misma manera que un detector de mentiras presume que la deshonestidad deja una huella objetiva. La procedencia se basa en algo más parecido a una etiqueta de “Hecho en América”. Si no fuera por la etiqueta, no sabríamos la diferencia. Es una distinción sutil pero significativa: la escritura humana puede no ser mejor, ni más creativa, ni siquiera más original. Pero será humana, lo cual importará a otros humanos.

En junio, el equipo de Tian dio otro paso en la dirección de la practicidad. Me dijo que estaban construyendo una nueva plataforma de escritura llamada HumanPrint, que ayudaría a los usuarios a mejorar su texto escrito por IA y les permitiría compartir “pruebas de autenticidad”. No generando texto, sin embargo. En cambio, utilizaría la tecnología de GPTZero para resaltar secciones de texto que no eran suficientemente humanas y pedirle al usuario que lo reescribiera con sus propias palabras, una especie de inversión de los asistentes de escritura AI actuales. “Entonces los profesores pueden especificar, está bien, tal vez más del 50 por ciento del ensayo aún debe estar escrito con sus propias palabras”, dijo. Cuando le pregunté si esto era un cambio para la compañía, Tian argumentó que era “una extensión natural de la detección”. “Siempre fue una visión de ser el estándar de oro del uso responsable de la IA”, dijo Tian, “y eso aún está presente”. Sin embargo, la implicación es clara: no se puede detener la escritura de IA; la única opción es trabajar con ella.

Cuando Tian probó por primera vez GPTZero, escaneó un ensayo de 2015 de New Yorker escrito por McPhee llamado “Marco de referencia”. En él, McPhee reflexiona sobre las alegrías y los riesgos de hacer referencias culturales en la escritura. “Mencionar a Beyoncé y todos saben quién es. Mencionar a Veronica Lake y bien podrías estar en Quetico-Superior”, escribe de manera juguetona. Enumera una lista de adjetivos que ha utilizado para describir bigotes, incluyendo “sincero”, “directo”, “giroscópico”, “ingenuo”, “analgésico”, “calmante”, “odobenino” y “tetragramatónico”. Concluye con una anécdota sobre su batalla con un editor para incluir una referencia a un término británico oscuro utilizado por turistas de clase alta en la India durante el Raj. (Él ganó.) Es un clásico de McPhee: preciso como un bisturí, de buen corazón aunque un poco satisfecho de sí mismo, digresivo con deleite, indulgente hasta que llega al punto justo. GPTZero determinó que el artículo era “el más humano en todas las métricas”, dijo Tian. Llamé a McPhee para preguntarle qué pensaba que significaba que su escritura fuera especialmente humana.

“Realmente no tengo una idea muy clara”, me dijo McPhee por teléfono. “Pero si tuviera que adivinar, diría que mis piezas llegan a la ciencia, o la agricultura, o la aviación, o cualquier tema, a través de las personas. Siempre hay una figura central de la que aprendo”. De hecho, McPhee escribe a través de los ojos de expertos. El lector no solo obtiene algún conocimiento esotérico sobre geología o física de partículas o naranjas, sino también una sensación de la persona que estudia el tema, así como de McPhee estudiando a la persona.

McPhee, ahora con 92 años, dijo que no le preocupa que la IA reemplace a los escritores humanos. “Soy extremadamente escéptico y no me preocupa en lo más mínimo”, dijo. “No creo que haya un Mark Twain de la inteligencia artificial”.

Pero, pregunté, ¿qué pasa si dentro de años, alguien diseña un McPheeBot3000 entrenado con la escritura de McPhee, y luego le pide que produzca un libro sobre un tema nuevo? Es posible que no pueda vadear arroyos con activistas ambientales o ir a pescar con ictiólogos, pero ¿no podría capturar la voz, el estilo y la visión del mundo de McPhee? Tian argumentó que las máquinas solo pueden imitar, mientras que McPhee nunca se repite a sí mismo: “Lo que es único en McPhee es que crea cosas que McPhee de hace un día no habría creado”.

Le pregunté a McPhee sobre el hipotético McPheeBot3000. (O, si Semrai tiene su camino, no tan hipotético). “Si esto alguna vez sucede, en un futuro en el que ya no esté aquí”, dijo, “espero que mis hijas aparezcan con un abogado”.


Este artículo aparece en la edición de octubre de 2023. Suscríbete ahora.

Háganos saber lo que piensa sobre este artículo. Envíe una carta al editor a [email protected].