Ampliando ChatGPT ¿Pueden los complementos de chatbot de IA realmente cambiar el juego?

Ampliando ChatGPT ¿Los complementos de chatbot de IA pueden cambiar el juego?

Los complementos han sido desde hace mucho tiempo una parte fundamental de los sistemas de software complejos. Ya en la década de 1980, fundé una empresa llamada Hyperpress que proporcionaba complementos para HyperCard de Apple (piensa en ello como una web antes de que existiera la Web… o la conectividad). Mis complementos añadían capacidades a HyperCard que no formaban parte de la versión original.

Hoy en día, los complementos mejoran productos populares como Photoshop y WordPress. WordPress ofrece aproximadamente 60,000 complementos que modifican sus capacidades.

En los dos principales sitios web que opero, utilizo 49 complementos separados (que añaden aproximadamente 49 nuevas funciones) en un sitio, y 25 complementos (que añaden aproximadamente 25 nuevas funciones) en el otro sitio. Ninguno de estos sitios sería los sofisticados sitios de comercio electrónico profesionales que son sin la amplia gama de complementos que añaden características y valor.

¿Qué son los complementos?

Fundamentalmente, los complementos son fragmentos de código separados que interactúan con la plataforma de software principal. Lo hacen a través de una API (interfaz de programación de aplicaciones). Todas las plataformas que admiten complementos proporcionan APIs que permiten a los programadores externos conectarse a la funcionalidad de las plataformas.

A menudo, la amplitud y confiabilidad de la API determinan la resistencia y flexibilidad de la plataforma en general, especialmente cuando los usuarios dependen de muchos complementos para ampliar las capacidades de la plataforma que admite complementos que están utilizando.

Hechos correctamente, los complementos benefician a tres grupos: el proveedor de la plataforma (es decir, Adobe para Photoshop, la comunidad de WordPress de código abierto y OpenAI para ChatGPT), el desarrollador del complemento y los usuarios de la plataforma que obtienen nuevas capacidades.

También: Pedí a ChatGPT que escribiera un complemento de WordPress que necesitaba. Lo hizo en menos de 5 minutos

A menudo, los proveedores de plataformas deciden competir con los desarrolladores. Si ven que un complemento es particularmente popular, a veces eligen incluir esa funcionalidad en el producto principal. Cambian las APIs. A veces, si ofrecen un mercado (como una tienda de aplicaciones, pero para complementos), son selectivos sobre a quién permitir en el mercado y a quién promocionar.

Pero cuando la interacción entre el proveedor de la plataforma y el desarrollador del complemento funciona, es mágico presenciarlo. La plataforma original puede llevarse a lugares que nadie predijo, proporcionando capacidades que de otra manera no serían posibles.

También: Los mejores complementos de ChatGPT (y cómo aprovecharlos al máximo)

Se han anunciado capacidades de complementos para Bard de Google, Bing AI de Microsoft y ChatGPT. Sin embargo, hasta ahora, solo ChatGPT ofrece una amplia variedad de complementos que realmente se pueden utilizar.

¿Cómo funcionan actualmente los complementos en ChatGPT?

Los complementos para ChatGPT solo están disponibles para los clientes de pago de ChatGPT Plus. Es un servicio de $20 al mes que proporciona acceso al conjunto de datos GPT-4, complementos y un complemento especial llamado Análisis Avanzado de Datos (más sobre eso más adelante).

Por esos $20 al mes, puedes usar un producto muy beta y muy incompleto. Aún así, es sorprendente, pero también muy molesto. Estás limitado a 25 consultas en tres horas, por lo que si estás tratando de hacer un trabajo, es posible que te quedes sin consultas justo en medio de tu tiempo de trabajo. Sí, hablo desde una experiencia muy frustrante. También necesitarás activarlos en Configuración.

Ahora que tienes los complementos habilitados, prepárate para impresionarte.

Complementos que marcan la diferencia

Experimenté con muchos complementos. Debido a que solo puedes usar tres complementos a la vez, realmente necesitas elegir una biblioteca principal de complementos que uses regularmente. Aquí está la lista que creé y que impulsó los ejemplos que te voy a mostrar:

  • Historias: Esto genera un libro de historias a partir de una indicación. Solo lo usé una vez (porque no tengo hijos), pero fue tan impresionante que es algo que debes ver.
  • MixerBox WebSearchG: Esto pone toda la web actual a disposición de ChatGPT, y lo hace bastante bien. Esto realmente amplía el valor de ChatGPT.
  • Noticias del mundo: Esto escanea fuentes de noticias y proporciona resúmenes de noticias actualizados.
  • Pregúntale a tu PDF: Puedes alimentar a ChatGPT un PDF e interactuar con los datos en el documento PDF.
  • Análisis Avanzado de Datos: Este es un complemento especial proporcionado por OpenAI. Si lo ejecutas, no puedes ejecutar ninguno de los otros complementos. Te permite usar código para comunicarte con ChatGPT, pero también interpreta solicitudes complejas y amplía sustancialmente las consultas que puedes hacer a ChatGPT.

Ten en cuenta que no estoy proporcionando URL para cada uno de estos complementos individuales. La Tienda de complementos de ChatGPT no ofrece URLs únicas para cada complemento. Pero son bastante fáciles de encontrar. Solo ve a la Tienda de complementos de ChatGPT y busca por sus títulos. Si quieres saber cómo habilitar complementos y acceder a la Tienda de complementos, Steven Vaughan-Nichols de ENBLE tiene un excelente tutorial.

El complemento que es la razón por la que los escritores están en huelga

Comencemos con Stories. En un artículo anterior, te mostré cómo logré que ChatGPT escribiera una breve historia de Star Trek (y cómo en su mayoría tuvo éxito). Stories toma esa idea y la hace realidad.

Dentro de ChatGPT, puedes darle a Stories una indicación que describa la historia que deseas que se cuente. Esto es lo que le di de comer:

Usando historias, cuenta la historia de un grupo de amigos que viven en una nave espacial (tres son humanos, uno es un robot). Cuenta su aventura viajando a un planeta poblado por dinosaurios con conciencia y donde la creatividad realizada por los dinosaurios con conciencia es ilegal, y todas las historias, entretenimiento, música, etc., son compuestas por sistemas AI generativos.

Luego, Stories genera un libro completo de historias basado en esta premisa. Si bien los gráficos generados eran un poco débiles (podrían beneficiarse de una tecnología de calidad Midjourney), la producción general es bastante buena. Le di al complemento una premisa que involucraba algunas decisiones morales, y la IA no solo creó una pequeña historia buena, sino también una que se sostenía.

Pero Stories va más allá. Puedes leer la historia en línea en formato digital. O puedes ir al sitio de Stories y pedir una copia en tapa dura. Incluso puedes publicar la historia en Amazon.

Puedes ver cómo este tipo de cosas genera miedo en los corazones de los creativos profesionales, especialmente aquellos que están actualmente en huelga. En menos de cinco minutos, tenía un libro de historias completamente utilizable. Escrito e ilustrado de manera tradicional, este libro de 50 páginas (con un párrafo en cada página) podría haber llevado semanas o meses.

Acabo de dar un sorbo de café, inventé una premisa vagamente basada en un tema típico de Star Trek y se la di a la IA.

Cuando ChatGPT puede leer la web

Como todos sabemos, la base de conocimientos de ChatGPT termina en 2021. Pero con el complemento MixerBox WebSearchG, obtenemos una idea de lo que sucederá cuando una IA pueda leer la web. Esto también produjo esa sensación de “woah” que a veces siento cuando sé que estoy tocando el futuro.

El 10 de julio de 2023, publiqué un artículo en ENBLE sobre los desafíos que estaba enfrentando con mi plan empresarial de almacenamiento en la nube de Google. En ese artículo, acuñé el término “infraquake” y lo mencioné en los dos párrafos finales del artículo.

Luego, el 11 de julio, le hice esta pregunta a ChatGPT:

¿Cómo define Gewirtz un “infraquake”?

No le dije a ChatGPT qué Gewirtz, ni le dije que se había publicado un artículo en ENBLE. Y sin embargo, dio una descripción muy clara (y, me atrevo a decir, precisa) de la intención detrás de la recién acuñada palabra “infraquake”.

Claramente, ChatGPT ahora puede acceder a datos actuales y procesarlos para darles sentido utilizando el complemento.

También: ¿Cómo funciona ChatGPT en realidad?

También puedes ver cómo la capacidad de ChatGPT para retener contexto se mezcla con la capacidad del complemento de acceder a la web en este próximo ejemplo. Le pregunté:

Háblame sobre el perro de David Gewirtz, Pixel

No solo extrajo la información, sino que también mostró una imagen del pequeño y vinculó a un artículo donde escribí sobre cómo elegí su nombre.

Comprender los eventos actuales

Mientras trabajaba en este informe especial, encontré tres “aplicaciones imprescindibles” que voy a usar regularmente como parte de mi trabajo. Discutamos primero la primera: crear informes que expliquen las noticias actuales con información completa de fondo.

En mi trabajo, sigo muchas noticias. A menudo, los clientes me piden que proporcione una perspectiva sobre noticias tecnológicas, tendencias tecnológicas y algunos problemas geopolíticos. Eso significa que paso algunas horas todos los días leyendo, asegurándome de tener un buen entendimiento de lo que está sucediendo.

Pero no hay forma de que pueda mantenerme al día con todo, y realmente no puedo dedicar mucho tiempo a los temas que no están en mi “especialidad”. Aun así, me gustaría tener una comprensión sólida de los problemas.

También: ¿Qué es la IA generativa? Aquí tienes todo lo que necesitas saber

Un ejemplo de esto es la guerra entre Ucrania y Rusia. Aunque he escrito sobre cómo los ataques afectan a los desarrolladores ucranianos e incluso he cubierto problemas de seguridad anteriores en Ucrania que se remontan casi una década, no he sido “plenamente informado” sobre el tema de la solicitud de Ucrania para ser miembro de la OTAN.

Podría haber buscado en una serie de artículos de noticias e investigado, pero realmente no tengo tiempo para dedicarle. En su lugar, le pedí a ChatGPT, MixerBox WebSearchG y World News que me prepararan un informe completo. Hice dos preguntas:

Eres un asesor de políticas de Estados Unidos y debes informar a un CEO sobre la situación de la OTAN. Te han pedido que expliques por qué el presidente Biden dice que Ucrania no está lista para unirse a la OTAN. Utiliza World News y MixerBox WebSearchG para proporcionar un informe claro sobre ambos lados del argumento, de manera que tu cliente tenga una comprensión profunda y actualizada de los problemas, las complejidades y las ramificaciones políticas. Relaciona tu respuesta con el clima político de Estados Unidos también.

y

Utilizando los mismos complementos, ¿existe una postura opuesta por parte del Partido Republicano sobre la membresía de Ucrania en la OTAN?

A partir de estas dos preguntas, la IA me brindó un informe completo sobre la cuestión de la membresía en la OTAN, los problemas fundamentales y políticos relacionados con la membresía, y la posición de ambos partidos en relación con este asunto.

Mi esposa se suscribe a un servicio llamado Blinkist. La compañía describe su servicio como “Blinkist ofrece las ideas clave de los principales libros de no ficción en un formato adaptado para dispositivos móviles”. Es básicamente una versión audible o legible de los resúmenes de Cliff para libros de no ficción populares en la actualidad, y le permite ponerse al día sobre los temas que le interesan en aproximadamente media hora.

Al combinar ChatGPT con MixerBox WebSearchG y World News, puedo obtener esencialmente un resumen de las “ideas clave” de Blinkist sobre cualquier tema de actualidad mundial en desarrollo. Esto es muy poderoso, pero al igual que con toda la cobertura de prensa, es importante tener en cuenta que puede haber sesgos, omisiones e inexactitudes en lo que la IA te presenta.

Utilizando PDF como material fuente para el análisis

Recientemente tuve un proyecto de análisis en el que tuve que revisar documentos técnicos muy largos y áridos para tratar de entender las relaciones entre algunas tecnologías clave. Utilizando el complemento AskYourPDF, alimenté esos PDF a ChatGPT y luego hice preguntas relacionadas con el contenido de los PDF.

Fue extraordinario. Pude pedirle a ChatGPT que analizara varios conceptos contenidos en los PDF. Incluso pude hacer que dibujara una tabla comparando elementos discutidos en los PDF, pero que no se habían comparado directamente entre sí en los documentos fuente.

Nunca usaría ChatGPT como sustituto de leer toda la información de fondo sobre un proyecto en el que me encargaron investigar. Pero gran parte del análisis que hago para mi propio proceso de aprendizaje requiere un trabajo clerical muy tedioso para construir tablas y gráficos y aumentar mi comprensión de las relaciones dentro de los documentos.

También lo utilicé para examinar algunos contratos. Le proporcioné un documento de contrato que teníamos con un proveedor de servicios y le pedí que me mostrara cómo diferían las limitaciones entre las partes, algo que normalmente lleva mucho tiempo extraer y determinar. Aquí está el encabezado que utilicé:

Crea una tabla comparando las limitaciones, enumerando cada limitación mencionada. Muestra solo donde las limitaciones difieren entre las partes, resume cada limitación diferente en 8 palabras o menos.

Y aquí está la tabla que obtuve:

Por supuesto, sin lugar a dudas, los resultados de ChatGPT no se pueden considerar completamente precisos. Pero una revisión rápida definitivamente puede ahorrar tiempo.

También: 5 formas de explorar el uso de la IA generativa en el trabajo

Utilizando ChatGPT y AskYourPDF, las tareas de investigación clerical que normalmente me llevarían medio día o más se redujeron a cuestión de minutos. Eso es una aplicación excepcional.

Realizando análisis de datos a gran escala

Por último, quiero explorar un complemento para ChatGPT de OpenAI que funciona de forma independiente. Se llama Análisis Avanzado de Datos y hace mucho más que interpretar código. Permite cargar datos en él, que ChatGPT puede analizar posteriormente.

ADVERTENCIA: No utilices esta función por primera vez si tienes algo más que hacer en el día. Te absorberá. Es más perturbador para la productividad que los videos de gatitos y cachorros.

Pregúntame cómo lo sé. Quiero decir, es difícil creer que algo tan divertido pueda ser legal de verdad.

Esta herramienta te permite importar archivos de datos (Excel, CSV, etc.) en ChatGPT. Luego puede realizar análisis e incluso generar gráficos básicos. Es peligrosamente adictivo. Horas después de comenzar, me encontré descargando conjunto de datos tras conjunto de datos de data.gov y riendo maniáticamente sobre el poder que tenía en mis manos. No fue una imagen bonita.

También: La fiebre del oro de la IA hace que la higiene básica de seguridad de datos sea crítica

Creo que, en última instancia, esto es por qué ChatGPT Plus te limita a 25 consultas cada tres horas. No es para reducir la carga en su infraestructura. Es para nuestro propio bien. Yo realmente lo necesitaba. Probablemente no hubiera comido en todo el día si no me hubieran obligado a alejarme de la computadora por el límite de consultas.

Te ahorraré más visiones perturbadoras de análisis dentro de La Mente de David y, en su lugar, te mostraré una aplicación simple: de mis contactos de correo electrónico, con qué grandes empresas de relaciones públicas me correspondo regularmente y qué grandes empresas de tecnología tienen más representación. Para hacer esto, exporté mis contactos de Google Contacts.

Usando los campos relacionados con el correo electrónico, enumera los 20 principales nombres de dominio representados

De los 20 principales nombres de dominio, ¿cuáles están relacionados con empresas de relaciones públicas?

Luego, hice que la IA enumerara y dibujara un gráfico circular de las empresas de tecnología con las que tenía más contacto. Esto es lo que pregunté:

Al mirar el conjunto de datos, crea un gráfico circular que muestre la representación relativa de las grandes empresas de tecnología multimillonarias

Y esto es lo que obtuve.

El formato del gráfico circular no es ideal, pero la información está ahí. Y, nuevamente, estamos hablando de minutos en lugar de horas.

Pero… todavía estamos en los primeros días

Hay complementos disponibles, pero son muy nuevos. Algunos, como los que demostré anteriormente, tienen grandes ventajas. Pero debido a que son tan nuevos, también tienen una serie de desventajas y molestias:

  • Hay casi 700 complementos en la tienda de complementos de ChatGPT. La mayoría no están seleccionados (casi cualquier cosa vale).
  • Aunque puedes buscar por palabra clave, de lo contrario no están categorizados. Complementos como Pluginpedia y PlugFinder afirman ayudar con eso, pero no son muy confiables.
  • Muchos complementos son… ¿cuál es la palabra? Meh. Algunos no hacen nada más que acceder al sitio web del proveedor. Por ejemplo, hay un complemento para obtener cupones de descuento. ¿Cómo es esto mejor que RetailMeNot?
  • Muchos complementos parecen ser ejercicios de branding o relaciones públicas para establecerse temprano en un nuevo mercado. Por ejemplo, hay un complemento de “clon de IA” de un CEO específico de una pequeña startup de Silicon Valley. Supuestamente, puedes preguntarle todo lo que siempre quisiste saber sobre él. Así que, sí. Esto no es exactamente algo que la mayoría de nosotros probablemente usemos.
  • Muchos complementos no funcionan o no hacen mucho. Intenté que el complemento de entrega de comida local me dijera dónde podía encontrar cenas de carne en mi ciudad, y me recomendó Subway. Sí, tienen un sándwich de carne, pero podría haber obtenido mejores resultados en Yelp. También encontré un montón de complementos que simplemente se colgaban sin dar resultados.
  • Solo puedes ejecutar tres complementos a la vez, y si quieres cambiar el conjunto de complementos, debes iniciar una nueva sesión de chat en ChatGPT, perdiendo todo el historial de discusión actual. Esta es una gran limitación. Pero incluso con solo tres complementos, viste cómo logré que la interfaz del complemento hiciera cosas mágicas.

Según Pam Baker, autora de “ChatGPT para Principiantes”, “Es más difícil ver la magia ahora, dado los límites de 3 complementos / 25 consultas y el valor cuestionable de algunos de los complementos actuales. Pero los límites son necesarios para que OpenAI pueda gestionar mejor la estabilidad del modelo y fortalecer las barreras de protección a medida que asimila más capacidades”.

También: Microsoft adopta el estándar de complemento ChatGPT de OpenAI

Para ser justos, todavía estamos en una etapa muy temprana. Es por eso que no estoy compartiendo los nombres de los complementos que no cumplieron. Existe una buena posibilidad de que mejoren mucho con el tiempo.

Entonces, ¿los complementos realmente cambian el juego?

Sí. Lo hacen. Realmente lo hacen. Estamos en las etapas iniciales aquí, donde tuve que tomarme un tiempo extra para elegir cuatro que creo que usaré todo el tiempo (además de Stories, que muestra un nivel adicional de potencial de IA generativa).

Encuentro que si configuro mi conjunto principal de tres complementos como una combinación de MixerBox WebSearch G, World News y AskYouTPDF, puedo hacer mucho. Puedo cambiar a Advanced Data Analysis si quiero hacer un proyecto de análisis de datos más profundo. Ten en cuenta que he encontrado que WebSearch G es algo poco confiable. Si tienes problemas, desactívalo y prueba el complemento WebPilot en su lugar.

A medida que ChatGPT crece en su capacidad para manejar complementos, a medida que la búsqueda y curación de complementos mejora, a medida que podemos usar cada vez más complementos al mismo tiempo, está bastante claro que el tipo de chatbot que acabamos de conocer en 2023 se enfrenta a una serie de futuras actualizaciones, brindándonos cada vez más ayuda con nuestras tareas y proyectos.

También: GPT-3.5 vs GPT-4: ¿Vale la pena la suscripción a ChatGPT Plus?

La autora de ChatGPT for Dummies, Baker, comparte su visión del futuro de los complementos. Ella dice: “Los complementos agregan capacidades que eventualmente nos permitirán modificar ChatGPT sobre la marcha”. Su premisa es que ChatGPT (y, por extensión, otros LLM) podrán desarrollar sus propias capacidades.

Ella le dijo a ENBLE: “En un instante, ChatGPT podrá convertirse en la herramienta perfecta para cualquier tarea. Eventualmente, ChatGPT podrá determinar y seleccionar automáticamente los complementos que necesita para responder a cada indicación. Cuando no exista un complemento que necesite, lo creará sobre la marcha y asimilará sin problemas la nueva capacidad”.

En este punto, no puedo decir si estamos creando Skynet o los Borg. De cualquier manera, disfruta de las capacidades adicionales que proporcionan los complementos… mientras puedas…

La resistencia es inútil.


Puedes seguir las actualizaciones de mis proyectos diarios en las redes sociales. Asegúrate de suscribirte a mi boletín semanal de actualizaciones en Substack y seguirme en Twitter en @DavidGewirtz, en Facebook en Facebook.com/DavidGewirtz, en Instagram en Instagram.com/DavidGewirtz y en YouTube en YouTube.com/DavidGewirtzTV.