¿Sabe cómo se le habla a una máquina?

El arte de dar instrucciones a las plataformas de Inteligencia Artificial generativa se abre paso, gracias al auge de ChatGPT, que no sirve para nada si no sabes preguntarle correctamente.

Por Álvaro Montes

La ingeniería de prompts es el oficio de más reciente aparición en la historia. Debe tener menos de dos años, pero apenas se hizo conocida ampliamente hace unas cuantas semanas, después de que irrumpiera en nuestras vidas ChatGPT, que entró en operación pública a finales de noviembre pasado. ¿Sabe qué es un prompt? En el mundo de la informática es una instrucción que se escribe mediante el uso del teclado, para solicitarle al computador que realice una tarea específica. Línea de comandos, si se quiere ser rigurosamente técnico, o simplemente indicaciones, como las que se le escriben a ChatGPT o a Midjourney, tan moda por estos días.

Resulta que, si le pides a estas populares plataformas de Inteligencia Artificial lo que deseas, así no más, como se te ocurre y brota de tu cabeza, el resultado será tan pobre como hemos visto: frases repetitivas y generalidades sin sustancia, como los textos que suele arrojar ChatGPT; o retratos absurdos y rostros desfigurados, como la mayoría de imágenes que salen de Midjourney. Pero si sabes pedirle, el resultado será mejor. Esa es la máxima que inspiró el nacimiento del novel oficio de ingeniería de prompts.

…buena parte de la decepción que producen las plataformas de IA generativas entre usuarios no expertos se debe a los pobres resultados que arroja. No es lo mismo indicarle a Midjourney que cree la imagen de un niño con un perro en un bosque, que escribirle: “Foto en estilo realista tomada con lente Canon en dslr 64 megapixeles enfoque nítido, de un niño tomándose una selfie junto a un perro pastor alemánEn enero pasado, una empresa de tecnología llamada Anthropic publicó en Linkdin una convocatoria de empleo que llamó poderosamente la atención: necesitaban con urgencia un “prompt engineer”, con un salario entre 175.000 y 335.000 dólares al año, más otros beneficios. No existe formalmente tal título profesional, pero un ingeniero de prompts es un experto en hablarle a las plataformas de IA, alguien suficientemente familiarizado con los grandes modelos de lenguaje (LLM, como se conoce a la Inteligencia Articial que puede comunicarse con los humanos de manera más o menos natural), con habilidades básicas de programación y que pueda escribir un poco en lenguaje Python, quien se encargaría de preparar las solicitudes con las que sea posible entrenar y sacar el máximo provecho a Claude, la nueva plataforma de IA que la empresa está desarrollando, y que será competencia en breve de ChatGPT. Anthropic es un startup con sede en San Francisco, fundada por ex empleados de OpenAI (la creadora de ChatGPT) y acaba de recibir como socio a Alphabeth (Google), que invirtió 400 millones de dólares para hacerse con el 10 por ciento de la propiedad.

Para aplicar al puesto, los aspirantes debían demostrar que han logrado obtener comportamientos complejos – es decir, respuestas interesantes y ricas – a partir de una serie de solicitudes bien elaboradas. Los grandes modelos de lenguaje son un nuevo tipo de inteligencia, y el arte de entrenarlos para que arrojen mejores resultados aún está en pañales, como reconoce Anthropic. La ingeniería de prompts es un híbrido entre programar, entrenar al algoritmo y documentar el método para lograr los mejores resultados. El especialista en este campo conoce – por ensayo y error – cuáles son las palabras claves que debe emplear para que el modelo del lenguaje construya el producto más cercano a lo imaginado.

Parece sencillo, pero no lo es. De hecho, buena parte de la decepción que producen las plataformas de IA generativas entre usuarios no expertos se debe a los pobres resultados que arroja. No es lo mismo indicarle a Midjourney que cree la imagen de un niño con un perro en un bosque, que escribirle: “Foto en estilo realista tomada con lente Canon en dslr 64 megapixeles enfoque nítido, de un niño tomándose una selfie junto a un perro pastor alemán. Ambos sonríen y el sol cae perpendicular desde el lado izquierdo, en el fondo un bosque húmedo tropical, a la media tarde. La diferencia de resultados hará que usted mejore su opinión sobre la Inteligencia Artificial generativa. Si formula la solicitud en inglés el resultado será más preciso que en cualquier otro idioma, y puede adicionar indicaciones de formato que Midjourney entenderá perfectamente, como “–ar 16:9”, que arrojará la ilustración en formato apaisado (ar significa “aspect ratio”, o relación de aspecto de una imagen).

Pedir una imagen resulta demasiado general para que cualquiera, sea humano o máquina, lo entienda. Es mejor indicar si se desea un dibujo al carboncillo, una acuarela o una fotografía. Indicar el tipo de iluminación es esencial, y ser lo más preciso posible es una buena recomendación. Las posibilidades de indicar detalles son prácticamente infinitas. En iluminación, por ejemplo, se pueden incluir indicaciones muy específicas como suave, neón, soleado, de frente, por encima, lateral, bajo el agua, pastel, oscura, nebulosa. La lista es inagotable.

Algunos comparan el advenimiento del nuevo ingeniero de prompts con el surgimiento, un par de décadas atrás, del community manager, alguien especializado en sacarle el jugo a las redes sociales, que eran la novedad tecnológica entonces. Y empiezan a aparecer los servicios de pago para asesorar a empresas que quieren obtener lo mejor de las plataformas de moda. En su web de capacitación, el experto español en marketing digital Joan Boluda, recomienda cobrar entre 25 y 30 euros por cada prompt desarrollado para una empresa que lo necesita.

Herramientas gratuitas para hacer mejores prompts

Su juventud no impide a la ingeniería de prompts disponer ya de literatura abundante para entrenarse en el oficio de dar el input correcto a las plataformas inteligentes. Hay un libro titulado Dall-E 2 prompts book, que ofrece las pistas y trucos claves para lograr lo mejor de esta popular herramienta de generación de imágenes. También hay una profusa lista de publicaciones similares para Stable Diffusion, e incluso existe un motor de búsqueda de reciente aparición, denominado Lexica, especializado en encontrar imágenes de Stable Diffusion. Por ejemplo, si usted introduce la palabra “Colombia” en este buscador, verá todas las imágenes sobre nuestro país (personajes, paisajes, abstracciones) creadas en Stable Diffusion, y cualquiera puede copiar el prompt utilizado para crear cada imagen y realizar variaciones sobre él.

¿Le parece insuficiente? Bueno, promtomania.com ofrece gratis un servicio de construcción de prompts para casi cualquier plataforma popular de IA generativa. Es un prompt builder libre, que le ayuda crear las indicaciones más adecuadas para Midjourney, DreamStudio, Stable Diffusion, CD Spark, NightCafe, wombo.art, Craiyon y otras.

Googleando se puede encontrar interesantes artículos para hacer buenos prompts en Midjourney, y en learnprompting.org encuentra un curso gratuito de cómo hablar con una AI para obtener lo que quiera. El curso contiene capítulos para programadores, entendidos en asuntos de código, pero también incluye secciones prácticas para cualquier ciudadano, repletas de ejemplos y guías.

Prompts para  ChatGPT

Las plataformas para crear imágenes llevan un poco más de tiempo en funcionamiento, por lo que hay un mayor conocimiento general sobre buenos prompts. No así para el caso de las plataformas que generan texto, como ChatGPT, Writesonic o Copy.ai, que el público está apenas descubriendo. En este ámbito importa indicar claramente el tema, el tipo de recurso que se desea generar (un eBook, el copy para un anuncio publicitario, o responder un correo electrónico), además, desde luego, del estilo, el tono, y los temas muy claros que deben ser tratados en el resultado.

Este es un ejemplo real de una petición para la plataforma Chatsonic:

Prompt: “Escribe un libro electrónico de 4500 palabras sobre “La mejor estrategia de venta digital”, en estilo formal, que ayude a los emprendedores digitales a conseguir más clientes y a ganar más dinero en 30 días. Al final, pide a los lectores que se registren en emprendiendoendigital.com”. Desde luego, el resultado no será un texto original ni un aporte novedoso al campo del mercadeo, pero servirá como lectura para iniciados, que recopila ideas tomadas de Internet y será completamente funcional.

Los colombianos Felipe Guarín y Laura Gutiérrez, creadores del estudio de diseño Whatever Works recién lanzaron wawo.ai, un servicio basado en ingeniería de prompts con el que quieren lograr que ChatGPT sea realmente útil para el mercado latinoamericano. Aprovechando la posibilidad de ser aliado comercial de OpenAI (la empresa creadora de ChatGPT), desarrollaron una plataforma que adecúa las prestaciones de esta Inteligencia Artificial a diferentes necesidades. Por ejemplo, para las personas que trabajan en marketing, hay una sección en la que cualquiera puede pedir textos publicitarios concretos. El usuario que se registra en wawo.ai solo escribe lo que quiere, sin preocuparse por la estructura de la solicitud, y wawo.ai se encarga de la ingeniería de prompts.

ChatGPT no está hoy tuneada para sacar los mejores resultados y nosotros nos encargamos de ese ajuste fino”, explica Felipe Guarín, de wawo.ai. “Nosotros nos especializamos en las necesidades de los colombianos y de los latinoamericanos, porque siempre habrá problemas muy locales y queremos estar allí para adaptar la IA a tales necesidades”, agrega.

Hay quienes ponen en duda el futuro de lo que hoy se conoce como ingeniería de prompts. Podría durar poco, en la medida en que los LLM evolucionen y se aproximen mejor al lenguaje natural de las personas, y aparezcan servicios automáticos que faciliten al usuario el aprovechamiento de las inteligencias artificiales de moda. De momento, hay gente haciendo buenos negocios gracias a su habilidad con este oficio.

«

»

¿Qué piensas?

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *