ChatGPT y el control de puntuación: ¿Un pequeño paso hacia la AGI? |

El uso excesivo de la raya (em dash) se ha convertido en una característica distintiva de los textos generados por inteligencia artificial (IA) en los últimos años. Esta marca de puntuación aparece con frecuencia en los resultados de ChatGPT y otros chatbots de IA, a veces hasta el punto en que los lectores creen poder identificar la escritura de IA solo por su uso excesivo, aunque también los humanos pueden abusar de ella.

El jueves por la noche, el CEO de OpenAI, Sam Altman, anunció en X que ChatGPT ha comenzado a seguir instrucciones personalizadas para evitar el uso de rayas. “Pequeña pero feliz victoria: si le dices a ChatGPT que no use rayas en tus instrucciones personalizadas, ¡finalmente hace lo que se supone que debe hacer!”, escribió.

La publicación, que se produjo dos días después del lanzamiento del nuevo modelo de IA GPT-5.1 de OpenAI, recibió reacciones mixtas de los usuarios que han tenido dificultades durante años para lograr que el chatbot siga preferencias de formato específicas. Y esta “pequeña victoria” plantea una pregunta muy importante: si la empresa de IA más valiosa del mundo ha tenido problemas para controlar algo tan simple como el uso de la puntuación después de años de intentarlo, tal vez lo que la gente llama inteligencia artificial general (AGI) esté más lejos de lo que algunos en la industria afirman.

*Imagen referencial generada por IA.

Captura de pantalla de la publicación de Sam Altman sobre las rayas en X. Crédito: X

“El hecho de que hayan pasado 3 años desde que se lanzó ChatGPT por primera vez, y que solo ahora hayan logrado que obedezca este simple requisito, dice mucho sobre el poco control que tienen sobre él, y su comprensión de su funcionamiento interno”, escribió un usuario de X en una respuesta. “No es una buena señal para el futuro”.

Mientras que a Altman le gusta hablar públicamente sobre la AGI (una tecnología hipotética equivalente a los humanos en la capacidad de aprendizaje general), la superinteligencia (un concepto nebuloso para la IA que está mucho más allá de la inteligencia humana) y la “inteligencia mágica en el cielo” (su término para la computación en la nube de IA?) mientras recauda fondos para OpenAI, está claro que todavía no tenemos una inteligencia artificial confiable aquí hoy en la Tierra.

¿Qué es una raya y por qué importa?

A diferencia de un guion, que es una marca de puntuación corta que se utiliza para conectar palabras o partes de palabras, que vive con una tecla dedicada en su teclado (-), una raya es un guion largo denotado por un carácter especial (—) que los escritores utilizan para separar información entre paréntesis, indicar un cambio repentino de pensamiento o introducir un resumen o explicación.

Incluso antes de la era de los modelos de lenguaje de IA, algunos escritores frecuentemente lamentaban el uso excesivo de la raya en la escritura moderna. En un artículo de Slate de 2011, la escritora Noreen Malone argumentó que los escritores usaban la raya “en lugar de elaborar oraciones correctamente” y que la dependencia excesiva de ella “desalienta la escritura verdaderamente eficiente”. Varios hilos de Reddit publicados antes del lanzamiento de ChatGPT presentaban a escritores ya sea luchando por la etiqueta del uso adecuado de la raya o admitiendo su uso frecuente como un placer culpable.

En 2021, un escritor en el subreddit r/FanFiction escribió: “Durante mucho tiempo, he sido adicto a las rayas. Se abren camino en cada párrafo que escribo. Me encanta la línea recta nítida que me da la excusa para meter detalles o pensamientos en un párrafo por lo demás ordenado. Incluso después de volver a escribir después de como dos años de bloqueo del escritor, inmediatamente meto tantas rayas como puedo”.

Debido a la tendencia de los chatbots de IA a usarlos en exceso, las herramientas de detección y los lectores humanos han aprendido a detectar el uso de la raya como un patrón, creando un problema para el pequeño subconjunto de escritores que naturalmente favorecen la marca de puntuación en su trabajo. Como resultado, algunos periodistas se quejan de que la IA está “matando” la raya.

¿Por qué los modelos de IA aman las rayas?

Nadie sabe con precisión por qué los LLM tienden a usar rayas en exceso. Hemos visto una amplia gama de especulaciones en línea que intentan explicar el fenómeno, desde notar que las rayas eran más populares en los libros del siglo XIX utilizados como datos de entrenamiento (según un estudio de 2018, el uso de guiones en el idioma inglés alcanzó su punto máximo alrededor de 1860 antes de disminuir a mediados del siglo XX) o tal vez los modelos de IA tomaron prestado el hábito de la conversión automática de caracteres de raya en el sitio de blogs Medium.

Una cosa que sabemos con certeza es que los LLM tienden a generar patrones que se ven con frecuencia en sus datos de entrenamiento (alimentados durante el proceso de entrenamiento inicial) y de un proceso de aprendizaje de refuerzo posterior que a menudo se basa en las preferencias humanas. Como resultado, los modelos de lenguaje de IA le alimentan una especie de estilo promedio “suavizado” de lo que sea que les pida, moderado por lo que estén condicionados a producir a través de la retroalimentación del usuario.

Entonces, la explicación más plausible sigue siendo que las solicitudes de escritura de estilo profesional de un modelo de IA entrenado en una gran cantidad de ejemplos de Internet se inclinarán fuertemente hacia el estilo predominante en los datos de entrenamiento, donde las rayas aparecen con frecuencia en la escritura formal, los artículos de noticias y el contenido editorial. También es posible

Fuente original: ver aquí