El documental ‘El dilema de las redes sociales’ plantea que si no se está pagando por un producto, el usuario se convierte en el producto. Esta afirmación se aplica a muchas aplicaciones y servicios que no requieren pago monetario, sino que utilizan otros tipos de compensación. Redes sociales, navegadores y aplicaciones de GPS son ejemplos de plataformas que recopilan información personal y datos de navegación para generar ingresos. Las aplicaciones de inteligencia artificial no son la excepción, ya que compiten por atraer usuarios y obtener datos para mejorar sus chatbots.
Mejorar la experiencia
La política de privacidad de ChatGPT indica que al compartir contenido, se ayuda a mejorar la precisión de sus modelos. Similarmente, Gemini presenta políticas que reflejan esta necesidad de datos. Anthropic, que anteriormente mantenía privadas las conversaciones con Claude, anunció cambios en su política, lo que demuestra la presión por obtener datos. La información personal y las interacciones con los usuarios son esenciales para el entrenamiento y mejora de los modelos, aunque se puede optar por desactivar esta opción, que está activada por defecto.
Escasez de datos
La inteligencia artificial requiere enormes cantidades de datos para su entrenamiento. Los primeros modelos de lenguaje utilizaron contenido variado, incluyendo material protegido por derechos de autor. Sin embargo, la disponibilidad de datos no es infinita. En 2021, ya se mencionaba un problema de escasez, y Elon Musk afirmó que la IA había consumido todo el conocimiento humano, lo que podría estar ralentizando su avance.
Soluciones
Ante la escasez de datos, las empresas de IA han buscado nuevas fuentes. OpenAI transcribió un millón de horas de contenido de YouTube para entrenar a GPT-4, mientras que Google utiliza cualquier información disponible en internet. Musk sugiere que el futuro radica en datos sintéticos generados por la IA. Además, las conversaciones de los usuarios son ahora una fuente valiosa de datos, ya que plataformas como ChatGPT cuentan con 800 millones de usuarios, lo que representa un gran potencial para el entrenamiento.
Regalando IA
Las conversaciones con ChatGPT son útiles, pero el acceso a datos de grupos específicos es aún más valioso. Empresas de IA están formando alianzas con organizaciones para obtener datos que no se pueden conseguir mediante scraping. OpenAI ha colaborado con Shopee en Asia, ofreciendo su plan Plus a usuarios VIP, mientras que Google y Perplexity también ofrecen sus servicios de forma gratuita a ciertos grupos, lo que les permite recolectar datos más específicos.
El caso chino
China demuestra cómo el acceso a datos específicos puede facilitar el desarrollo de soluciones efectivas. Las empresas farmacéuticas que utilizan IA tienen acceso a datos del sistema nacional de salud, que cubre a más de 600 millones de personas, lo que les otorga una ventaja competitiva y ha llevado a acuerdos millonarios con grandes farmacéuticas.
Preocupación
Expertos como Sameer Patil, director del Observer Research Foundation, abogan por una regulación más clara, especialmente en sectores sensibles como la salud y las finanzas. Patil destaca la necesidad de que los conjuntos de datos sean anónimos y no personalizados para proteger a los usuarios.
Fuente original: ver aquí