Skip to content

Estudio: IA en buscadores prioriza fuentes “menos populares

octubre 28, 2025

Un nuevo estudio revela que los motores de búsqueda impulsados por inteligencia artificial (IA) tienden a citar fuentes web menos populares en comparación con los resultados de búsqueda tradicionales. Esta diferencia en la selección de fuentes puede tener implicaciones significativas para la forma en que los usuarios acceden a la información en línea.

Metodología del Estudio

En el estudio preimpreso “Characterizing Web Search in The Age of Generative AI”, investigadores de la Universidad Ruhr de Bochum, Alemania, y el Instituto Max Planck para Sistemas de Software, compararon los resultados de búsqueda tradicionales de Google con sus AI Overviews y Gemini-2.5-Flash. También analizaron el modo de búsqueda web de GPT-4o y la herramienta separada “GPT-4o with Search Tool”, que recurre a la búsqueda en la web solo cuando el LLM (Modelo de Lenguaje Grande) decide que necesita información que no se encuentra en sus datos pre-entrenados.

Los investigadores recopilaron consultas de prueba de diversas fuentes, incluyendo preguntas específicas enviadas a ChatGPT en el conjunto de datos WildChat, temas políticos generales listados en AllSides y productos incluidos en la lista de los 100 productos más buscados en Amazon.

Estudio: IA en buscadores prioriza fuentes
*Imagen referencial generada por IA.

Resultados Clave

El análisis reveló que las fuentes citadas en los resultados de las herramientas de búsqueda generativa tendían a ser de sitios menos populares que los que aparecían entre los 10 primeros de una búsqueda tradicional, según la medición del rastreador de dominios Tranco. Las fuentes citadas por los motores de IA tenían más probabilidades que las enlazadas en las búsquedas tradicionales de Google de quedar fuera de los 1.000 y 1.000.000 dominios principales rastreados por Tranco. Gemini search, en particular, mostró una tendencia a citar dominios impopulares, con la fuente mediana quedando fuera del top 1.000 de Tranco en todos los resultados.

Además, el estudio encontró que un porcentaje significativo de las fuentes citadas por los motores de búsqueda impulsados por IA no aparecían en los primeros resultados de las búsquedas orgánicas de Google. Por ejemplo, el 53% de las fuentes citadas por las AI Overviews de Google no aparecían entre los 10 primeros enlaces de Google para la misma consulta, y el 40% de esas fuentes ni siquiera figuraban entre los 100 primeros enlaces de Google.

¿Son “peores” los resultados generados por IA?

Es importante destacar que estas diferencias no implican necesariamente que los resultados generados por IA sean “peores”. Los investigadores observaron que las búsquedas basadas en GPT eran más propensas a citar fuentes como entidades corporativas y enciclopedias, y casi nunca citaban sitios web de redes sociales.

Una herramienta de análisis basada en LLM encontró que los resultados de búsqueda impulsados por IA también tendían a cubrir un número similar de “conceptos” identificables que los 10 enlaces principales tradicionales, lo que sugiere un nivel similar de detalle, diversidad y novedad en los resultados. Sin embargo, los investigadores también encontraron que “los motores generativos tienden a comprimir la información, omitiendo a veces aspectos secundarios o ambiguos que la búsqueda tradicional conserva”. Esto fue especialmente cierto para los términos de búsqueda más ambiguos (como los nombres compartidos por diferentes personas), para los cuales “los resultados de búsqueda orgánica proporcionan una mejor cobertura”, según los investigadores.

Ventajas y Limitaciones de la IA en la Búsqueda

Una de las ventajas de los motores de búsqueda de IA es su capacidad para integrar “conocimiento interno” pre-entrenado con datos extraídos de sitios web citados. Esto fue particularmente evidente en GPT-4o con Search Tool, que a menudo no citaba ninguna fuente web y simplemente proporcionaba una respuesta directa basada en su entrenamiento.

Sin embargo, esta dependencia de los datos pre-entrenados puede convertirse en una limitación al buscar información oportuna. Para los términos de búsqueda extraídos de la lista de Google de Trending Queries, los investigadores encontraron que GPT-4o con Search Tool a menudo respondía con mensajes del tipo “podría proporcionar más información” en lugar de buscar realmente en la web información actualizada.

Conclusión

Si bien los investigadores no determinaron si los motores de búsqueda basados en IA eran en general “mejores” o “peores” que los enlaces de los motores de búsqueda tradicionales, sí instaron a futuras investigaciones sobre “nuevos métodos de evaluación que consideren conjuntamente la diversidad de fuentes, la cobertura conceptual y el comportamiento de síntesis en los sistemas de búsqueda generativa”.

Fuente original: ver aquí