
Microsoft anunció dos nuevos modelos de inteligencia artificial que buscan competir con OpenAI, Google y otras empresas del sector. Después de meses de rumores, la compañía presentó los primeros resultados de su división de IA, liderada por el cofundador de DeepMind, Mustafá Sulaymán. Los modelos están diseñados para distintos segmentos, y uno de ellos fue desarrollado utilizando el mismo proceso que emplean DeepSeek y otros modelos de origen chino.
Según una publicación en su sitio web de IA, Microsoft presentó MAI-Voice-1 y MAI-1-preview. MAI-Voice-1 es un modelo de generación de voz “altamente expresivo y natural” capaz de generar un minuto de audio en menos de un segundo. La empresa afirma que esta IA está optimizada para funcionar en una sola GPU y es altamente eficiente, por lo que ya se ha integrado en los resúmenes de noticias de Copilot Daily y Podcasts.
MAI-Voice-1 proporciona audio de alta fidelidad con entonación natural y expresiva. Microsoft indica que esta IA puede ser utilizada para narrar historias, generar meditaciones guiadas y desarrollar un asistente virtual con capacidad de conversación en tiempo real.
Para demostrar su funcionamiento, Microsoft lanzó “Expresiones de audio de Copilot” en Copilot Labs. Esta herramienta permite generar audio a partir de un guion y ofrece a los usuarios la posibilidad de modificar los estilos de narración. La nueva función incluye un Modo emotivo que permite ajustar el tono y ritmo del narrador, así como asignar una voz diferente, y un Modo historia con narración expresiva.
MAI-1-preview, la IA de Microsoft que reducirá la dependencia de OpenAI
Mientras MAI-Voice-1 se centra en la velocidad de inferencia, su modelo complementario, MAI-1-preview, fue desarrollado para competir con otras IA más robustas. MAI-1-preview es el primer modelo basado en texto de Microsoft que se utilizará para potenciar las próximas versiones de Copilot. La compañía informó que este modelo se entrenó con aproximadamente 15.000 GPU NVIDIA H-100 utilizando la arquitectura Mixture-of-Experts (MoE).
El término “Mezcla de Expertos” se refiere a un nuevo enfoque de aprendizaje automático que se utiliza en modelos como DeepSeek o Qwen3. Esta arquitectura divide el modelo en componentes especializados y activa solo las partes necesarias para tareas específicas, optimizando así los recursos.
En una entrevista con Semafor, Mustafá Sulaymán mencionó que se aprovecharon técnicas de la comunidad de código abierto para mejorar los modelos con recursos mínimos. “MAI-1-preview está diseñado para ofrecer capacidades poderosas a los consumidores que buscan beneficiarse de modelos que se especializan en seguir instrucciones y proporcionar respuestas útiles a consultas diarias”, afirmó.
El nuevo modelo no reemplazará a GPT-5 en Copilot. Microsoft anunció que integrará MAI-1-preview en las próximas semanas y lo utilizará para ejecutar tareas específicas. La compañía evaluará el rendimiento y utilizará los comentarios de los usuarios para mejorar su IA en futuras versiones. El modelo también estará disponible en LMArena y a través de una API para desarrolladores.
A pesar de que uno de sus modelos está diseñado para ser expresivo y natural, el responsable de Microsoft AI dejó claro que eliminarán cualquier característica que haga parecer a la IA como si tuviera sentimientos y objetivos. Recientemente, Mustafá Sulaymán publicó un artículo sobre los peligros de construir sistemas que se asemejen a seres humanos.
“Hace unos años, hablar de IA consciente habría parecido una locura. Hoy en día, se percibe como algo cada vez más urgente”, comentó. “Debemos construir una IA para las personas; no hacerla una persona digital”.
Fuente original: ver aquí
