Exclusivo
Tecnología

El equipo de Microsoft trabaja en su propia IA creativa para acelerar la generación de contenido visual.EFE / MAST IRHAM

Microsoft presenta MAI-Image-1, su nuevo modelo para crear fotos con IA

La nueva IA de Microsoft destaca por realismo, velocidad y versatilidad en generación de imágenes

Microsoft ha dado un paso importante en el terreno de la inteligencia artificial con el lanzamiento de MAI-Image-1, su primer modelo de generación de imágenes desarrollado completamente de manera interna. Este anuncio refleja la intención de la compañía de reducir su dependencia de terceros, como OpenAI, con quien mantiene una relación cada vez más competitiva pese a ser su principal inversionista.

(Lea esta nota también: 3I/ATLAS: la polémica entre Avi Loeb y la NASA por las fotos del objeto interestelar)

El modelo está diseñado para crear imágenes fotorrealistas a partir de descripciones en texto. Según la empresa, MAI-Image-1 combina rapidez y precisión, permitiendo a los usuarios transformar ideas en imágenes con mayor velocidad que otros sistemas más grandes y lentos. Esto facilita iteraciones rápidas y la integración de los resultados en otras herramientas de diseño y edición.

Cómo funciona MAI-Image-1

MAI-Image-1 utiliza un enfoque de conversión de texto a imagen, donde los usuarios escriben descripciones que el modelo traduce en representaciones visuales detalladas. Microsoft asegura que el entrenamiento del sistema incluyó una selección cuidadosa de datos y evaluaciones centradas en tareas prácticas del mundo creativo, tomando en cuenta la retroalimentación de profesionales del sector.

El sistema está optimizado para generar imágenes con un manejo avanzado de la iluminación, reflejos y profundidad visual, buscando resultados más naturales y diversos. Además, incorpora mecanismos de seguridad y uso responsable, evitando producciones repetitivas o genéricas, y ofreciendo flexibilidad estilística que permite adaptarse a distintos tipos de contenido visual.

Posicionamiento y validación de MAI-Image-1

Para medir su rendimiento, Microsoft ha puesto a prueba el modelo en LMArena, una plataforma donde las imágenes generadas por distintos sistemas se comparan mediante votaciones humanas anónimas. Hasta ahora, MAI-Image-1 se ubica entre los 10 mejores modelos de texto a imagen, lo que confirma su capacidad competitiva frente a referentes del sector como Midjourney o GPT-Image.

La validación en LMArena se realiza mostrando pares de imágenes a los usuarios, quienes eligen cuál consideran más convincente. Esta evaluación colectiva permite construir un ranking dinámico que refleja la percepción de calidad visual más que métricas técnicas internas.

Integración y futuro del modelo

Microsoft planea integrar MAI-Image-1 en sus principales productos, incluyendo Copilot y Bing Image Creator, ampliando así las capacidades creativas de sus plataformas. La compañía también lo ha incorporado en funciones como Copilot Audio Expressions, donde el arte generado acompaña narraciones de texto a voz, creando experiencias multimedia más completas.

Este lanzamiento forma parte de una estrategia más amplia de Microsoft para desarrollar modelos propios de inteligencia artificial, junto con otros recientes como MAI-Voice-1, para síntesis de voz, y MAI-1-preview, orientado a texto.

Con MAI-Image-1, la empresa busca controlar la cadena completa de creación de contenido visual, desde la generación hasta la integración en aplicaciones, asegurando rapidez, calidad y diversidad estilística.

¿Quieres acceder a todo el contenido de calidad sin límites? ¡SUSCRÍBETE AQUÍ!