MiniMax se presentó hoy Música 1.5 (conocido en algunos canales de la compañía como el modelo musical Conch), una importante actualización de su suite de audio generativo que, según la compañía, amplía la duración de la generación y mejora el realismo vocal, a la vez que ofrece un control preciso, similar al del lenguaje de programación, para los creadores. Este lanzamiento posiciona a MiniMax para impulsar la música con IA más allá de los clips cortos, hacia flujos de trabajo completos de producción musical.
Capacidades clave
- Generación de longitud completa (hasta ~4 minutos): Diseñado para producir una canción terminada que pueda usarse directamente en muchos contextos creativos.
- Voz natural: Acompañamiento simultáneo y generación de voz cantada con un timbre y expresividad más claros que los lanzamientos anteriores.
- Control detallado: Los usuarios pueden especificar o refinar estilo, emoción, escena e incluso una estructura a nivel de segmento (por ejemplo, escribir un verso con esta letra y un estribillo con ese estado de ánimo).
- Amplio soporte de géneros e instrumentos: Desde pop, rock y jazz hasta instrumentos clásicos y étnicos, MiniMax dice que el modelo incluye cobertura para timbres específicos e instrumentos no occidentales.
- Abarcando múltiples idiomas y culturas, puede generar música de diversos estilos culturales.
- Estructura clara: el modelo reproduce música de acuerdo con una estructura de canción típica, como Introducción – Verso – Coro – Puente – Outro, evitando secciones repetitivas o melodías monótonas.
- API abierta para que los desarrolladores accedan y utilicen directamente
Tras estos avances se encuentra la experiencia acumulada de MiniMax en procesamiento multimodal, que incluye texto, voz e imagen. Music 1.5 aprovecha el poder de los modelos de texto para proporcionar una comprensión y un control más profundos de las descripciones textuales. Esto no solo permite un control exhaustivo del estilo de la canción, el tono emocional y los escenarios aplicables, sino que también permite un control granular de las características vocales, generando una tonalidad vocal con diversas características.
MiniMax Música 1.5 Se puede usar ampliamente en la creación musical, bandas sonoras para cine y televisión, efectos de sonido para videojuegos, publicidad y marketing, educación y formación, y escenarios corporativos. No solo ayuda a músicos y productores a generar rápidamente demos completos con voces, sino que también proporciona bandas sonoras emocionalmente y contextualizadas para cine, televisión, videojuegos y anuncios. Además, apoya a plataformas educativas y creadores con prácticas estilizadas y personalización de contenido, ofreciendo soluciones musicales eficientes y económicas para eventos corporativos, comunicación de marca y experiencias interactivas.
El lanzamiento de Music 1.5 no solo reduce la barrera de entrada para la creación musical, sino que también regresa a la esencia de la audición, permitiendo que la “buena” música fluya naturalmente.
Primeros Pasos
CometAPI es una plataforma API unificada que integra más de 500 modelos de IA de proveedores líderes, como la serie GPT de OpenAI, Gemini de Google, Claude de Anthropic, Midjourney, Suno y más, en una única interfaz intuitiva para desarrolladores. Al ofrecer autenticación, formato de solicitudes y gestión de respuestas consistentes, CometAPI simplifica drásticamente la integración de las capacidades de IA en sus aplicaciones. Ya sea que esté desarrollando chatbots, generadores de imágenes, compositores musicales o canales de análisis basados en datos, CometAPI le permite iterar más rápido, controlar costos y mantenerse independiente del proveedor, todo mientras aprovecha los últimos avances del ecosistema de IA.
La última integración Minimax Music 1.5 pronto aparecerá en CometAPI, ¡así que estad atentos! Mientras finalizamos la carga del modelo Minimax Music 1.5, explora nuestros otros modelos de música como Música Suno en la página de Modelos o pruébalos en el Patio de juegos de IA.
