MiniMax hôm nay đã ra mắt âm nhạc 1.5 (được một số kênh của công ty gọi là mô hình âm nhạc Conch), một bản nâng cấp lớn cho bộ công cụ âm thanh tạo hình, được công ty cho biết sẽ kéo dài thời lượng tạo âm thanh và cải thiện độ chân thực của giọng hát, đồng thời bổ sung khả năng kiểm soát phong cách ngôn ngữ chi tiết cho người sáng tạo. Bản phát hành này định vị MiniMax trong việc đưa âm nhạc AI vượt ra ngoài các clip ngắn, hướng tới quy trình sản xuất bài hát hoàn chỉnh.
Các khả năng chính
- Tạo video đầy đủ (tối đa ~4 phút): Được thiết kế để tạo ra một bài hát hoàn chỉnh có thể sử dụng trực tiếp trong nhiều bối cảnh sáng tạo.
- Giọng hát tự nhiên: Đồng thời đệm nhạc và tạo giọng hát với âm sắc rõ ràng và biểu cảm hơn so với các phiên bản trước.
- Kiểm soát chi tiết: Người dùng có thể chỉ định hoặc tinh chỉnh phong cách, cảm xúc, bối cảnh và thậm chí là cấu trúc theo từng phân đoạn (ví dụ, viết một đoạn thơ với lời bài hát này và một đoạn điệp khúc với tâm trạng đó).
- Hỗ trợ nhiều thể loại nhạc cụ: Từ nhạc pop, rock và jazz đến nhạc cụ cổ điển và nhạc cụ dân tộc — MiniMax cho biết mô hình này bao gồm cả âm sắc đặc trưng và nhạc cụ không phải phương Tây.
- Bao gồm nhiều ngôn ngữ và nền văn hóa, nó có thể tạo ra âm nhạc với nhiều phong cách văn hóa đa dạng.
- Cấu trúc rõ ràng: Mô hình này xuất nhạc theo cấu trúc bài hát thông thường, chẳng hạn như Intro – Verse – Chorus – Bridge – Outro, tránh các đoạn lặp lại hoặc giai điệu đơn điệu.
- API mở cho các nhà phát triển truy cập và sử dụng trực tiếp
Đằng sau những đột phá này là kiến thức chuyên môn tích lũy của MiniMax về xử lý đa phương thức, bao gồm văn bản, giọng nói và hình ảnh. Music 1.5 tận dụng sức mạnh của các mô hình văn bản để cung cấp khả năng hiểu sâu hơn và kiểm soát các mô tả văn bản. Điều này không chỉ cho phép kiểm soát toàn diện phong cách bài hát, tông điệu cảm xúc và các tình huống áp dụng, mà còn cho phép kiểm soát chi tiết các đặc điểm giọng hát, tạo ra âm sắc giọng hát với nhiều đặc điểm đa dạng.
MiniMax âm nhạc 1.5 có thể được sử dụng rộng rãi trong sáng tác nhạc, nhạc phim và truyền hình, hiệu ứng âm thanh trò chơi, quảng cáo và tiếp thị, giáo dục và đào tạo, cũng như trong các tình huống doanh nghiệp. Nó không chỉ giúp nhạc sĩ và nhà sản xuất nhanh chóng tạo ra các bản demo hoàn chỉnh với giọng hát, mà còn cung cấp nhạc nền phù hợp về mặt cảm xúc và ngữ cảnh cho phim, truyền hình, trò chơi và quảng cáo. Nó cũng hỗ trợ các nền tảng giáo dục và nhà sáng tạo với các bài tập thực hành cách điệu và tùy chỉnh nội dung, mang đến các giải pháp âm nhạc hiệu quả và tiết kiệm chi phí cho các sự kiện doanh nghiệp, truyền thông thương hiệu và trải nghiệm tương tác.
Việc phát hành Music 1.5 không chỉ giảm bớt rào cản gia nhập vào lĩnh vực sáng tác âm nhạc mà còn quay trở lại với bản chất của thính giác, cho phép âm nhạc "hay" tuôn chảy một cách tự nhiên.
Bắt đầu
CometAPI là một nền tảng API hợp nhất tổng hợp hơn 500 mô hình AI từ các nhà cung cấp hàng đầu—chẳng hạn như dòng GPT của OpenAI, Gemini của Google, Claude của Anthropic, Midjourney, Suno, v.v.—thành một giao diện duy nhất thân thiện với nhà phát triển. Bằng cách cung cấp xác thực nhất quán, định dạng yêu cầu và xử lý phản hồi, CometAPI đơn giản hóa đáng kể việc tích hợp các khả năng AI vào ứng dụng của bạn. Cho dù bạn đang xây dựng chatbot, trình tạo hình ảnh, nhà soạn nhạc hay đường ống phân tích dựa trên dữ liệu, CometAPI cho phép bạn lặp lại nhanh hơn, kiểm soát chi phí và không phụ thuộc vào nhà cung cấp—tất cả trong khi khai thác những đột phá mới nhất trên toàn bộ hệ sinh thái AI.
Bản tích hợp mới nhất Minimax Music 1.5 sẽ sớm xuất hiện trên CometAPI, vì vậy hãy theo dõi! Trong khi chúng tôi hoàn thiện việc tải lên Mô hình Minimax Music 1.5, hãy khám phá các mô hình âm nhạc khác của chúng tôi như Âm nhạc Suno trên trang Mô hình hoặc thử chúng trong sân chơi trí tuệ nhân tạo.
