Вышла Stable Audio 2.0 для генерации трехминутных песен
Друзья, с момента основания проекта прошло уже 20 лет и мы рады сообщать вам, что сайт, наконец, переехали на новую платформу.
Какое-то время продолжим трудится на общее благо по адресу
На новой платформе мы уделили особое внимание удобству поиска материалов.
Особенно рекомендуем познакомиться с работой рубрикатора.
Спасибо, ждём вас на N-N-N.ru
Стартап Stability AI представил языковую модель Stable Audio 2.0, которая позволяет генерировать полноценные музыкальные треки из аудиозаписи и подсказок, а также добавлять в них звуковые эффекты. Продолжительность итогового продукта около 3 минут, что равно стандартной песне на радио. Однако эксперты встретили новинку весьма холодно: они считают, что ИИ-треки становятся длиннее, но не лучше.
Первая версия Stable Audio генерировала файлы продолжительностью в 90 секунд, которые подходили скорее для баловства, чем для коммерческого применения. Пришедшая ей на смену модель создаёт полноценные песни с вокалом и классической структурой: куплетами, припевом и финалом. Можно изменять вес подсказки подобно тому, как такая функция работает в Midjourney.
Возможно, она и была подсмотрена там: ранее в этом месяце последняя компания обвиняла Stability AI в попытке кражи данных.
Главное достоинство Stable Audio 2.0 — решенный вопрос с авторскими правами. Stability AI обучала модель на более чем 800 тысячах записей в музыкальной библиотеки AudioSparx, причём исполнители могли запретить использовать свои работы. Кроме того, компания заключила контракт с Audible Magic и использует технологии распознания контента, защищённого авторским правом. Использовать в качестве исходника песню известного артиста уже не получится. Это упрощает использование полученных треков с целью извлечения прибыли.
Журналисты The Verge уже протестировали новинку и явно не в восторге от неё: мелодия весьма хороша и ритмична, но вокал звучит ужасающе неестественно и похож на голоса монстров из фильмов ужасов. Одному из экспертов он напомнил песни китов. Файлы с вокалом звучат неприятно для человеческого слуха, зато мелодии без слов вполне приличные и их можно использовать, например, для озвучивания роликов на YouTube.
Stable Audio 2.0 полностью бесплатна и доступна всем желающим на сайте и по API.
- Источник(и):
- Войдите на сайт для отправки комментариев