Вышла Stable Audio 2.0 для генерации трехминутных песен

Друзья, с момента основания проекта прошло уже 20 лет и мы рады сообщать вам, что сайт, наконец, переехали на новую платформу.

Какое-то время продолжим трудится на общее благо по адресу https://n-n-n.ru.
На новой платформе мы уделили особое внимание удобству поиска материалов.
Особенно рекомендуем познакомиться с работой рубрикатора.

Спасибо, ждём вас на N-N-N.ru

Опубликовано gumarov в 4 апреля, 2024 - 20:30

Стартап Stability AI представил языковую модель Stable Audio 2.0, которая позволяет генерировать полноценные музыкальные треки из аудиозаписи и подсказок, а также добавлять в них звуковые эффекты. Продолжительность итогового продукта около 3 минут, что равно стандартной песне на радио. Однако эксперты встретили новинку весьма холодно: они считают, что ИИ-треки становятся длиннее, но не лучше.

Первая версия Stable Audio генерировала файлы продолжительностью в 90 секунд, которые подходили скорее для баловства, чем для коммерческого применения. Пришедшая ей на смену модель создаёт полноценные песни с вокалом и классической структурой: куплетами, припевом и финалом. Можно изменять вес подсказки подобно тому, как такая функция работает в Midjourney.

Возможно, она и была подсмотрена там: ранее в этом месяце последняя компания обвиняла Stability AI в попытке кражи данных.

Главное достоинство Stable Audio 2.0 — решенный вопрос с авторскими правами. Stability AI обучала модель на более чем 800 тысячах записей в музыкальной библиотеки AudioSparx, причём исполнители могли запретить использовать свои работы. Кроме того, компания заключила контракт с Audible Magic и использует технологии распознания контента, защищённого авторским правом. Использовать в качестве исходника песню известного артиста уже не получится. Это упрощает использование полученных треков с целью извлечения прибыли.

Журналисты The Verge уже протестировали новинку и явно не в восторге от неё: мелодия весьма хороша и ритмична, но вокал звучит ужасающе неестественно и похож на голоса монстров из фильмов ужасов. Одному из экспертов он напомнил песни китов. Файлы с вокалом звучат неприятно для человеческого слуха, зато мелодии без слов вполне приличные и их можно использовать, например, для озвучивания роликов на YouTube.

Stable Audio 2.0 полностью бесплатна и доступна всем желающим на сайте и по API.

Пожалуйста, оцените статью:

Источник(и):: ХайТек+

Добавить свое объявление
Загрузка...

Войдите на сайт для отправки комментариев

Сайт о нанотехнологиях #1 в России

Вышла Stable Audio 2.0 для генерации трехминутных песен

Категории статьи