ИИ, копирующий голос, оказался слишком хорош: OpenAI оценивает риски запуска
Друзья, с момента основания проекта прошло уже 20 лет и мы рады сообщать вам, что сайт, наконец, переехали на новую платформу.
Какое-то время продолжим трудится на общее благо по адресу
На новой платформе мы уделили особое внимание удобству поиска материалов.
Особенно рекомендуем познакомиться с работой рубрикатора.
Спасибо, ждём вас на N-N-N.ru
Предварительное тестирование Voice Engine — генератора голоса от разработчиков ChatGPT — показало, что модели достаточно 15-секундной записи для копирования голоса человека. OpenAI представила результаты ограниченного тестирования модели Voice Engine, которая генерирует реалистичную запись голоса на основе небольшого фрагмента. Результаты показывают многообещающие примеры использования новой технологии, но в компании обеспокоены потенциальными проблемами с безопасностью.
Voice Engine создает синтетический голос на основе 15-секундного фрагмента записи чьей-либо речи. Голос, сгенерированный ИИ и очень близкий к оригиналу, может зачитывать любой текст, как на языке спикера, так и используя другие языки. OpenAI предоставила доступ к модели нескольким компаниям партнерам для тестирования возможностей ИИ при решении реальных задач.
Например, Age of Learning использовала Voice Engine для создания закадрового контента для учебных материалов и предоставления учителям персонализированных устных ответов для взаимодействия с учениками. А HeyGen переводит рекламные видео и демонстрации продуктов для вывода товаров на новые рынки. При этом в процессе перевода сохраняется стиль речи и акцент спикера.
Также в тестировании участвовала компания Livox, которая разработала приложения для людей с проблемами речи. Voice Engine позволяет пользователям генерировать голос на основе текста и выбирать голос, который лучше всего их представляет. А Lifespan запустила пилотную программу, позволяющую людям с нарушениями речи из-за рака или неврологических заболеваний общаться с помощью ИИ.
Представители OpenAI заявили, что их впечатлили варианты использования, предложенные участниками тестирования. Но необходимо принять дополнительные меры безопасности, прежде чем компания примет решение о том, «можно ли и как развертывать эту технологию в больших масштабах».
Партнеры, допущенные к тестированию подписали соглашения, которое обязывает явным образом информировать пользователей об использовании искусственно сгенерированного контента. Кроме того, Voice Engine внедряет в звуковые файлы специальную метку (водяные знаки), которая позволяет отследить происхождение и распространение контента.
Тем не менее в компании полагают, что перед внедрением технологии нужно проработать дополнительные меры, которые ограничат незаконное использование подобных моделей. Например, необходимо создать «стоп-лист» голосов известных людей, которые модель не будет генерировать, чтобы препятствовать распространению дип-фейков.
Одновременно OpenAI объявила об отмене требования о регистрации для использования наиболее известного своего продукта — языковой модели ChatGPT. Теперь для использования чат-бота необязательно заводить персональный аккаунт.
- Источник(и):
- Войдите на сайт для отправки комментариев