Будущее голосовых ассистентов — это спонтанное обучение

Друзья, с момента основания проекта прошло уже 20 лет и мы рады сообщать вам, что сайт, наконец, переехали на новую платформу.

Какое-то время продолжим трудится на общее благо по адресу https://n-n-n.ru.
На новой платформе мы уделили особое внимание удобству поиска материалов.
Особенно рекомендуем познакомиться с работой рубрикатора.

Спасибо, ждём вас на N-N-N.ru

Разработчики и частные компании, создающие разговорный ИИ, должны понимать, что им придется работать с технологией спонтанного обучения, заявил Прем Натараян, вице-президент Amazon по Alexa AI. Он пообщался с Бараком Туровски, директором Google AI, на конференции Transform 2020 на тему будущих тенденций развития интеллектуальных помощников.

Натараян называет спонтанное обучение языковым моделям важным трендом для умных помощников и существенной частью создания разговорных ИИ, технологией, которая пригодится для каждого.

«Не ждите, пока к вам придет понимание спонтанного обучения. Начните с осознания того, что вам придется использовать спонтанное обучение с определенной частотой», — заявил он.

Спонтанное обучение, или обучение без учителя использует необработанные данные для выявления внутренних взаимосвязей и закономерностей между объектами. Еще один современный тренд — разработка систем самообучения, которые адаптируются на основе сигналов, полученных в результате взаимодействия человека и виртуального помощника, «пишет»https://venturebeat.com/2020/07/16/alexa-and-google-assistant-execs-on-future-trends-for-ai-assistants/ VentureBeat.

Другой современный тренд — эволюция попыток вплести функции в опыт. Прошлым летом Amazon запустила в превью Alexa Conversations систему глубокого обучения, которая соединяет скиллы Алексы в цельный опыт при помощи рекуррентной нейронной сети, которая предсказывает ход диалога. Например, сценарий типичного вечера выходного дня включает скилл приобретения билетов, заказа столика и такси.

Нараян и Туровски согласились, что еще один новый тренд — мультимодальный опыт. Мультимодальные модели сочетают данные из нескольких источников — текст, фотографии, видео. К примеру, VisualBERT Google или ImageGPT OpenAI.

Туровски рассуждал на тему ограничения числа ответов, которые может дать голосовой агент. На экране список вариантов или ссылок может быть бесконечным, но аудио-ответы должны быть ограничены максимум тремя пунктами. Поэтому и от Amazon, и от Google требуется создание умных дисплеев и интеллектуальных помощников, которые могут и говорить, и выдавать визуальный контент.

В целом Туровски отметил растущую доступность голосовых помощников. Это происходит благодаря развитию переводческих моделей. Google Assistant уже может говорить и переводить на 44 языка.

Пожалуйста, оцените статью:
Ваша оценка: None Средняя: 1 (1 vote)
Источник(и):

ХайТек