Ученые заглянули внутрь «черного ящика» нейросети
Друзья, с момента основания проекта прошло уже 20 лет и мы рады сообщать вам, что сайт, наконец, переехали на новую платформу.
Какое-то время продолжим трудится на общее благо по адресу
На новой платформе мы уделили особое внимание удобству поиска материалов.
Особенно рекомендуем познакомиться с работой рубрикатора.
Спасибо, ждём вас на N-N-N.ru
Специалисты IBM и Гарвардского университета разработали инструмент для визуализации процесса принятия решений нейронной сети при переводе с одного языка на другой.
Благодаря успехам в глубоком обучении машинный перевод делает в последние годы большие успехи. Однако цена этого прогресса — отсутствие четкого понимания того, что происходит внутри нейросети, а значит, и того, как исправить возникшие ошибки. Такие, например, как перевод на иврит арабского «доброе утро» фразой «в атаку» в прошлом году.
Эту «проблему черного ящика», или прозрачности нейросети, и должен решить созданный в IBM и Гарварде инструмент Seq2Seq-Vis, который разработчики представили на конференции по визуальной аналитике и технологии в Берлине, пишет VentureBeat.
Хендрик Штробельт из IBM Research сравнивает процесс отладки традиционной программы по переводу с использованием телефонной книги. Если что-то идет не так, можно заглянуть в книгу и найти правило, которое привело к ошибке, и исправить его.
Проблема в том, что в сложных нейросетях создать такую книгу непросто. Поэтому разработчики заменили ее на новый инструмент.
Seq2Seq-Vis основан на модели «sequence-to-sequence», архитектуре искусственного интеллекта, которую используют в большинстве современных систем машинного перевода.
«Модели sequence-to-sequence могут обучаться превращать входящее предложение произвольной длины в исходящее предложение произвольной длины», — поясняет Штробельт.
Инструмент Seq2Seq-Vis создает визуальное представление различных этапов процесса перевода. Так наблюдатель сможет проверить каждое решение и найти причину ошибки. Также модель показывает, как каждое слово в исходном и конечном тексте связано с примерами, на которых обучалась нейросеть.
Таким образом, с помощью этого визуального инструмента пользователь может определить, произошла ли ошибка из-за неправильного примера, неверной конфигурации «модели внимания» или алгоритма поиска.
- Источник(и):
- Войдите на сайт для отправки комментариев