Исследователи из Meta разработали мультимодальный метод обучения нейросетей

Исследователи из Meta AI (ранее Facebook AI) разработали единый метод обучения нейросетей, подходящий для работы с изображениями, звуком и текстом. В нем используется две идентичные нейросети — учитель и ученик. Учитель получает полные входные данные, а ученик получает частичные и учится предсказывать внутреннее представление полной версии этих данных в модели-учителе. Модели, обученные таким методом, оказались лучше или сравнимы с моделями, обученные методами, специфичными для одного типа данных.

Статья и краткое описание метода опубликованы на сайте Meta AI.

В последние годы исследователи в области машинного обучения все чаще используют обучение без учителя или самообучение. Особенно полезно оно, когда необходимо использовать огромные объемы данных или обучать модель на задаче, для которой нет достаточных датасетов, например, для обучения языковой модели на редком языке.

Один из самых ярких примеров такого типа обучения — GPT-3, которая обучалась на 570 гигабайтах текстов. Однако разработки в области самообучения, как правило, сосредоточены на одной модальности (одном типе данных), и методы обучения зачастую нельзя напрямую применить к другим модальностям.

Группа исследователей из Meta AI под руководством Майкла Аули (Michael Auli) разработала метод обучения, подходящий для разных типов данных.

Подробнее
Пожалуйста, оцените статью:
Пока нет голосов
Источник(и):

N+1