Внимание людей и машин привлекли разные детали изображения
Друзья, с момента основания проекта прошло уже 20 лет и мы рады сообщать вам, что сайт, наконец, переехали на новую платформу.
Какое-то время продолжим трудится на общее благо по адресу
На новой платформе мы уделили особое внимание удобству поиска материалов.
Особенно рекомендуем познакомиться с работой рубрикатора.
Спасибо, ждём вас на N-N-N.ru
Ученые сравнили, на что обращают внимание роботы и люди, когда изучают фотографию, и оказалось, что они фокусируются на разных деталях изображения. С работой можно ознакомиться на сервере препринтов ArXiv.
Исследователи попросили добровольцев, нанятых через сервис Amazon Mechanical Turk ответить на вопросы, касающиеся набора фотографий, — например, «Что делает мужчина?» или «Какого цвета глаза у кошки?». Каждый снимок был размыт и участники исследования должны были кликать мышкой на ту область, которую они хотели сделать резкой. Карта этих кликов показывала, на какие части изображения люди обращают внимание в первую очередь, чтобы ответить на вопрос.
«Карта внимания» людей и двух нейросетей. Abhishek Das et al. / ArXiv, 2016
Места, которые люди и компьютер делали более резкими конвертировались в «карту внимания». Abhishek Das et al. / ArXiv, 2016
Затем авторы работы дали такое же задание двум нейросетям — нейросети Stacked Attention Networks, которая построена на базе светрочной и рекуррентной нейросети и может отвечать на вопросы, и HieCoAtt-P, которая может также понимать вопросы в языковой форме. Нейросети, как и люди, выбирали, какие части изображения сделать более четкими, а ученые составляли из этих данных «карту внимания».
«Карта внимания» людей и двух нейросетей. Abhishek Das et al. / ArXiv, 2016
Исследователи обнаружили, что человек и искусственный интеллект по-разному изучают фотографии. По шкале от 1 (что значило, что снимок был сделан полностью резким) до −1 (никакого увеличения резкости) люди получили средний балл 0,63, в то время как нейросети «заработали» всего около 0,26 баллов. При этом, они достаточно хорошо справились с заданием (точность распознавания 62,1 процент).
Кроме того, нейросети смотрели не на те же области фотографий, что и люди, что, по словам ученых, затрудняет объяснение того, как именно искусственный интеллект решает, что показано на снимке.
По мнению исследователей, данная работа поможет ученым, работающим с нейросетями, улучшить их работу и сделать их в некоторых смыслах более «человекоподобными».
Автор: Кристина Уласович
- Источник(и):
- Войдите на сайт для отправки комментариев