Массивный набор трёхмерных данных помогает роботам разбираться в устройстве вещей

Друзья, с момента основания проекта прошло уже 20 лет и мы рады сообщать вам, что сайт, наконец, переехали на новую платформу.

Какое-то время продолжим трудится на общее благо по адресу https://n-n-n.ru.
На новой платформе мы уделили особое внимание удобству поиска материалов.
Особенно рекомендуем познакомиться с работой рубрикатора.

Спасибо, ждём вас на N-N-N.ru

Одна из способностей человека, позволяющих нам так хорошо адаптироваться к окружающему миру, состоит в возможности понимать разные вещи сразу категориями целиком, а потом использовать это обобщённое понимание, чтобы разбираться с какими-то конкретными вещами, которые нам раньше не встречались.

Представьте себе, например, лампу. Никто не видел все существующие в мире лампы. Но в большинстве случаев мы, впервые входя в новый дом, легко сможем найти все имеющиеся там лампы, и понять, как они работают. Конечно, иногда мы сможем встретить что-то очень странное, что вынудит нас спросить: «Ого, это что, лампа? А как её включать?» Но в большинстве случаев наша обобщённая ментальная модель лампы спасает нас.

Нам помогает то, что у ламп, как и у других категорий объектов, по определению есть много общих составляющих. В лампах обычно есть лампочки. У них обычно есть абажур. Также у них, вероятно, есть подставка, чтобы они не падали, штатив, чтобы возвышаться над полом, и шнур питания. Если вы увидите предмет, обладающий всеми этими признаками, то это, вероятно, лампа, и когда вы это поймёте, вы сможете сделать обоснованное предположение по поводу того, как её использовать.

Такой уровень понимания часто особенно плохо даётся роботам, что неприятно, поскольку это ведь очень полезная вещь. Можно даже сказать, что мы сможем доверять роботам автономную работу в неструктурированном окружении только тогда, когда они смогут понимать предметы на уровне, близком к описанному. На конференции по компьютерному зрению и распознаванию закономерностей CVPR 2019 группа исследователей из Стэнфорда, Калифорнийского университета, университета в Сан-Франциско и Intel объявили о создании PartNet, огромной базы данных повседневных трёхмерных объектов, разбитых на части и описанных до такого уровня, который, как надеются создатели базы, поможет роботам разобраться в том, что такое лампа.

Подробнее
Пожалуйста, оцените статью:
Ваша оценка: None Средняя: 5 (1 vote)
Источник(и):

Хабр