ИИ в 3D: Где мы сейчас и какое будущее нас ждёт? (Часть 3)

Друзья, с момента основания проекта прошло уже 20 лет и мы рады сообщать вам, что сайт, наконец, переехали на новую платформу.

Какое-то время продолжим трудится на общее благо по адресу https://n-n-n.ru.
На новой платформе мы уделили особое внимание удобству поиска материалов.
Особенно рекомендуем познакомиться с работой рубрикатора.

Спасибо, ждём вас на N-N-N.ru

Автор: Савелий. Мир, в котором мы с вами живём и который непосредственно ощущаем, является объёмным: расположение любой точки в нём можно описать тремя координатами, и этот факт элементарно зашит в нашу природу. Чем больше “понимания” система искусственного интеллекта будет иметь относительно истинной сущности вещей, включая их расположение, форму и объем, тем легче она будет справляться с задачами, которые до сих пор мог выполнять только человек.

В этой статье разберём, как ИИ помогает решать одну из ключевых задач робототехники, а именно – понимание и ориентация в объёмных пространствах!

SLAM

Задача, на которую сделаем основной упор в этой статье, именуется SLAM (Simultaneous Localization and Mapping – одновременная локализация и построение карты).

В чём она заключается? Предполагается, что некий аппарат помещается в среду, о которой у него нет никакой заранее известной информации. Используя только имеющиеся у него сенсоры, робот должен пройти в этой среде из начального положения в заданное, при этом построить карту местности и получить точную оценку собственной траектории.

3d1.pngПример карты, построенной роботом от Boston Dynamics при помощи лидара

3d2.pngА вот как строит карту дрон, созданный для детектирования пожаров на объекте, также при помощи лидара

Всё это выглядит весьма нетривиально, однако, первая реализация подобной системы появилась аж в 1989 и была основана на расширенном фильтре Калмана (EKF SLAM). В целом про разновидности не нейросетевых подходов к SLAM можно почитать в следующей статье. Всех их объединяет одна особенность – необходимость наличия дорогих и сложных датчиков, по типу лидаров, камер глубины (RGB-D), инерциальных модулей (IMU) и др. Нейросетевые подходы, в свою очередь, стараются обойтись лишь одним RGB-видео, доступным с любой цифровой камеры (так называемый монокулярный SLAM).

3d3.pngСравнение лидара с цифровой камерой. Их соответствующие стоимости и габариты

Начнём разбор!

NeuralRecon

Данная модель появилась в 2021 году и оставалась непревзойденной в своей нише несколько лет подряд. Она уже не нова и появились подходы, превосходящие её во всех отношениях. Тем не менее, это первая модель, давшая такое качество реконструкции с таким большим отрывом по производительности.

Подробнее
Пожалуйста, оцените статью:
Пока нет голосов
Источник(и):

Хабр