ИИ в 3D: Где мы сейчас и какое будущее нас ждёт? (Часть 3)
Друзья, с момента основания проекта прошло уже 20 лет и мы рады сообщать вам, что сайт, наконец, переехали на новую платформу.
Какое-то время продолжим трудится на общее благо по адресу
На новой платформе мы уделили особое внимание удобству поиска материалов.
Особенно рекомендуем познакомиться с работой рубрикатора.
Спасибо, ждём вас на N-N-N.ru
Автор: Савелий. Мир, в котором мы с вами живём и который непосредственно ощущаем, является объёмным: расположение любой точки в нём можно описать тремя координатами, и этот факт элементарно зашит в нашу природу. Чем больше “понимания” система искусственного интеллекта будет иметь относительно истинной сущности вещей, включая их расположение, форму и объем, тем легче она будет справляться с задачами, которые до сих пор мог выполнять только человек.
В этой статье разберём, как ИИ помогает решать одну из ключевых задач робототехники, а именно – понимание и ориентация в объёмных пространствах!
SLAM
Задача, на которую сделаем основной упор в этой статье, именуется SLAM (Simultaneous Localization and Mapping – одновременная локализация и построение карты).
В чём она заключается? Предполагается, что некий аппарат помещается в среду, о которой у него нет никакой заранее известной информации. Используя только имеющиеся у него сенсоры, робот должен пройти в этой среде из начального положения в заданное, при этом построить карту местности и получить точную оценку собственной траектории.
Пример карты, построенной роботом от Boston Dynamics при помощи лидара
А вот как строит карту дрон, созданный для детектирования пожаров на объекте, также при помощи лидара
Всё это выглядит весьма нетривиально, однако, первая реализация подобной системы появилась аж в 1989 и была основана на расширенном фильтре Калмана (EKF SLAM). В целом про разновидности не нейросетевых подходов к SLAM можно почитать в следующей статье. Всех их объединяет одна особенность – необходимость наличия дорогих и сложных датчиков, по типу лидаров, камер глубины (RGB-D), инерциальных модулей (IMU) и др. Нейросетевые подходы, в свою очередь, стараются обойтись лишь одним RGB-видео, доступным с любой цифровой камеры (так называемый монокулярный SLAM).
Сравнение лидара с цифровой камерой. Их соответствующие стоимости и габариты
Начнём разбор!
NeuralRecon
Данная модель появилась в 2021 году и оставалась непревзойденной в своей нише несколько лет подряд. Она уже не нова и появились подходы, превосходящие её во всех отношениях. Тем не менее, это первая модель, давшая такое качество реконструкции с таким большим отрывом по производительности.
- Источник(и):
- Войдите на сайт для отправки комментариев