Умные очки Meta идентифицируют объекты и переводят текст на разные языки

Друзья, с момента основания проекта прошло уже 20 лет и мы рады сообщать вам, что сайт, наконец, переехали на новую платформу.

Какое-то время продолжим трудится на общее благо по адресу https://n-n-n.ru.
На новой платформе мы уделили особое внимание удобству поиска материалов.
Особенно рекомендуем познакомиться с работой рубрикатора.

Спасибо, ждём вас на N-N-N.ru

Вслед за выпуском искусственного интеллекта для клонирования голоса Meta (компания признана экстремистской и запрещена в РФ) начинает тестировать новый мультимодальный искусственный интеллект, предназначенный для работы в умных очках Ray Ban Meta.

ИИ-помощник, встроенный в очки, сможет идентифицировать предметы вокруг, отвечать на вопросы о них или переводить текст. Так, очки помогли Марку Цукербергу подобрать брюки к рубашке. Это первая попытка Meta создать интегрированный в гаджет мультимодальный ИИ. Его публичный запуск запланирован на 2024 год.

Эндрю Босворт, бывший директор Facebook и технический директор Meta, объявил о планах запуска мультимодальной версии ИИ-помощника. Этот помощник будет использовать камеру в умных очках для предоставления информации не только по заданным запросам, но и об окружающем мире. Тестирование мультимодального ИИ уже началось в США через программу раннего доступа.

Очки, последняя версия которых была представлена на ежегодной конференции Meta Connect в Пало-Альто еще в сентябре, стоят $299. Они уже поставляются со встроенным помощником искусственного интеллекта. Однако возможности очков ограничены, в том числе они не могли адекватно реагировать на видео или фотографии, а также распознавать в реальном времени то, что видит пользователь, несмотря на наличие встроенных камер.

Марк Цукерберг продемонстрировал обновление в видеоролике, где он попросил очки подобрать брюки, подходящие к рубашке, которую он держал в руках. В ответ ИИ-помощник описал рубашку и предложил пару вариантов брюк, которые могли бы ее дополнить. Он также поручил искусственному интеллекту перевести текст и предложить пару подписей к изображениям.

Цукерберг раскрыл мультимодальные функции искусственного интеллекта для очков Ray-Ban еще в сентябре. Он сказал, что люди будут разговаривать с помощником Meta AI в течение дня, поскольку очки смогут отвечать на вопросы о том, на что смотрят пользователи или где они находятся.

Помощник по искусственному интеллекту точно описал настенную скульптуру в виде карты Калифорнии в видео Босворта. Технический директор Meta также упомянул другие функции помощника искусственного интеллекта в очках, такие как помощь с подписями к фотографиям и переводом текста. Подобный функционал уже присутствуют в других продуктах от Microsoft и Google.

Это ожидаемый шаг, учитывая широкое использование искусственного интеллекта в продуктах Meta и продвижение открытого исходного кода через программу LLM Llama 2. Теперь компания предпринимает первые попытки по созданию мультимодального искусственного интеллекта в виде физического устройства, а не только в виде открытых моделей в интернете. Переход генеративного ИИ в категорию аппаратного обеспечения пока идет медленно: несколько небольших стартапов, в том числе Humane с его Ai Pin, использующим GPT-4V от OpenAI, пытаются создать специализированные устройства ИИ.

Пожалуйста, оцените статью:
Ваша оценка: None Средняя: 5 (2 votes)
Источник(и):

ХайТек+