Взаимодействие агента и среды — путь к ОИИ
Друзья, с момента основания проекта прошло уже 20 лет и мы рады сообщать вам, что сайт, наконец, переехали на новую платформу.
Какое-то время продолжим трудится на общее благо по адресу
На новой платформе мы уделили особое внимание удобству поиска материалов.
Особенно рекомендуем познакомиться с работой рубрикатора.
Спасибо, ждём вас на N-N-N.ru
Можно ли научить нейросеть думать как человек? Или хотя бы как животное? О чем вообще думают животные? Можно ли назвать то, что происходит у кота в голове, размышлениями? И в чем же все таки секрет сознания? Ниже мы постараемся разобраться во всех этих вопросах.
Не секрет, что нейросети могут аппроксимировать любую функцию, есть даже теоремы, доказывающие это. Есть входной слой, скрытые слои, и выходной слой. В случае обучения с подкреплением, входным слоем является то, как среда действует на агента. А выходном слоем является действия агента на окружающую среду. Чтобы получить достаточно умного агента, нам нужно 3 вещи: достаточное количество нейронов в скрытых слоях, достаточно проработанную среду, дающую возможность получать подкрепление, а так же нам необходимо большое количество входных и выходных нейронов для максимизации взаимодействия со средой.
Вспомним человеческий мозг — 100 миллиардов нейронов. Формально это примерно 10 слоев по 10 миллиардов нейронов. Напишите в комментариях, сколько мощности необходимо для просчета такого количества. Для экспериментов можно использовать заниженные в 10–100 раз количества нейронов.
Среда должна быть максимально разнообразной, как окружающий нас мир. Мы можем поместить агента-робота в реальность или учить его в виртуальной реальности, задав ему подкрепление от той функции (действия агента), которое нам бы хотелось, чтоб он выполнил.
Про входные и выходные нейроны я хотел бы остановиться отдельно. Их цель — взаимодействие со средой. Входные нейроны кота — это все его рецепторы в глазах, ушах и на коже, а так же многие другие. Выходные нейроны связаны в основном с различными мышцами, что даёт существу возможность взаимодействия со средой (обратная связь агента на среду). Чем больше входных и выходных нейронов — тем лучше, шире, качественнее взаимодействие «среда-агент-среда»
Разберем несколько примеров. Рецепторы улавливают нехватку воздуха — мозг заставляет лёгкие вдохнуть. Рецепторы желудка говорят о голоде — мозг выводит функцию добычи еды в данной среде. Или пример с иголкой — если кожу что-то укололо, сигнал идёт в мозг, там обрабатывается и мозг выдает приказ руке как-то избавиться от этой проблемы. Все сводится к простой вещи — когда рецепторы ничего не тревожит, нет и действий. Но если рецептор возбуждён, то мозг ищет решение, которое помогло бы снять возбуждение этого рецептора. Как только нужная цепочка найдена, а рецептор потерял возбуждение, происходит подкрепление нейронных связей этой цепочки. И уже в другой раз эта цепочка действий будет приоритетной. Так происходит со всеми действиями в нашей жизни. Таким образом можно создать агента под любую среду, и под любые функции, необходимые нам. Вопрос лежит исключительно в производительных мощностях.
- Источник(и):
- Войдите на сайт для отправки комментариев