LAION и энтузиасты по всему миру разрабатывают Open Assistant — открытый аналог ChatGPT
Друзья, с момента основания проекта прошло уже 20 лет и мы рады сообщать вам, что сайт, наконец, переехали на новую платформу.
Какое-то время продолжим трудится на общее благо по адресу
На новой платформе мы уделили особое внимание удобству поиска материалов.
Особенно рекомендуем познакомиться с работой рубрикатора.
Спасибо, ждём вас на N-N-N.ru
Автор: 0×22almostEvil. Некоммерческая организация LAION и энтузиасты по всему миру занимаются разработкой Open Assistant — это проект, цель которого в предоставлении всем желающим доступа к продвинутой большой языковой модели, основанной на принципах чат-бота, с конечной целью революции в инновациях в области обработки естественного языка.
Open Assistant ставит перед собой цель не просто повторить ChatGPT, но создать Ассистента будущего. Он будет понимать и решать поставленные задачи, использовать API, динамически исследовать информацию и многое другое.
Мы хотим создать Ассистента, которого каждый сможет настроить и расширить под свои нужды открытым и доступным способом. Одна из ключевых целей — сделать модель одновременно наиболее эффективной и небольшой, чтобы она могла работать на потребительском оборудовании.
Мы находимся в процессе разработки, опираясь на результаты уже проведённых исследований по применению RLHF к большим языковым моделям. В основном — InstructGPT.
В этой статье поговорим о проекте Open Assistant — и как вы можете внести свой вклад.
А кто это?
LAION занимаются развитием открытых инструментов, моделей и датасетов. Более того, раннее они участвовали в крупных проектах, существенно повлиявших на индустрию — датасет LAION-5B лёг в основу моделей Stable Diffusion.
Однако внести вклад может каждый — даже если вы не имеете никакого отношения к разработке или к машинному обучению: участвуйте в сборе данных для RLHF, общаясь от лица человека или Ассистента, модерируйте контент, переводите, рассказывайте друзьям и публике!
Но… Ведь есть аналоги!
Да, есть, вот их список:
- ChatGPT, GPT-4, Bing Search от OpenAI & Mircosoft – закрытый исходный код; закрытый датасет; проприетарная лицензия
- Bard от Google – закрытый исходный код; закрытый датасет; проприетарная лицензия
- YaLM от Yandex – открытый исходный код; закрытый датасет; Apache 2.0
- LLaMa от Meta* – открытый исходный код; открытый датасет; GPLv3.0
- Alpaca от Stanford – открытый исходный код; открытый датасет; MIT
- BLOOMZ от BigScience – открытый исходный код; открытый датасет; RAIL 1.0
- Dolly от Databricks Labs – открытый исходный код; открытый датасет; Apache 2.0
Однако давайте подробнее разберём достоинства и недостатки каждой из этих моделей и причину, по которой всё же нужно нечто новое.
- Источник(и):
- Войдите на сайт для отправки комментариев