Цукерберг бросил вызов ChatGPT — вышла новая языковая модель Llama 3

Meta (организация признана экстремистской и запрещена в РФ) представила новую языковую модель Llama 3, которая обещает стать конкурентом GPT-4 Turbo. Она представлена в двух версиях: Llama 3 8B и Llama 3 70B, которые имеют 8 и 70 миллиардов параметров соответственно. Они значительно превосходят предыдущее поколение MML от Марка Цукерберга по нескольким техническим характеристикам и тестам, включая MMLU, ARC, DROP и другие.

Эксперты говорят, что это лучшая модель с открытым исходным кодом на мировом рынке.

Llama 3 интегрирована в поисковые строки основных приложений Meta, таких как Facebook (запрещен в РФ), Messenger, Instagram (запрещен в РФ) и WhatsApp, а также используется на отдельном сайте для чат-бота meta.ai. Обе ее версии обладают улучшенными способностями в обучении, генерации кода и математических задачах. Llama 3 8B показывает лучшие результаты по сравнению с аналогичными моделями в тестах, таких как GPQA, HumanEval и GSM-8K.

В дополнение к техническим улучшениям, Meta внедрила новые функции в ИИ, включая анимацию изображений и улучшенное размещение текста на картинках. ИИ также может искать информацию в Google и Bing по запросу пользователя. Модели, созданные на основе данных из общедоступных источников, используют 15 триллионов токенов и 750 миллиардов слов, обучены на 30 различных языках и включают синтетические данные.

Meta усилила меры безопасности в новых моделях Llama 3, интегрировав протоколы, такие как Llama Guard и CybersecEval, и инструмент Code Shield для анализа безопасности кода. Эти меры направлены на предотвращение неправомерного использования ИИ.

Особое внимание компания уделяет чат-боту Meta.ai, который работает на базе модели Llama 3. Запущенный на отдельном веб-сайте, этот чат-бот пока может общаться только на английском языке. Он доступен не только для пользователей социальных сетей Meta, но и для широкой публики.

Компания также разрабатывает версию Llama 3 с 400 миллиардами параметров, которая будет поддерживать больше языков и типов данных, включая обработку изображений. Эта мультимодальная модель предназначена для улучшения контекстуального понимания и расширения возможностей в рассуждениях и написании кода. Meta надеется, что эти усовершенствования помогут превзойти конкурентные продукты, такие как ChatGPT от OpenAI и Gemini от Google.

Пожалуйста, оцените статью:
Пока нет голосов
Источник(и):

ХайТек+