OpenAI разрешила компаниям дообучать GPT-3,5 Turbo на собственных данных
Друзья, с момента основания проекта прошло уже 20 лет и мы рады сообщать вам, что сайт, наконец, переехали на новую платформу.
Какое-то время продолжим трудится на общее благо по адресу
На новой платформе мы уделили особое внимание удобству поиска материалов.
Особенно рекомендуем познакомиться с работой рубрикатора.
Спасибо, ждём вас на N-N-N.ru
Компании, использующие языковую модель семейства GPT-3,5 Turbo, получили возможность настраивать ее под свои нужды, загружая самостоятельно подобранные данные. В результате такая кастомная модель сможет сравниться или даже превзойти способности GPT-4 в выполнении узкоспециализированных задач.
С релиза семейства моделей GPT-3,5 Turbo в начале года разработчики и бизнес просили открыть возможность кастомизации модели, чтобы они могли удовлетворять запросы потребителей. Например, создать уникальный чатбот, который стал бы помогать клиентам, общаясь с ними на определенном языке или в определенной манере. До сих пор такие возможности предоставляли только модели GPT-3, такие как davinci-002 или babbage-002, пишет Verge.
К преимуществам настройки относятся повышенная управляемость модели (модель лучше следует инструкциям); надежное форматирование выходных данных (если нужно предоставлять ответы в определенном формате); кастомизация тона, включая имитацию голоса бренда, например, для рекламы или внутренних коммуникаций. ИТ-компаниям модель GPT-3,5 Turbo предлагает возможность поручить ИИ создание рутинного кода или форматирование и завершение фрагментов кода.
Семейство моделей GPT-3,5 Turbo может обработать одновременно до 4000 токенов, это, по словам OpenAI, в два раза больше, чем предыдущие модели. Тесты показали, что после тонкой настройки запросы стали короче на 90%.
Стоимость обучения GPT-3 составляет $0,008 за 1000 токенов, использование — $0,012 за 1000 токенов ввода данных и столько же за выходные данные.
Компания OpenAI призналась, что годами использовала бота-паука для сбора информации с сотен тысяч сайтов для обучения своей нейросети. Это положило начало панике среди создателей контента: в отличие от ботов поисковых систем, дающих сайтам трафик в обмен на информацию, бот от OpenAI по сути ворует контент, так как не дает никому никакого трафика. Помимо прямого запрета на индексацию сайтов через robot.txt компанию могут ждать многочисленные иски.
- Источник(и):
- Войдите на сайт для отправки комментариев