OpenAI разрешила компаниям дообучать GPT-3,5 Turbo на собственных данных

Друзья, с момента основания проекта прошло уже 20 лет и мы рады сообщать вам, что сайт, наконец, переехали на новую платформу.

Какое-то время продолжим трудится на общее благо по адресу https://n-n-n.ru.
На новой платформе мы уделили особое внимание удобству поиска материалов.
Особенно рекомендуем познакомиться с работой рубрикатора.

Спасибо, ждём вас на N-N-N.ru

Компании, использующие языковую модель семейства GPT-3,5 Turbo, получили возможность настраивать ее под свои нужды, загружая самостоятельно подобранные данные. В результате такая кастомная модель сможет сравниться или даже превзойти способности GPT-4 в выполнении узкоспециализированных задач.

С релиза семейства моделей GPT-3,5 Turbo в начале года разработчики и бизнес просили открыть возможность кастомизации модели, чтобы они могли удовлетворять запросы потребителей. Например, создать уникальный чатбот, который стал бы помогать клиентам, общаясь с ними на определенном языке или в определенной манере. До сих пор такие возможности предоставляли только модели GPT-3, такие как davinci-002 или babbage-002, пишет Verge.

К преимуществам настройки относятся повышенная управляемость модели (модель лучше следует инструкциям); надежное форматирование выходных данных (если нужно предоставлять ответы в определенном формате); кастомизация тона, включая имитацию голоса бренда, например, для рекламы или внутренних коммуникаций. ИТ-компаниям модель GPT-3,5 Turbo предлагает возможность поручить ИИ создание рутинного кода или форматирование и завершение фрагментов кода.

Семейство моделей GPT-3,5 Turbo может обработать одновременно до 4000 токенов, это, по словам OpenAI, в два раза больше, чем предыдущие модели. Тесты показали, что после тонкой настройки запросы стали короче на 90%.

Стоимость обучения GPT-3 составляет $0,008 за 1000 токенов, использование — $0,012 за 1000 токенов ввода данных и столько же за выходные данные.

Компания OpenAI призналась, что годами использовала бота-паука для сбора информации с сотен тысяч сайтов для обучения своей нейросети. Это положило начало панике среди создателей контента: в отличие от ботов поисковых систем, дающих сайтам трафик в обмен на информацию, бот от OpenAI по сути ворует контент, так как не дает никому никакого трафика. Помимо прямого запрета на индексацию сайтов через robot.txt компанию могут ждать многочисленные иски.

Пожалуйста, оцените статью:
Пока нет голосов
Источник(и):

ХайТек+