ИИ научили переводить код с одного языка на другой

Друзья, с момента основания проекта прошло уже 20 лет и мы рады сообщать вам, что сайт, наконец, переехали на новую платформу.

Какое-то время продолжим трудится на общее благо по адресу https://n-n-n.ru.
На новой платформе мы уделили особое внимание удобству поиска материалов.
Особенно рекомендуем познакомиться с работой рубрикатора.

Спасибо, ждём вас на N-N-N.ru

Исследователи из компании IBM представили модель на основе ИИ, которая умеет переводить один язык программирования на другой. Ее обучили на 14 млн фрагментах кода.

Ученые объяснили, что системы искусственного интеллекта и машинное обучение в последние годы становятся все более умными и способны не только понимать текст, но и писать его. Однако они пока слабо владеют языками программирования. Чтобы исправить это, компания IBM на конференции Think 2021 объявила, что ее исследователи создали ИИ для перевода кода — проект IBM CodeNet.

«Нам нужен свой ImageNet, который может исследовать инновационные идеи и отражать их в различных алгоритмах, — отметили исследователи. — CodeNet — это, по сути, ImageNet для компьютеров. Это обширный набор данных, предназначенный для обучения систем AI/ML переводу кода и состоящий из 14 млн фрагментов и 500 млн строк на более чем 55 старых и активных языках — от COBOL и FORTRAN до Java, C++ и Python».

Они объяснили, что набор данных построен таким образом, что он позволяет осуществлять двунаправленный перевод. То есть пользователь может взять устаревший код, которым часто пользуются в банковской и государственной сферах, и перевести его на Java и другой язык.

Ученые объяснили, что набор данных состоит из множество видов соревнований по программированию и всевозможных задач — некоторые из них более продвинутые, некоторые — более академические. Причем эти языки использовались в течение последних полутора десятилетий во многих из этих соревнований, решения которых представляли тысячи студентов.

Пользователи также могут запускать отдельные куски кода «для извлечения метаданных и проверки результатов генеративных моделей ИИ на корректность». Это позволит исследователям программировать эквивалентные части кода при переводе одного языка программирования на другой. Ученые добавили, что их разработка важна для автоматизированного рассуждения и принятия решений, с возможностью объяснения этих решений. Фактически, это такая же ветвь развития моделей, как и компьютерное зрение и обработка естественных языков.

Пожалуйста, оцените статью:
Ваша оценка: None Средняя: 5 (1 vote)
Источник(и):

ХайТек