Meta Releases Code Llama: модель генерации кода искусственного интеллекта с открытым исходным кодом

2023-08-29 03:46:43

В ожесточенной сфере искусственного интеллекта компания Meta выпустила Code Llama, систему машинного обучения для генерации и интерпретации кода, стремясь произвести фурор. Компания делится этой инновацией с открытым исходным кодом, что способствует дальнейшему развитию области искусственного интеллекта.

Meta со своим инновационным и открытым подходом ранее выпустила серию моделей искусственного интеллекта для генерации текста, перевода языков и создания аудио. Сегодня они распространяют эти усилия на область кода, используя Code Llama с открытым исходным кодом для генерации кода на различных языках программирования, включая Python, C++, Java, PHP, TypeScript, C# и Bash.

Code Llama похож на некоторые известные генераторы кода искусственного интеллекта с открытым исходным кодом, такие как GitHub Copilot и Amazon CodeWhisperer и т. д. Он основан на модели генерации текста Llama 2, которая может генерировать и интерпретировать коды для конкретных естественных языков (особенно английского).

В сообщении в блоге Meta, которым поделились с TechCrunch, они заявили: «В Meta мы твердо верим, что модели искусственного интеллекта, особенно большие языковые модели для кодирования, больше всего выигрывают от открытого подхода. Открытые модели, ориентированные на код, могут стимулировать новые технологии. улучшать жизнь людей. Публикуя модели кода, такие как Code Llama, все сообщество может оценить его возможности, выявить проблемы и устранить уязвимости».

Существует несколько версий Code Llama, включая одну, оптимизированную для Python, и другую, оптимизированную для понимания инструкций. Эти модели были обучены с использованием наборов данных из общедоступных источников в Интернете с упором на подмножества данных, включающие код. Размеры моделей варьируются от 7 до 34 миллиардов параметров и обучаются с использованием 500 миллиардов токенов кода. Среди них версия для Python была доработана на 100 миллиардах токенов кода Python, а версия для понимания инструкций была доработана с использованием отзывов людей-аннотаторов для генерации «полезных» и «безопасных» ответов на вопросы.

Инструменты генерации кода могут иметь огромную популярность как среди программистов, так и среди непрограммистов. Например, GitHub утверждает, что более 400 организаций используют Copilot, который позволяет разработчикам писать код на 55% быстрее, чем раньше. Опрос Stack Overflow также показывает, что 70% людей уже используют или планируют использовать инструменты кодирования искусственного интеллекта для повышения производительности и скорости обучения.

Однако, как и все формы генеративного ИИ, инструменты кодирования могут создавать новые риски. Исследования показывают, что инженеры, использующие инструменты искусственного интеллекта, с большей вероятностью создают уязвимости безопасности в своих приложениях. Кроме того, некоторые модели генерации кода могут обучаться по защищенным авторским правом или ограниченным лицензиям, что потенциально может вызвать проблемы с интеллектуальной собственностью. Существует также риск того, что хакеры попытаются использовать генераторы кода с открытым исходным кодом для написания вредоносного кода.

Code Llama был объединен в команду Meta, но, несмотря на это, в некоторых случаях он все равно может давать неточные или оскорбительные ответы. Meta признает, что в некоторых случаях Code Llama может работать неправильно, поэтому разработчикам необходимо протестировать и настроить его на предмет безопасности, прежде чем развертывать его в своих приложениях.

Несмотря на наличие рисков, Meta накладывает относительно мягкие ограничения на развертывание Code Llama. Разработчикам нужно только согласиться не использовать модель в злонамеренных целях и подать заявку на получение лицензии при ее развертывании на платформе с более чем 700 миллионами активных пользователей в месяц.

Дистрибутив Code Llama с открытым исходным кодом предназначен для поддержки разработчиков программного обеспечения в различных областях, включая исследования, промышленность, проекты с открытым исходным кодом, НПО и корпорации. Meta надеется, что эта инициатива вдохновит других использовать Llama 2 для создания новых и инновационных инструментов для поддержки исследований и разработки коммерческих продуктов.

В целом, Code Llama от Meta представляет собой важный шаг в области искусственного интеллекта, выводя возможности генерации кода на новый уровень. Несмотря на некоторые потенциальные риски и проблемы, по мере того, как технология продолжает развиваться, мы можем ожидать появления новых инноваций и решений, которые лучше удовлетворят потребности разработчиков и пользователей.

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

1 Лайков

Награда
1
комментарий
Поделиться

комментарий

0/400

Нет комментариев

Тема
ETH Breaks $3600
19k Популярность
Gate Derivatives Volume Hits New High
18k Популярность
CPI Data Incoming
61k Популярность
4Join Gate VIP to Win MacBook
31k Популярность
5MicroStrategy Buys More Bitcoin
3k Популярность
6BTC Hits New High
113k Популярность
7My Gate Moments
28k Популярность
8VIP Exclusive Airdrop Carnival
27k Популярность
9Fed June Meeting Minutes
7k Популярность
10Trump Tariff Hikes
18k Популярность

Закрепить

Карта сайта