Meta phát hành mã Llama: Mô hình tạo mã nguồn mở AI

Trong lĩnh vực trí tuệ nhân tạo khốc liệt, Meta đã phát hành Code Llama, một hệ thống máy học để tạo và giải thích mã, nhằm mục đích tạo nên sự nổi bật. Công ty đang chia sẻ sự đổi mới này dưới dạng nguồn mở, thúc đẩy hơn nữa lĩnh vực trí tuệ nhân tạo.

Meta, với cách tiếp cận sáng tạo và cởi mở, trước đó đã phát hành một loạt mô hình AI để tạo văn bản, dịch ngôn ngữ và tạo âm thanh. Ngày nay, họ mở rộng nỗ lực này sang lĩnh vực mã, thông qua Code Llama mã nguồn mở để tạo mã bằng nhiều ngôn ngữ lập trình khác nhau, bao gồm Python, C++, Java, PHP, TypeScript, C# và Bash.

Code Llama tương tự như một số trình tạo mã trí tuệ nhân tạo nguồn mở nổi tiếng như GitHub Copilot và Amazon CodeWhisperer, v.v. Nó dựa trên mô hình tạo văn bản Llama 2, có thể tạo và giải thích mã cho các ngôn ngữ tự nhiên cụ thể (đặc biệt là tiếng Anh).

Trong một bài đăng trên blog mà Meta chia sẻ với TechCrunch, họ tuyên bố: "Tại Meta, chúng tôi tin tưởng chắc chắn rằng các mô hình AI, đặc biệt là các mô hình ngôn ngữ lớn để mã hóa, được hưởng lợi nhiều nhất từ cách tiếp cận mở. Các mô hình mở, tập trung vào mã có thể thúc đẩy các công nghệ mới được phát triển để cải thiện cuộc sống của mọi người. Bằng cách xuất bản các mô hình mã như Code Llama, toàn bộ cộng đồng có thể đánh giá khả năng của nó, xác định vấn đề và khắc phục các lỗ hổng.”

Có một số phiên bản Code Llama, bao gồm một phiên bản được tối ưu hóa cho Python và một phiên bản được tinh chỉnh để hiểu hướng dẫn. Các mô hình này được đào tạo bằng cách sử dụng tập dữ liệu từ các nguồn công khai trên web, tập trung vào các tập hợp dữ liệu con bao gồm mã. Kích thước mô hình dao động từ 7 tỷ đến 34 tỷ tham số và được đào tạo bằng cách sử dụng 500 tỷ mã thông báo. Trong số đó, phiên bản dành riêng cho Python đã được tinh chỉnh trên 100 tỷ mã thông báo Python và phiên bản hiểu hướng dẫn đã được tinh chỉnh bằng cách sử dụng phản hồi từ người chú thích để tạo ra câu trả lời "hữu ích" và "an toàn" cho các câu hỏi.

Các công cụ tạo mã có thể có sức hấp dẫn rất lớn đối với các lập trình viên cũng như những người không lập trình. Ví dụ: GitHub tuyên bố rằng hơn 400 tổ chức đang sử dụng Copilot, cho phép các nhà phát triển viết mã nhanh hơn 55% so với trước đây. Khảo sát của Stack Overflow cũng cho thấy 70% người dân đã sử dụng hoặc có kế hoạch sử dụng các công cụ mã hóa trí tuệ nhân tạo để cải thiện năng suất và tốc độ học tập.

Tuy nhiên, giống như tất cả các dạng AI tổng quát, các công cụ mã hóa có thể gây ra những rủi ro mới. Nghiên cứu cho thấy các kỹ sư sử dụng các công cụ trí tuệ nhân tạo có nhiều khả năng đưa các lỗ hổng bảo mật vào ứng dụng của họ hơn. Ngoài ra, một số mô hình tạo mã có thể được đào tạo theo giấy phép có bản quyền hoặc bị hạn chế, có khả năng gây ra các vấn đề về sở hữu trí tuệ. Ngoài ra còn có nguy cơ tin tặc cố gắng sử dụng các trình tạo mã nguồn mở để viết mã độc.

Code Llama đã được đưa vào nhóm đỏ trong Meta, nhưng bất chấp điều này, nó vẫn có thể tạo ra những phản hồi không chính xác hoặc mang tính xúc phạm trong một số trường hợp. Meta thừa nhận rằng Code Llama có thể gặp lỗi trong một số trường hợp, vì vậy các nhà phát triển cần kiểm tra và điều chỉnh nó để đảm bảo an toàn trước khi triển khai nó trong ứng dụng của họ.

Mặc dù có những rủi ro nhưng Meta đặt ra những hạn chế tương đối lỏng lẻo trong việc triển khai Code Llama. Các nhà phát triển chỉ cần đồng ý không sử dụng mô hình cho mục đích xấu và cần xin giấy phép khi triển khai trên nền tảng có hơn 700 triệu người dùng hoạt động hàng tháng.

Việc phân phối nguồn mở của Code Llama nhằm mục đích hỗ trợ các kỹ sư phần mềm trong nhiều lĩnh vực khác nhau, bao gồm nghiên cứu, công nghiệp, các dự án nguồn mở, tổ chức phi chính phủ và các tập đoàn. Meta hy vọng sáng kiến này sẽ truyền cảm hứng cho những người khác sử dụng Llama 2 để tạo ra các công cụ mới và sáng tạo nhằm hỗ trợ nghiên cứu và phát triển sản phẩm thương mại.

Nhìn chung, Code Llama của Meta thể hiện một bước tiến quan trọng trong lĩnh vực trí tuệ nhân tạo, đẩy sức mạnh tạo mã lên một tầm cao mới. Bất chấp một số rủi ro và thách thức tiềm ẩn, khi công nghệ tiếp tục phát triển, chúng ta có thể kỳ vọng sẽ thấy nhiều cải tiến và giải pháp xuất hiện hơn để đáp ứng tốt hơn nhu cầu của nhà phát triển và người dùng.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)