Di bidang kecerdasan buatan yang sengit, Meta merilis Code Llama, sebuah sistem pembelajaran mesin untuk menghasilkan dan menafsirkan kode, yang bertujuan untuk membuat gebrakan. Perusahaan membagikan inovasi ini sebagai sumber terbuka, yang semakin memajukan bidang kecerdasan buatan.
Meta, dengan pendekatannya yang inovatif dan terbuka, sebelumnya telah merilis serangkaian model AI untuk menghasilkan teks, menerjemahkan bahasa, dan membuat audio. Saat ini, mereka memperluas upaya ini ke bidang kode, melalui Code Llama open source untuk menghasilkan kode dalam berbagai bahasa pemrograman, termasuk Python, C++, Java, PHP, TypeScript, C# dan Bash.
Code Llama mirip dengan beberapa generator kode kecerdasan buatan sumber terbuka yang terkenal, seperti GitHub Copilot dan Amazon CodeWhisperer, dll. Ini didasarkan pada model pembuatan teks Llama 2, yang dapat menghasilkan dan menafsirkan kode untuk bahasa alami tertentu (terutama bahasa Inggris).
Dalam postingan blog yang dibagikan Meta dengan TechCrunch, mereka menyatakan: "Di Meta, kami sangat yakin bahwa model AI, terutama model bahasa besar untuk pengkodean, mendapat manfaat paling besar dari pendekatan terbuka. Model terbuka dan berfokus pada kode dapat mendorong Teknologi baru dikembangkan untuk meningkatkan kehidupan masyarakat. Dengan menerbitkan model kode seperti Code Llama, seluruh komunitas dapat menilai kemampuannya, mengidentifikasi masalah, dan memperbaiki kerentanan.”
Ada beberapa versi Kode Llama, termasuk satu yang dioptimalkan untuk Python dan satu lagi disesuaikan untuk memahami instruksi. Model ini dilatih menggunakan kumpulan data dari sumber yang tersedia untuk umum di web, dengan fokus pada subkumpulan data yang menyertakan kode. Ukuran model berkisar antara 7 miliar hingga 34 miliar parameter dan dilatih menggunakan 500 miliar token kode. Diantaranya, versi khusus Python telah disesuaikan dengan 100 miliar token kode Python, dan versi pemahaman instruksi telah disesuaikan menggunakan umpan balik dari anotator manusia untuk menghasilkan jawaban yang "berguna" dan "aman" atas pertanyaan.
Alat pembuat kode dapat memiliki daya tarik yang besar di kalangan pemrogram dan non-pemrogram. Misalnya, GitHub mengklaim bahwa lebih dari 400 organisasi menggunakan Copilot, yang memungkinkan pengembang membuat kode 55% lebih cepat dari sebelumnya. Survei Stack Overflow juga menunjukkan bahwa 70% orang sudah menggunakan atau berencana menggunakan alat pengkodean kecerdasan buatan untuk meningkatkan produktivitas dan kecepatan belajar.
Namun, seperti semua bentuk AI generatif, alat pengkodean dapat menimbulkan risiko baru. Penelitian menunjukkan bahwa insinyur yang menggunakan alat kecerdasan buatan lebih cenderung menimbulkan kerentanan keamanan dalam aplikasi mereka. Selain itu, beberapa model pembuatan kode mungkin dilatih di bawah lisensi yang dilindungi hak cipta atau terbatas, sehingga berpotensi menimbulkan masalah kekayaan intelektual. Ada juga risiko peretas mencoba menggunakan generator kode sumber terbuka untuk menulis kode berbahaya.
Kode Llama telah dimasukkan dalam tim merah dalam Meta, namun meskipun demikian, dalam beberapa kasus masih menghasilkan respons yang tidak akurat atau menyinggung. Meta mengakui bahwa Kode Llama bisa salah dalam beberapa kasus, sehingga pengembang perlu menguji dan menyesuaikan keamanannya sebelum menerapkannya dalam aplikasi mereka.
Meskipun terdapat risiko, Meta menerapkan pembatasan yang relatif longgar pada penerapan Kode Llama. Pengembang hanya perlu setuju untuk tidak menggunakan model tersebut untuk tujuan jahat, dan perlu mengajukan lisensi ketika menerapkannya pada platform dengan lebih dari 700 juta pengguna aktif bulanan.
Distribusi sumber terbuka Code Llama bertujuan untuk mendukung insinyur perangkat lunak di berbagai bidang, termasuk penelitian, industri, proyek sumber terbuka, LSM, dan perusahaan. Meta berharap inisiatif ini akan menginspirasi orang lain untuk menggunakan Llama 2 untuk menciptakan alat baru dan inovatif guna mendukung penelitian dan pengembangan produk komersial.
Secara keseluruhan, Code Llama Meta mewakili kemajuan penting dalam bidang kecerdasan buatan, mendorong kekuatan pembuatan kode ke tingkat yang baru. Meskipun ada beberapa potensi risiko dan tantangan, seiring dengan terus berkembangnya teknologi, kita dapat melihat lebih banyak inovasi dan solusi muncul untuk memenuhi kebutuhan pengembang dan pengguna dengan lebih baik.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Meta Merilis Kode Llama: Model Pembuatan Kode AI Sumber Terbuka
Di bidang kecerdasan buatan yang sengit, Meta merilis Code Llama, sebuah sistem pembelajaran mesin untuk menghasilkan dan menafsirkan kode, yang bertujuan untuk membuat gebrakan. Perusahaan membagikan inovasi ini sebagai sumber terbuka, yang semakin memajukan bidang kecerdasan buatan.
Meta, dengan pendekatannya yang inovatif dan terbuka, sebelumnya telah merilis serangkaian model AI untuk menghasilkan teks, menerjemahkan bahasa, dan membuat audio. Saat ini, mereka memperluas upaya ini ke bidang kode, melalui Code Llama open source untuk menghasilkan kode dalam berbagai bahasa pemrograman, termasuk Python, C++, Java, PHP, TypeScript, C# dan Bash.
Code Llama mirip dengan beberapa generator kode kecerdasan buatan sumber terbuka yang terkenal, seperti GitHub Copilot dan Amazon CodeWhisperer, dll. Ini didasarkan pada model pembuatan teks Llama 2, yang dapat menghasilkan dan menafsirkan kode untuk bahasa alami tertentu (terutama bahasa Inggris).
Dalam postingan blog yang dibagikan Meta dengan TechCrunch, mereka menyatakan: "Di Meta, kami sangat yakin bahwa model AI, terutama model bahasa besar untuk pengkodean, mendapat manfaat paling besar dari pendekatan terbuka. Model terbuka dan berfokus pada kode dapat mendorong Teknologi baru dikembangkan untuk meningkatkan kehidupan masyarakat. Dengan menerbitkan model kode seperti Code Llama, seluruh komunitas dapat menilai kemampuannya, mengidentifikasi masalah, dan memperbaiki kerentanan.”
Ada beberapa versi Kode Llama, termasuk satu yang dioptimalkan untuk Python dan satu lagi disesuaikan untuk memahami instruksi. Model ini dilatih menggunakan kumpulan data dari sumber yang tersedia untuk umum di web, dengan fokus pada subkumpulan data yang menyertakan kode. Ukuran model berkisar antara 7 miliar hingga 34 miliar parameter dan dilatih menggunakan 500 miliar token kode. Diantaranya, versi khusus Python telah disesuaikan dengan 100 miliar token kode Python, dan versi pemahaman instruksi telah disesuaikan menggunakan umpan balik dari anotator manusia untuk menghasilkan jawaban yang "berguna" dan "aman" atas pertanyaan.
Alat pembuat kode dapat memiliki daya tarik yang besar di kalangan pemrogram dan non-pemrogram. Misalnya, GitHub mengklaim bahwa lebih dari 400 organisasi menggunakan Copilot, yang memungkinkan pengembang membuat kode 55% lebih cepat dari sebelumnya. Survei Stack Overflow juga menunjukkan bahwa 70% orang sudah menggunakan atau berencana menggunakan alat pengkodean kecerdasan buatan untuk meningkatkan produktivitas dan kecepatan belajar.
Namun, seperti semua bentuk AI generatif, alat pengkodean dapat menimbulkan risiko baru. Penelitian menunjukkan bahwa insinyur yang menggunakan alat kecerdasan buatan lebih cenderung menimbulkan kerentanan keamanan dalam aplikasi mereka. Selain itu, beberapa model pembuatan kode mungkin dilatih di bawah lisensi yang dilindungi hak cipta atau terbatas, sehingga berpotensi menimbulkan masalah kekayaan intelektual. Ada juga risiko peretas mencoba menggunakan generator kode sumber terbuka untuk menulis kode berbahaya.
Kode Llama telah dimasukkan dalam tim merah dalam Meta, namun meskipun demikian, dalam beberapa kasus masih menghasilkan respons yang tidak akurat atau menyinggung. Meta mengakui bahwa Kode Llama bisa salah dalam beberapa kasus, sehingga pengembang perlu menguji dan menyesuaikan keamanannya sebelum menerapkannya dalam aplikasi mereka.
Meskipun terdapat risiko, Meta menerapkan pembatasan yang relatif longgar pada penerapan Kode Llama. Pengembang hanya perlu setuju untuk tidak menggunakan model tersebut untuk tujuan jahat, dan perlu mengajukan lisensi ketika menerapkannya pada platform dengan lebih dari 700 juta pengguna aktif bulanan.
Distribusi sumber terbuka Code Llama bertujuan untuk mendukung insinyur perangkat lunak di berbagai bidang, termasuk penelitian, industri, proyek sumber terbuka, LSM, dan perusahaan. Meta berharap inisiatif ini akan menginspirasi orang lain untuk menggunakan Llama 2 untuk menciptakan alat baru dan inovatif guna mendukung penelitian dan pengembangan produk komersial.
Secara keseluruhan, Code Llama Meta mewakili kemajuan penting dalam bidang kecerdasan buatan, mendorong kekuatan pembuatan kode ke tingkat yang baru. Meskipun ada beberapa potensi risiko dan tantangan, seiring dengan terus berkembangnya teknologi, kita dapat melihat lebih banyak inovasi dan solusi muncul untuk memenuhi kebutuhan pengembang dan pengguna dengan lebih baik.