Sumber: Daftar Alfabet, Pengarang: Bi Andi, Penyunting: Wang Jing
Sumber gambar: Dihasilkan oleh AI Tak Terbatas
Saya hanya mendengar tentang media sosial yang mencoba membuat pengguna bertahan lebih lama, tetapi saya belum pernah mendengar tentang mengambil inisiatif untuk membatasi orang. Buka mata Anda sekarang, Elon Musk menambahkan "perlindungan kecil" ke semua pengguna Twitter, dan semua ini sebenarnya dipaksakan oleh AI?
Saat ini, jumlah maksimum tweet yang dapat dijelajahi pengguna Twitter setiap hari tidak bergantung pada kecepatan tangan atau keengganan untuk begadang, tetapi ada angka yang jelas: 10.000 akun terverifikasi (yaitu, layanan "Bluebird" berbayar), 10.000 tidak terverifikasi Ada 1000 akun, tetapi hanya 500 untuk akun baru yang belum diverifikasi.
Ini adalah standar yang dinaikkan dua kali oleh Musk di hadapan pengguna yang marah. Adapun alasannya, ini adalah "untuk mengatasi tingkat ekstrim dari pengikisan data dan manipulasi sistem."
Dia mengacu pada perusahaan AI, yang membutuhkan data dalam jumlah besar untuk digunakan untuk melatih model mereka. Pada Desember tahun lalu, Musk memutuskan koneksi data dengan OpenAI, dan pada April tahun ini menuduh Microsoft menggunakan data Twitter secara ilegal.
OpenAI menghadapi gugatan class action karena Musk mengambil langkah agresif untuk menghentikan pengikisan data. Ada 16 penggugat dalam gugatan tersebut, semuanya individu, dengan kata lain, peselancar internet biasa. Mereka menuduh OpenAI diam-diam "mengambil 300 miliar kata dari Internet" dan mencuri "sejumlah besar informasi pribadi" dari pengguna Internet itu tanpa izin untuk melatih ChatGPT.
Di satu sisi adalah pengguna dan platform Internet yang telah mengumpulkan banyak konten UGC selama bertahun-tahun, dan di sisi lain adalah perusahaan AIGC yang sedang berkembang.Perang telah dimulai seputar pengambilan data dan keamanan privasi.
01
Pemukul gong dan tambur Jum. Akhirnya akhir pekan, tetapi pengguna Twitter tercengang, pesan kesalahan ditampilkan di layar, mengingatkan mereka bahwa mereka telah melampaui "batas tarif", melanggar aturan Twitter, dan melihat terlalu banyak tweet.
Orang-orang tidak tahu apa artinya ini sama sekali. Bos Twitter Musk melangkah maju dan mengatakan bahwa memang ada batasan tarif, dan mengumumkan: Untuk mengatasi tingkat ekstrim pengikisan data dan manipulasi sistem, pendaftaran terverifikasi, tidak terverifikasi, dan baru tidak diizinkan Akun terverifikasi dibatasi hingga 6000, 600 dan 300 tweet per hari.
Sebelumnya, Musk baru saja mengumumkan bahwa Twitter akan melarang pengguna yang tidak terdaftar untuk menjelajahi konten, yang dapat diterima oleh pengguna. Pembatasan benar-benar dipalu, dan pengguna lumpuh, lalu melihat perbedaan antara verifikasi dan non-verifikasi, dan mengangkat alis mereka: Mungkinkah Anda mencoba menggunakan trik ini untuk mempromosikan "Langganan Blue Bird"? Di area komentar, lebih dari satu pengguna berkomentar: "Sekarang kita harus menggunakan uang untuk menang?"
Suara ketidakpuasan terdengar keras, produk pesaing Twitter Hive, Mastodon, Tumblr, dll. Muncul di topik hangat, dan meme batu nisan Twitter digunakan secara luas. Selama kontroversi, Musk menaikkan standar dua kali menjadi 10.000 tampilan oleh pengguna terverifikasi dan 1.000 tampilan oleh pengguna yang tidak terverifikasi.
Salah satu akun palsu Musk bercanda: "Saya menetapkan batas karena Anda pecandu twitter harus keluar. Saya melakukan hal-hal baik untuk dunia." Ide peningkatan nilai semacam ini bagus, backhand Musk adalah repost, dan dia juga mengirim pesan terpisah, "Pergi dan kunjungi teman dan keluargamu."
Tapi leluconnya adalah lelucon, Musk memberikan penjelasan yang jelas untuk "ujiannya": berurusan dengan perayapan data. Ketidakpuasan pengguna juga terletak pada apakah metode pembatasan saat ini efektif, bukan pada masalah perayapan data.
Seberapa serius startup AI datang ke Twitter untuk "mengikis data"? Dalam sebuah tweet, Musk mengatakan lonjakan lalu lintas memaksa Twitter untuk mengaktifkan server cadangan: ** "Terlalu berlebihan untuk mengaktifkan sejumlah besar server online dalam keadaan darurat hanya untuk membantu beberapa startup AI dengan penilaian yang sangat tinggi." Ini menjengkelkan ."**
Sehari sebelum badai batas saat ini, Tim Sweeney, CEO Epic Games, juga men-tweet untuk mengeluh bahwa Twitter juga membangun tembok. Musk menjawab: "Ratusan (atau bahkan lebih) blok adalah tweet yang merayapi tweet dengan sangat agresif. Data khusus, ke titik di mana hal itu memengaruhi pengalaman pengguna. Bagaimana kita harus melakukannya? Saya terbuka untuk semua ide."
Tim yang baru saja mengeluh, dengan cepat memberikan saran serius, seperti menambahkan larangan perayapan data ke persyaratan layanan Twitter, melindungi platform dengan rekayasa keamanan informasi, dan mengambil tindakan hukum terhadap perusahaan yang menyalahgunakan Twitter secara besar-besaran.
Khususnya, Musk menyebutkan dalam balasannya bahwa tindakan hukum "mutlak" akan diambil terhadap mereka yang mencuri data: "(secara optimis) 2 hingga 3 tahun dari sekarang, menantikan untuk melihat mereka di pengadilan."
Terlepas dari apakah dugaan "menambahkan kayu bakar ke langganan berbayar" adalah hati penjahat, Musk menjunjung tinggi panji privasi pengguna mungkin kurang lebih egois. Pada bulan April, Musk dikabarkan akan mendirikan X.AI, sebuah perusahaan kecerdasan buatan baru, untuk melawan ChatGPT. Jika Anda memang ingin melatih model bahasa yang besar, data pengguna Twitter tentunya hanya untuk Anda sendiri.
Bagaimanapun, dimungkinkan untuk secara aktif membatasi aliran platform.Musk siap melawan startup AI sampai akhir.
02
**Sama seperti Musk yang menyerang untuk membatasi aliran seluruh platform, OpenAI, "penggagas" kegemaran AICG ini dan pencipta ChatGPT, terlibat dalam gugatan class action. **
Gugatan diajukan di Pengadilan Distrik AS untuk Distrik Utara California, dengan 16 penggugat, semuanya anonim, semuanya individu. Gugatannya sangat panjang, dengan 157 halaman penuh, dimulai dengan kalimat dari Stephen Hawking: "Munculnya kecerdasan buatan yang kuat adalah hal terbaik dalam sejarah manusia atau hal terburuk." Selain OpenAI, terdakwa juga memiliki Microsoft, yang telah menyuntikkan puluhan miliar dolar ke dalamnya.
Tuduhan intinya adalah bahwa ChatGPT melanggar "hak cipta dan privasi banyak orang" saat menggunakan data yang dikumpulkan dari Internet untuk "melatih teknologinya".
OpenAI diam-diam mengambil 300 miliar kata dari internet dan menguping "buku, artikel, situs web, dan postingan, termasuk informasi pribadi yang diperoleh tanpa persetujuan," yang melanggar undang-undang privasi, kata dakwaan tersebut. Disebutkan bahwa OpenAI merayapi sejumlah besar data jaringan, termasuk data di media sosial.
Mereka juga menunjukkan bahwa OpenAI memiliki korpus AI eksklusif yang telah mengumpulkan sejumlah besar data pribadi, termasuk data yang diambil dari postingan Reddit dan situs web yang mereka tautkan.
Ini adalah tuduhan dalam hal model pelatihan.Selain itu, penggugat juga mengklaim bahwa interaksi pengguna dengan produk OpenAI dan informasi pribadi dalam produk juga diakses secara ilegal dan disalahgunakan oleh OpenAI dalam skala besar.
Ini bukan pertama kalinya OpenAI menghadapi gugatan class action di Amerika Serikat. Pada November tahun lalu, pemrogram Github meluncurkan gugatan class action terhadap Github, OpenAI, dan Microsoft, menuduh OpenAI diduga melanggar lisensi open source dan menggunakan kode kontribusi mereka untuk melatih alat AI milik GitHub Copilot.
Saat itu ChatGPT belum online, melihat ke belakang sekarang, masalah pelatihan AI sudah terungkap saat itu. Hari ini, tindakan kelas terbaru ditujukan untuk ChatGPT, yang memiliki jangkauan pengguna yang lebih luas dan lebih banyak orang yang telah dilanggar (pada dasarnya semua korban). Lebih penting lagi, di bawah hiruk pikuk AIGC, preseden hukum apa pun dapat memengaruhi masa depan .
Dalam sebuah pernyataan, Clarkson, firma hukum kepentingan publik yang mewakili kasus tersebut, menyebut gugatan kelompok tersebut sebagai kasus federal "tengara" dan peringatan untuk kecerdasan buatan secara keseluruhan.
Dari perspektif ini, beban di pundak OpenAI memang berat.
**OpenAI telah mengalami banyak masalah karena pengambilan data dan keamanan privasi. Platform terkunci dan pengguna saling berhadapan. Ini hanyalah puncak gunung es. **
Di Eropa, OpenAI telah diselidiki oleh banyak negara, bahkan pada April tahun ini, Italia khawatir ChatGPT akan melanggar undang-undang perlindungan data Eropa dan melarang sementara ChatGPT.
Regulasi seluruh bidang kecerdasan buatan semakin maju. Prancis meluncurkan rencana aksi kecerdasan buatan pada bulan Mei. Diantaranya, dalam hal AIGC, regulator privasi Prancis memberikan perhatian khusus pada praktik beberapa model AI yang mengumpulkan data dari Internet dan membuat set data untuk melatih model bahasa besar.
Yang paling penting adalah Undang-Undang Regulasi Kecerdasan Buatan Uni Eropa (UE AI Act), yang saat ini sedang dalam tahap akhir. RUU tersebut kemungkinan akan menjadi model tata kelola AI global.
03
**Platform, pengguna, dan pengawasan, ketiga kekuatan telah membentuk tren pengepungan, bersumpah untuk menetapkan aturan AIGC sesegera mungkin, dan mulai dari titik awal pelatihan model skala besar. **
Di satu sisi, waktu hampir habis dan AIGC berkembang terlalu cepat.
Kami tidak tahu siapa yang dimaksud Musk dengan "startup AI dengan penilaian sangat tinggi". Tapi begitu kata-kata ini keluar, memang banyak yang hits, apalagi ada gelombang pembiayaan di bidang AIGC yang semuanya hot money.
Di antara startup, OpenAI bernilai hampir US$30 miliar, dengan total skala pembiayaan sebesar US$11,3 miliar, menjadikannya yang terkaya di AIGC; diikuti oleh Anthropic, yang terkaya kedua, dengan valuasi lebih dari US$4 miliar. Dan Infleksi, yang mengejutkan Lembah Silikon dengan pembiayaan US$1,3 miliar beberapa hari yang lalu, memiliki valuasi US$4 miliar, dan baru berdiri lebih dari setahun.
Yang besar mungkin belum datang. Infleksi menggunakan model bahasa besarnya sendiri, kali ini mendapat 1,3 miliar dolar AS dan mengumumkan akan membangun 22.000 chip Nvidia H100 untuk membangun cluster kecerdasan buatan terbesar di dunia. Dengan kekuatan komputasi berskala besar, jumlah parameter target dan kumpulan data pasti luar biasa.
** Di sisi lain, ChatGPT lahir entah dari mana, dan tidak mudah untuk "memperbaiki" saat muncul masalah. **Beberapa generasi model bahasa besar OpenAI, kumpulan data GPT-2 memiliki 40GB teks, dan GPT-3 (yaitu, model yang digunakan saat ChatGPT dirilis) memiliki data pelatihan 570GB. tahun ini, ukuran dataset pada dasarnya tidak diungkapkan.
Sejumlah besar data tidak didokumentasikan dengan baik sejak awal. Nicia Sambaswan, mantan ilmuwan riset di Google, mengatakan dalam wawancara bahwa perusahaan teknologi tidak melacak cara mereka mengumpulkan atau menganotasi data pelatihan AI, atau bahkan apa yang ada di kumpulan data.
ChatGPT yang sudah jadi seperti kotak hitam, dan itu adalah kotak hitam yang dibangun di ruang rahasia Sekarang perlu transparan dan dilindungi privasi, seperti mencantumkan data apa yang dirayapi, menjelaskan bagaimana itu akan digunakan selama penggunaan, dan menghapusnya atas permintaan pengguna Sepotong data tertentu sebenarnya sangat sulit.
Peselancar dan regulator internet menggigit OpenAI, ada alasan lain yang tidak dapat diabaikan - di tahun-tahun ketika media sosial berkembang dan tumbuh, kesadaran akan perlindungan data jaringan pribadi masih dalam masa pertumbuhan, dan ketika tiba waktunya untuk bersaing, ditemukan bahwa itu telah meleset terlalu jauh.
Ketika Zuckerberg pertama kali duduk di sidang kongres pada tahun 2018, platform media sosialnya Facebook telah diluncurkan selama 14 tahun. Saat itu, Facebook terjebak dalam "Skandal Cambridge", dan chief technology officer perusahaan tersebut mengatakan bahwa 87 juta pengguna terpengaruh. Itu juga merupakan kesalahan besar yang disebabkan oleh pengikisan data.
Saat Altman duduk di sidang Kongres AS pada Mei tahun ini, anggota kongres sering menyatakan penyesalan atas kurangnya tindakan mereka di era media sosial. **
Model besar satu demi satu masih dilatih, dan pengambilan data adalah sebuah utas.Hanya dengan memahaminya kami dapat berharap untuk menjernihkan kebingungan AIGC.
Bahan referensi:
Teknologi Sina: "Musk dan Microsoft di bar? Twitter menuduh Microsoft menggunakan datanya secara ilegal »
Pemrogram kuda hitam: "Pemrogram ini telah menggugat GitHub!" Permintaan ganti rugi 64,9 miliar"
Berita Jiemian: "RUU AI UE dirilis, bagaimana skor OpenAI dan perusahaan lain, dan apa perselisihan intinya?" "
Teknologi Tencent: "Kehausan akan data merugikan OpenAI? Beberapa negara menuduhnya melanggar undang-undang perlindungan data
Teknologi Netease: "ChatGPT dilanjutkan secara online di Italia tetapi masalah regulasi OpenAI baru saja dimulai"
Lihat Asli
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Musk tangguh di OpenAI, dan pengguna mengalami kemalangan
Sumber: Daftar Alfabet, Pengarang: Bi Andi, Penyunting: Wang Jing
Saya hanya mendengar tentang media sosial yang mencoba membuat pengguna bertahan lebih lama, tetapi saya belum pernah mendengar tentang mengambil inisiatif untuk membatasi orang. Buka mata Anda sekarang, Elon Musk menambahkan "perlindungan kecil" ke semua pengguna Twitter, dan semua ini sebenarnya dipaksakan oleh AI?
Saat ini, jumlah maksimum tweet yang dapat dijelajahi pengguna Twitter setiap hari tidak bergantung pada kecepatan tangan atau keengganan untuk begadang, tetapi ada angka yang jelas: 10.000 akun terverifikasi (yaitu, layanan "Bluebird" berbayar), 10.000 tidak terverifikasi Ada 1000 akun, tetapi hanya 500 untuk akun baru yang belum diverifikasi.
Ini adalah standar yang dinaikkan dua kali oleh Musk di hadapan pengguna yang marah. Adapun alasannya, ini adalah "untuk mengatasi tingkat ekstrim dari pengikisan data dan manipulasi sistem."
Dia mengacu pada perusahaan AI, yang membutuhkan data dalam jumlah besar untuk digunakan untuk melatih model mereka. Pada Desember tahun lalu, Musk memutuskan koneksi data dengan OpenAI, dan pada April tahun ini menuduh Microsoft menggunakan data Twitter secara ilegal.
OpenAI menghadapi gugatan class action karena Musk mengambil langkah agresif untuk menghentikan pengikisan data. Ada 16 penggugat dalam gugatan tersebut, semuanya individu, dengan kata lain, peselancar internet biasa. Mereka menuduh OpenAI diam-diam "mengambil 300 miliar kata dari Internet" dan mencuri "sejumlah besar informasi pribadi" dari pengguna Internet itu tanpa izin untuk melatih ChatGPT.
Di satu sisi adalah pengguna dan platform Internet yang telah mengumpulkan banyak konten UGC selama bertahun-tahun, dan di sisi lain adalah perusahaan AIGC yang sedang berkembang.Perang telah dimulai seputar pengambilan data dan keamanan privasi.
01
Pemukul gong dan tambur Jum. Akhirnya akhir pekan, tetapi pengguna Twitter tercengang, pesan kesalahan ditampilkan di layar, mengingatkan mereka bahwa mereka telah melampaui "batas tarif", melanggar aturan Twitter, dan melihat terlalu banyak tweet.
Orang-orang tidak tahu apa artinya ini sama sekali. Bos Twitter Musk melangkah maju dan mengatakan bahwa memang ada batasan tarif, dan mengumumkan: Untuk mengatasi tingkat ekstrim pengikisan data dan manipulasi sistem, pendaftaran terverifikasi, tidak terverifikasi, dan baru tidak diizinkan Akun terverifikasi dibatasi hingga 6000, 600 dan 300 tweet per hari.
Suara ketidakpuasan terdengar keras, produk pesaing Twitter Hive, Mastodon, Tumblr, dll. Muncul di topik hangat, dan meme batu nisan Twitter digunakan secara luas. Selama kontroversi, Musk menaikkan standar dua kali menjadi 10.000 tampilan oleh pengguna terverifikasi dan 1.000 tampilan oleh pengguna yang tidak terverifikasi.
Seberapa serius startup AI datang ke Twitter untuk "mengikis data"? Dalam sebuah tweet, Musk mengatakan lonjakan lalu lintas memaksa Twitter untuk mengaktifkan server cadangan: ** "Terlalu berlebihan untuk mengaktifkan sejumlah besar server online dalam keadaan darurat hanya untuk membantu beberapa startup AI dengan penilaian yang sangat tinggi." Ini menjengkelkan ."**
Sehari sebelum badai batas saat ini, Tim Sweeney, CEO Epic Games, juga men-tweet untuk mengeluh bahwa Twitter juga membangun tembok. Musk menjawab: "Ratusan (atau bahkan lebih) blok adalah tweet yang merayapi tweet dengan sangat agresif. Data khusus, ke titik di mana hal itu memengaruhi pengalaman pengguna. Bagaimana kita harus melakukannya? Saya terbuka untuk semua ide."
Tim yang baru saja mengeluh, dengan cepat memberikan saran serius, seperti menambahkan larangan perayapan data ke persyaratan layanan Twitter, melindungi platform dengan rekayasa keamanan informasi, dan mengambil tindakan hukum terhadap perusahaan yang menyalahgunakan Twitter secara besar-besaran.
Khususnya, Musk menyebutkan dalam balasannya bahwa tindakan hukum "mutlak" akan diambil terhadap mereka yang mencuri data: "(secara optimis) 2 hingga 3 tahun dari sekarang, menantikan untuk melihat mereka di pengadilan."
Terlepas dari apakah dugaan "menambahkan kayu bakar ke langganan berbayar" adalah hati penjahat, Musk menjunjung tinggi panji privasi pengguna mungkin kurang lebih egois. Pada bulan April, Musk dikabarkan akan mendirikan X.AI, sebuah perusahaan kecerdasan buatan baru, untuk melawan ChatGPT. Jika Anda memang ingin melatih model bahasa yang besar, data pengguna Twitter tentunya hanya untuk Anda sendiri.
Bagaimanapun, dimungkinkan untuk secara aktif membatasi aliran platform.Musk siap melawan startup AI sampai akhir.
02
**Sama seperti Musk yang menyerang untuk membatasi aliran seluruh platform, OpenAI, "penggagas" kegemaran AICG ini dan pencipta ChatGPT, terlibat dalam gugatan class action. **
Gugatan diajukan di Pengadilan Distrik AS untuk Distrik Utara California, dengan 16 penggugat, semuanya anonim, semuanya individu. Gugatannya sangat panjang, dengan 157 halaman penuh, dimulai dengan kalimat dari Stephen Hawking: "Munculnya kecerdasan buatan yang kuat adalah hal terbaik dalam sejarah manusia atau hal terburuk." Selain OpenAI, terdakwa juga memiliki Microsoft, yang telah menyuntikkan puluhan miliar dolar ke dalamnya.
Tuduhan intinya adalah bahwa ChatGPT melanggar "hak cipta dan privasi banyak orang" saat menggunakan data yang dikumpulkan dari Internet untuk "melatih teknologinya".
OpenAI diam-diam mengambil 300 miliar kata dari internet dan menguping "buku, artikel, situs web, dan postingan, termasuk informasi pribadi yang diperoleh tanpa persetujuan," yang melanggar undang-undang privasi, kata dakwaan tersebut. Disebutkan bahwa OpenAI merayapi sejumlah besar data jaringan, termasuk data di media sosial.
Mereka juga menunjukkan bahwa OpenAI memiliki korpus AI eksklusif yang telah mengumpulkan sejumlah besar data pribadi, termasuk data yang diambil dari postingan Reddit dan situs web yang mereka tautkan.
Ini adalah tuduhan dalam hal model pelatihan.Selain itu, penggugat juga mengklaim bahwa interaksi pengguna dengan produk OpenAI dan informasi pribadi dalam produk juga diakses secara ilegal dan disalahgunakan oleh OpenAI dalam skala besar.
Ini bukan pertama kalinya OpenAI menghadapi gugatan class action di Amerika Serikat. Pada November tahun lalu, pemrogram Github meluncurkan gugatan class action terhadap Github, OpenAI, dan Microsoft, menuduh OpenAI diduga melanggar lisensi open source dan menggunakan kode kontribusi mereka untuk melatih alat AI milik GitHub Copilot.
Saat itu ChatGPT belum online, melihat ke belakang sekarang, masalah pelatihan AI sudah terungkap saat itu. Hari ini, tindakan kelas terbaru ditujukan untuk ChatGPT, yang memiliki jangkauan pengguna yang lebih luas dan lebih banyak orang yang telah dilanggar (pada dasarnya semua korban). Lebih penting lagi, di bawah hiruk pikuk AIGC, preseden hukum apa pun dapat memengaruhi masa depan .
Dalam sebuah pernyataan, Clarkson, firma hukum kepentingan publik yang mewakili kasus tersebut, menyebut gugatan kelompok tersebut sebagai kasus federal "tengara" dan peringatan untuk kecerdasan buatan secara keseluruhan.
Dari perspektif ini, beban di pundak OpenAI memang berat.
**OpenAI telah mengalami banyak masalah karena pengambilan data dan keamanan privasi. Platform terkunci dan pengguna saling berhadapan. Ini hanyalah puncak gunung es. **
Di Eropa, OpenAI telah diselidiki oleh banyak negara, bahkan pada April tahun ini, Italia khawatir ChatGPT akan melanggar undang-undang perlindungan data Eropa dan melarang sementara ChatGPT.
Regulasi seluruh bidang kecerdasan buatan semakin maju. Prancis meluncurkan rencana aksi kecerdasan buatan pada bulan Mei. Diantaranya, dalam hal AIGC, regulator privasi Prancis memberikan perhatian khusus pada praktik beberapa model AI yang mengumpulkan data dari Internet dan membuat set data untuk melatih model bahasa besar.
Yang paling penting adalah Undang-Undang Regulasi Kecerdasan Buatan Uni Eropa (UE AI Act), yang saat ini sedang dalam tahap akhir. RUU tersebut kemungkinan akan menjadi model tata kelola AI global.
03
**Platform, pengguna, dan pengawasan, ketiga kekuatan telah membentuk tren pengepungan, bersumpah untuk menetapkan aturan AIGC sesegera mungkin, dan mulai dari titik awal pelatihan model skala besar. **
Di satu sisi, waktu hampir habis dan AIGC berkembang terlalu cepat.
Kami tidak tahu siapa yang dimaksud Musk dengan "startup AI dengan penilaian sangat tinggi". Tapi begitu kata-kata ini keluar, memang banyak yang hits, apalagi ada gelombang pembiayaan di bidang AIGC yang semuanya hot money.
Di antara startup, OpenAI bernilai hampir US$30 miliar, dengan total skala pembiayaan sebesar US$11,3 miliar, menjadikannya yang terkaya di AIGC; diikuti oleh Anthropic, yang terkaya kedua, dengan valuasi lebih dari US$4 miliar. Dan Infleksi, yang mengejutkan Lembah Silikon dengan pembiayaan US$1,3 miliar beberapa hari yang lalu, memiliki valuasi US$4 miliar, dan baru berdiri lebih dari setahun.
Yang besar mungkin belum datang. Infleksi menggunakan model bahasa besarnya sendiri, kali ini mendapat 1,3 miliar dolar AS dan mengumumkan akan membangun 22.000 chip Nvidia H100 untuk membangun cluster kecerdasan buatan terbesar di dunia. Dengan kekuatan komputasi berskala besar, jumlah parameter target dan kumpulan data pasti luar biasa.
** Di sisi lain, ChatGPT lahir entah dari mana, dan tidak mudah untuk "memperbaiki" saat muncul masalah. **Beberapa generasi model bahasa besar OpenAI, kumpulan data GPT-2 memiliki 40GB teks, dan GPT-3 (yaitu, model yang digunakan saat ChatGPT dirilis) memiliki data pelatihan 570GB. tahun ini, ukuran dataset pada dasarnya tidak diungkapkan.
Sejumlah besar data tidak didokumentasikan dengan baik sejak awal. Nicia Sambaswan, mantan ilmuwan riset di Google, mengatakan dalam wawancara bahwa perusahaan teknologi tidak melacak cara mereka mengumpulkan atau menganotasi data pelatihan AI, atau bahkan apa yang ada di kumpulan data.
ChatGPT yang sudah jadi seperti kotak hitam, dan itu adalah kotak hitam yang dibangun di ruang rahasia Sekarang perlu transparan dan dilindungi privasi, seperti mencantumkan data apa yang dirayapi, menjelaskan bagaimana itu akan digunakan selama penggunaan, dan menghapusnya atas permintaan pengguna Sepotong data tertentu sebenarnya sangat sulit.
Peselancar dan regulator internet menggigit OpenAI, ada alasan lain yang tidak dapat diabaikan - di tahun-tahun ketika media sosial berkembang dan tumbuh, kesadaran akan perlindungan data jaringan pribadi masih dalam masa pertumbuhan, dan ketika tiba waktunya untuk bersaing, ditemukan bahwa itu telah meleset terlalu jauh.
Ketika Zuckerberg pertama kali duduk di sidang kongres pada tahun 2018, platform media sosialnya Facebook telah diluncurkan selama 14 tahun. Saat itu, Facebook terjebak dalam "Skandal Cambridge", dan chief technology officer perusahaan tersebut mengatakan bahwa 87 juta pengguna terpengaruh. Itu juga merupakan kesalahan besar yang disebabkan oleh pengikisan data.
Saat Altman duduk di sidang Kongres AS pada Mei tahun ini, anggota kongres sering menyatakan penyesalan atas kurangnya tindakan mereka di era media sosial. **
Model besar satu demi satu masih dilatih, dan pengambilan data adalah sebuah utas.Hanya dengan memahaminya kami dapat berharap untuk menjernihkan kebingungan AIGC.
Bahan referensi:
Teknologi Sina: "Musk dan Microsoft di bar? Twitter menuduh Microsoft menggunakan datanya secara ilegal »
Pemrogram kuda hitam: "Pemrogram ini telah menggugat GitHub!" Permintaan ganti rugi 64,9 miliar"
Berita Jiemian: "RUU AI UE dirilis, bagaimana skor OpenAI dan perusahaan lain, dan apa perselisihan intinya?" "
Teknologi Tencent: "Kehausan akan data merugikan OpenAI? Beberapa negara menuduhnya melanggar undang-undang perlindungan data
Teknologi Netease: "ChatGPT dilanjutkan secara online di Italia tetapi masalah regulasi OpenAI baru saja dimulai"