Sumber gambar: Dihasilkan oleh alat AI Tak Terbatas
"Perang seribu model" yang dipicu oleh GPT secara bertahap memasuki "permainan penentu data".
"Data berkualitas tinggi" dan "volume data" telah menjadi kunci bagi model besar untuk dengan cepat membangun penghalang dan bersaing untuk masa depan. Menurut Wu Chao, Direktur Komite Pakar CITIC Think Tank dan Direktur China Securities Research Institute, "Di masa mendatang, 20% model akan ditentukan oleh algoritme, dan 80% oleh kualitas data. Selanjutnya, data berkualitas tinggi akan menjadi kunci untuk meningkatkan kinerja model."
Namun data faktual menjadi langka. Bot bertenaga AI seperti ChatGPT akan segera "kehabisan teks di alam semesta".
Studi bersama "Apakah kita akan kehabisan data?" "Memberikan batas waktu: Data yang berasal dari manusia mungkin menjadi semakin langka di masa mendatang, dan data bahasa alami berkualitas tinggi mungkin akan habis oleh model bahasa besar segera setelah tahun 2026.
Bagaimana memastikan aliran data yang stabil untuk memasok pelatihan model besar? Sementara organisasi open source internasional dan raksasa bisnis terus mencoba, mereka juga menderita perselisihan Ada pertanyaan tak berujung tentang perlindungan hak milik, privasi data, dan keamanan jaringan yang ditimbulkan oleh pengumpulan data.
Pada bulan Maret tahun ini, banyak pengguna Windows 11 melaporkan bahwa mereka "dipaksa untuk membuka jendela", meminta "data Anda akan diproses di luar negara atau wilayah tempat Anda berada", dan tidak ada opsi untuk "membatalkan", dan mereka hanya dapat mengklik opsi "berikutnya", jika tidak, mereka tidak akan dapat masuk ke desktop sistem.
Langkah tersebut memicu kekhawatiran di kalangan pengguna sistem operasi Windows tentang kebocoran data pribadi ke luar negeri. Dalam hal ini, Microsoft menyatakan bahwa setelah pengguna memperbarui dan menggunakan Windows 11, data akan dikirim ke luar China. Karena pusat pendaftaran perangkat lunak Microsoft berada di Amerika Serikat, setelah ChatGPT diintegrasikan ke dalam pencarian Bing dan browser Edge, ia juga memerlukan dukungan pusat data AS, sehingga data pengguna China dapat dikirim ke luar negeri.
Teman baik Microsoft Open AI, meski mendapat manfaat dari data masif sebelumnya, juga menemui keraguan. Pada akhir Juni, OpenAI terkena gugatan class action, dituduh mencuri "sejumlah besar data pribadi" untuk melatih ChatGPT. Musk memberlakukan batasan sementara jumlah tweet yang dibaca pada 1 Juli karena alasan ini.
Alphabet telah memperingatkan karyawan untuk tidak menggunakan chatbots secara membabi buta, termasuk Bard Google, yang dipromosikannya di pasar global. Pada 1 Juni, Google memperbarui pernyataan privasinya, memperingatkan pengguna untuk "tolong jangan melibatkan informasi rahasia atau sensitif dalam percakapan dengan Bard."
Di satu sisi, Crazy All-in membangun roda gila data untuk pengguna global, dan di sisi lain, berhati-hati dengan data bisnisnya sendiri "standar ganda" semacam ini telah memaksa sebagian besar perusahaan di seluruh dunia untuk mengadopsi "pertahanan aktif". Banyak perusahaan di seluruh dunia, seperti Samsung dan Amazon, telah mulai memasang pagar pembatas untuk AI chatbots. Dan Microsoft dan Google meluncurkan alat dialog tepat waktu untuk pelanggan bisnis, menjamin bahwa data tidak akan terserap ke dalam model AI publik, tetapi pelanggan harus membayar biaya tinggi untuk ini.
Sehubungan dengan risiko yang mungkin timbul dari cara AIGC menggunakan dan memperoleh data, regulator di berbagai negara telah melakukan intervensi.
Regulator data Italia Garante mengumumkan pelarangan penuh terhadap ChatGPT pada 31 Maret 2023 dan melarang OpenAI memproses data pengguna Italia. Setelah OpenAI berjanji untuk melakukan peningkatan yang sesuai, ChatGPT melanjutkan layanannya di Italia.
Selanjutnya, Jerman, Prancis, dan Irlandia juga mengambil tindakan balasan. Spanyol meminta Dewan Perlindungan Data Eropa (EDPB) untuk mengevaluasi masalah perlindungan privasi ChatGPT. Komisi Perlindungan Informasi Pribadi Korea juga menyatakan bahwa pihaknya meluncurkan penyelidikan atas kebocoran data pengguna ChatGPT Korea.
Negara kita juga bertindak lebih awal. Pada tanggal 13 Juli, ** Administrasi Dunia Maya Negara Tiongkok bersama-sama mengeluarkan "Langkah Sementara untuk Pengelolaan Layanan Kecerdasan Buatan Generatif"** (disebut sebagai "Langkah Sementara"). Ini adalah undang-undang khusus pertama negara saya di bidang kecerdasan buatan generatif.
"Tindakan Sementara" mengklarifikasi prinsip untuk pertama kalinya, "Jika penyediaan layanan kecerdasan buatan generatif dari luar Republik Rakyat Tiongkok tidak mematuhi undang-undang, peraturan administratif, dan ketentuan tindakan ini, departemen informasi jaringan nasional harus memberi tahu lembaga terkait untuk mengambil tindakan teknis dan tindakan lain yang diperlukan untuk menghadapinya."
Selain itu, ini juga mengklarifikasi ruang lingkup penerapan Tindakan: ini berlaku untuk layanan yang menghasilkan teks, gambar, audio, video, dan konten lainnya untuk publik di China, dan dengan jelas mengecualikan aktivitas R&D dan aplikasi yang tidak memberikan layanan kepada publik domestik dari ruang lingkup aplikasi.
Ini berarti **penyedia layanan AIGC luar negeri (apakah itu lapisan model atau lapisan aplikasi) akan tunduk pada ketentuan yang relevan dari "Tindakan Sementara", apakah mereka menyediakan layanan terkait langsung ke China, atau menyediakan layanan tidak langsung melalui antarmuka API atau "enkapsulasi" atau "bersarang". Untuk produsen dalam negeri, Tindakan Sementara akan berlaku terlepas dari apakah tindakan tersebut diotorisasi dengan benar oleh penyedia layanan AIGC di luar negeri.
Data tidak mengenal batas, tetapi keamanan data memiliki batas. Pengesahan "Tindakan Sementara" telah menggambarkan batas-batas untuk perusahaan teknologi skala besar domestik dan pengusaha yang terlibat dalam model skala besar, dan memberikan referensi pengalaman untuk pemberlakuan "Undang-Undang Kecerdasan Buatan" selanjutnya. Dalam hal ini, kalangan akademisi dan perusahaan umumnya percaya bahwa "Tindakan Sementara" dirilis tepat waktu dan telah membangun kepercayaan dalam pengembangan kecerdasan buatan di Tiongkok.
Selain di tingkat legislatif, industri ini juga mencari terobosan melalui usahanya sendiri. Perusahaan teknologi yang telah meluncurkan model skala besar dalam enam bulan terakhir telah menyatakan penekanan mereka pada keamanan dan kredibilitas yang disebutkan dalam "Tindakan Sementara".
Baidu mengatakan bahwa hanya dengan menetapkan dan memperbaiki undang-undang dan peraturan, sistem kelembagaan, dan etika untuk memastikan perkembangan kecerdasan buatan yang sehat, ekologi inovasi yang baik dapat tercipta. 360 mengusulkan untuk membangun model besar berpemilik yang "aman, andal, dapat dikontrol, dan mudah digunakan". Alibaba Cloud mengusulkan bahwa "membangun kecerdasan buatan yang aman dan andal" secara bertahap telah menjadi konsensus industri. JD Cloud menyatakan bahwa infrastruktur digital generasi mendatang perlu memenuhi empat karakteristik integrasi dan keterbukaan, kolaborasi yang efisien, kinerja biaya yang ekstrim, serta keamanan dan pengendalian.
Tata letak industri berdasarkan wilayah sudah mulai dieksplorasi.
Belum lama ini, Beijing merilis "Twenty Measures on Data", memberikan pendapat tentang kolaborasi industri dan membangun sistem sirkulasi data tepercaya: mendukung Zona Pengembangan Ekonomi dan Teknologi Beijing dan area lain untuk menjalankan sistem infrastruktur data percontohan, dan menciptakan dataran tinggi kebijakan, ruang tepercaya, dan pabrik data.
Faktanya, pada awal Mei tahun ini, Biro Ekonomi dan Teknologi Informasi Kota Beijing, Komite Manajemen Zhongguancun dari Komisi Sains dan Teknologi Kota, dan Komisi Pembangunan dan Reformasi Kota bersama-sama meluncurkan "Program Kemitraan Inovasi Industri Kecerdasan Buatan Umum Beijing", dan sekarang fase kedua dari daftar mitra telah diumumkan.
Rencana tersebut mengharapkan untuk menyatukan perusahaan inovatif yang independen dan kredibel di Beijing untuk mempromosikan pengembangan industri kecerdasan buatan yang patuh dan berkualitas tinggi. Daftar tersebut mencakup mitra daya komputasi seperti Alibaba Cloud, mitra data seperti Beijing Big Data Center, mitra model seperti Baidu, mitra aplikasi seperti Tongxin UOS dan WPS, dan mitra investasi seperti IDG dan CDH.
Rencana tersebut mencakup perusahaan-perusahaan terkemuka di simpul-simpul utama dalam rantai industri kecerdasan buatan, meletakkan dasar ekologis yang independen dan kredibel bagi China untuk membandingkan ekologi kecerdasan buatan AI terbuka + Microsoft + Nvidia.
.AKHIR.
Lihat Asli
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Akankah data mengalir ke luar negeri dengan model besar internasional? Undang-undang kecerdasan buatan generatif pertama mengklarifikasi
**Sumber:**Petugas Perintis AI
"Perang seribu model" yang dipicu oleh GPT secara bertahap memasuki "permainan penentu data".
"Data berkualitas tinggi" dan "volume data" telah menjadi kunci bagi model besar untuk dengan cepat membangun penghalang dan bersaing untuk masa depan. Menurut Wu Chao, Direktur Komite Pakar CITIC Think Tank dan Direktur China Securities Research Institute, "Di masa mendatang, 20% model akan ditentukan oleh algoritme, dan 80% oleh kualitas data. Selanjutnya, data berkualitas tinggi akan menjadi kunci untuk meningkatkan kinerja model."
Namun data faktual menjadi langka. Bot bertenaga AI seperti ChatGPT akan segera "kehabisan teks di alam semesta".
Studi bersama "Apakah kita akan kehabisan data?" "Memberikan batas waktu: Data yang berasal dari manusia mungkin menjadi semakin langka di masa mendatang, dan data bahasa alami berkualitas tinggi mungkin akan habis oleh model bahasa besar segera setelah tahun 2026.
Bagaimana memastikan aliran data yang stabil untuk memasok pelatihan model besar? Sementara organisasi open source internasional dan raksasa bisnis terus mencoba, mereka juga menderita perselisihan Ada pertanyaan tak berujung tentang perlindungan hak milik, privasi data, dan keamanan jaringan yang ditimbulkan oleh pengumpulan data.
Pada bulan Maret tahun ini, banyak pengguna Windows 11 melaporkan bahwa mereka "dipaksa untuk membuka jendela", meminta "data Anda akan diproses di luar negara atau wilayah tempat Anda berada", dan tidak ada opsi untuk "membatalkan", dan mereka hanya dapat mengklik opsi "berikutnya", jika tidak, mereka tidak akan dapat masuk ke desktop sistem.
Langkah tersebut memicu kekhawatiran di kalangan pengguna sistem operasi Windows tentang kebocoran data pribadi ke luar negeri. Dalam hal ini, Microsoft menyatakan bahwa setelah pengguna memperbarui dan menggunakan Windows 11, data akan dikirim ke luar China. Karena pusat pendaftaran perangkat lunak Microsoft berada di Amerika Serikat, setelah ChatGPT diintegrasikan ke dalam pencarian Bing dan browser Edge, ia juga memerlukan dukungan pusat data AS, sehingga data pengguna China dapat dikirim ke luar negeri.
Teman baik Microsoft Open AI, meski mendapat manfaat dari data masif sebelumnya, juga menemui keraguan. Pada akhir Juni, OpenAI terkena gugatan class action, dituduh mencuri "sejumlah besar data pribadi" untuk melatih ChatGPT. Musk memberlakukan batasan sementara jumlah tweet yang dibaca pada 1 Juli karena alasan ini.
Alphabet telah memperingatkan karyawan untuk tidak menggunakan chatbots secara membabi buta, termasuk Bard Google, yang dipromosikannya di pasar global. Pada 1 Juni, Google memperbarui pernyataan privasinya, memperingatkan pengguna untuk "tolong jangan melibatkan informasi rahasia atau sensitif dalam percakapan dengan Bard."
Di satu sisi, Crazy All-in membangun roda gila data untuk pengguna global, dan di sisi lain, berhati-hati dengan data bisnisnya sendiri "standar ganda" semacam ini telah memaksa sebagian besar perusahaan di seluruh dunia untuk mengadopsi "pertahanan aktif". Banyak perusahaan di seluruh dunia, seperti Samsung dan Amazon, telah mulai memasang pagar pembatas untuk AI chatbots. Dan Microsoft dan Google meluncurkan alat dialog tepat waktu untuk pelanggan bisnis, menjamin bahwa data tidak akan terserap ke dalam model AI publik, tetapi pelanggan harus membayar biaya tinggi untuk ini.
Sehubungan dengan risiko yang mungkin timbul dari cara AIGC menggunakan dan memperoleh data, regulator di berbagai negara telah melakukan intervensi.
Regulator data Italia Garante mengumumkan pelarangan penuh terhadap ChatGPT pada 31 Maret 2023 dan melarang OpenAI memproses data pengguna Italia. Setelah OpenAI berjanji untuk melakukan peningkatan yang sesuai, ChatGPT melanjutkan layanannya di Italia.
Selanjutnya, Jerman, Prancis, dan Irlandia juga mengambil tindakan balasan. Spanyol meminta Dewan Perlindungan Data Eropa (EDPB) untuk mengevaluasi masalah perlindungan privasi ChatGPT. Komisi Perlindungan Informasi Pribadi Korea juga menyatakan bahwa pihaknya meluncurkan penyelidikan atas kebocoran data pengguna ChatGPT Korea.
Negara kita juga bertindak lebih awal. Pada tanggal 13 Juli, ** Administrasi Dunia Maya Negara Tiongkok bersama-sama mengeluarkan "Langkah Sementara untuk Pengelolaan Layanan Kecerdasan Buatan Generatif"** (disebut sebagai "Langkah Sementara"). Ini adalah undang-undang khusus pertama negara saya di bidang kecerdasan buatan generatif.
"Tindakan Sementara" mengklarifikasi prinsip untuk pertama kalinya, "Jika penyediaan layanan kecerdasan buatan generatif dari luar Republik Rakyat Tiongkok tidak mematuhi undang-undang, peraturan administratif, dan ketentuan tindakan ini, departemen informasi jaringan nasional harus memberi tahu lembaga terkait untuk mengambil tindakan teknis dan tindakan lain yang diperlukan untuk menghadapinya."
Selain itu, ini juga mengklarifikasi ruang lingkup penerapan Tindakan: ini berlaku untuk layanan yang menghasilkan teks, gambar, audio, video, dan konten lainnya untuk publik di China, dan dengan jelas mengecualikan aktivitas R&D dan aplikasi yang tidak memberikan layanan kepada publik domestik dari ruang lingkup aplikasi.
Ini berarti **penyedia layanan AIGC luar negeri (apakah itu lapisan model atau lapisan aplikasi) akan tunduk pada ketentuan yang relevan dari "Tindakan Sementara", apakah mereka menyediakan layanan terkait langsung ke China, atau menyediakan layanan tidak langsung melalui antarmuka API atau "enkapsulasi" atau "bersarang". Untuk produsen dalam negeri, Tindakan Sementara akan berlaku terlepas dari apakah tindakan tersebut diotorisasi dengan benar oleh penyedia layanan AIGC di luar negeri.
Data tidak mengenal batas, tetapi keamanan data memiliki batas. Pengesahan "Tindakan Sementara" telah menggambarkan batas-batas untuk perusahaan teknologi skala besar domestik dan pengusaha yang terlibat dalam model skala besar, dan memberikan referensi pengalaman untuk pemberlakuan "Undang-Undang Kecerdasan Buatan" selanjutnya. Dalam hal ini, kalangan akademisi dan perusahaan umumnya percaya bahwa "Tindakan Sementara" dirilis tepat waktu dan telah membangun kepercayaan dalam pengembangan kecerdasan buatan di Tiongkok.
Selain di tingkat legislatif, industri ini juga mencari terobosan melalui usahanya sendiri. Perusahaan teknologi yang telah meluncurkan model skala besar dalam enam bulan terakhir telah menyatakan penekanan mereka pada keamanan dan kredibilitas yang disebutkan dalam "Tindakan Sementara".
Baidu mengatakan bahwa hanya dengan menetapkan dan memperbaiki undang-undang dan peraturan, sistem kelembagaan, dan etika untuk memastikan perkembangan kecerdasan buatan yang sehat, ekologi inovasi yang baik dapat tercipta. 360 mengusulkan untuk membangun model besar berpemilik yang "aman, andal, dapat dikontrol, dan mudah digunakan". Alibaba Cloud mengusulkan bahwa "membangun kecerdasan buatan yang aman dan andal" secara bertahap telah menjadi konsensus industri. JD Cloud menyatakan bahwa infrastruktur digital generasi mendatang perlu memenuhi empat karakteristik integrasi dan keterbukaan, kolaborasi yang efisien, kinerja biaya yang ekstrim, serta keamanan dan pengendalian.
Tata letak industri berdasarkan wilayah sudah mulai dieksplorasi.
Belum lama ini, Beijing merilis "Twenty Measures on Data", memberikan pendapat tentang kolaborasi industri dan membangun sistem sirkulasi data tepercaya: mendukung Zona Pengembangan Ekonomi dan Teknologi Beijing dan area lain untuk menjalankan sistem infrastruktur data percontohan, dan menciptakan dataran tinggi kebijakan, ruang tepercaya, dan pabrik data.
Faktanya, pada awal Mei tahun ini, Biro Ekonomi dan Teknologi Informasi Kota Beijing, Komite Manajemen Zhongguancun dari Komisi Sains dan Teknologi Kota, dan Komisi Pembangunan dan Reformasi Kota bersama-sama meluncurkan "Program Kemitraan Inovasi Industri Kecerdasan Buatan Umum Beijing", dan sekarang fase kedua dari daftar mitra telah diumumkan.
Rencana tersebut mengharapkan untuk menyatukan perusahaan inovatif yang independen dan kredibel di Beijing untuk mempromosikan pengembangan industri kecerdasan buatan yang patuh dan berkualitas tinggi. Daftar tersebut mencakup mitra daya komputasi seperti Alibaba Cloud, mitra data seperti Beijing Big Data Center, mitra model seperti Baidu, mitra aplikasi seperti Tongxin UOS dan WPS, dan mitra investasi seperti IDG dan CDH.
Rencana tersebut mencakup perusahaan-perusahaan terkemuka di simpul-simpul utama dalam rantai industri kecerdasan buatan, meletakkan dasar ekologis yang independen dan kredibel bagi China untuk membandingkan ekologi kecerdasan buatan AI terbuka + Microsoft + Nvidia.
.AKHIR.