Kaynak: Alfabe Listesi, Yazar: Bi Andi, Editör: Wang Jing
Görsel kaynağı: Unbounded AI tarafından oluşturuldu
Sadece sosyal medyanın kullanıcıların daha uzun süre kalmasını sağlamaya çalıştığını duydum, ancak insanlara sınır koymak için inisiyatif aldığını hiç duymadım. Şimdi gözlerinizi açın, Elon Musk tüm Twitter kullanıcılarına "küçük koruma" ekliyor ve tüm bunlar aslında yapay zeka tarafından mı zorlanıyor?
Günümüzde, Twitter kullanıcılarının her gün göz atabilecekleri maksimum tweet sayısı el hızına veya geç kalma isteksizliğine bağlı değildir, ancak net bir sayı vardır: 10.000 doğrulanmış (yani ücretli "Bluebird" hizmeti) hesap, 10.000 doğrulanmamış 1000 hesap var, ancak yeni kaydedilen doğrulanmamış hesaplar için yalnızca 500 tane var.
Bu, kızgın kullanıcılar karşısında Musk'ın iki kez yükseltilmiş standardıdır. Sebep olarak, "aşırı düzeyde veri kazıma ve sistem manipülasyonunu ele almaktır."
Modellerini eğitmek için büyük miktarda veriye ihtiyaç duyan AI şirketlerinden bahsediyordu. Musk, geçen yılın Aralık ayında OpenAI ile veri bağlantısını kesti ve bu yılın Nisan ayında Microsoft'u Twitter'ın verilerini yasa dışı bir şekilde kullanmakla suçladı.
Musk, veri kazımayı durdurmak için agresif adımlar atarken, OpenAI bir toplu dava ile karşı karşıya. Davada 16 davacı var, hepsi gerçek kişiler, yani sıradan internet sörfçüleri. OpenAI'yi gizlice "İnternetten 300 milyar kelimeyi kazımakla" ve ChatGPT'yi eğitme izni olmadan bu İnternet kullanıcısından "büyük miktarda özel bilgi" çalmakla suçluyorlar.
Bir yanda yıllar boyunca büyük miktarda UGC içeriği biriktiren internet kullanıcıları ve platformlar, diğer yanda gelişmekte olan AIGC şirketleri... Veri toplama ve gizlilik güvenliği etrafında bir savaş başladı.
01
Cum gongları ve davulları çalın. Nihayet hafta sonuydu ama Twitter kullanıcıları şaşkına dönmüştü, ekranda "oran sınırını" aştıklarını, Twitter kurallarını ihlal ettiklerini ve çok fazla tweet görüntülediklerini hatırlatan bir hata mesajı görüntülendi.
İnsanlar bunun ne anlama geldiğini hiç anlamadılar.Twitter patronu Musk öne çıktı ve gerçekten bir oran sınırı olduğunu söyledi ve duyurdu: Aşırı düzeydeki veri kazıma ve sistem manipülasyonunu çözmek için doğrulanmış, doğrulanmamış ve yeni kayıtlar. izin verilmez.Doğrulanmış hesaplar günde 6000, 600 ve 300 tweet ile sınırlıdır.
Bundan önce Musk, Twitter'ın oturum açmamış kullanıcıların, kullanıcılar tarafından kabul edilebilir olan içeriğe göz atmasını yasaklayacağını duyurmuştu. Kısıtlama gerçekten zorlandı ve kullanıcılar felç oldular ve ardından doğrulama ile doğrulamama arasındaki farka baktılar ve kaşlarını kaldırdılar: "Blue Bird Aboneliği"ni tanıtmak için bu numarayı kullanmaya çalışıyor olmanız mümkün mü? Yorum alanında birden fazla kullanıcı "Şimdi kazanmak için para mı kullanmalıyız?" yorumunu yaptı.
Memnuniyetsizliğin sesi yüksek, Twitter'ın rakip ürünleri Hive, Mastodon, Tumblr vb. Tartışma sırasında Musk, standardı iki kez doğrulanmış kullanıcılar tarafından 10.000 görüntülemeye ve doğrulanmamış kullanıcılar tarafından 1.000 görüntülemeye yükseltti.
Musk'ın sahte hesaplarından biri şaka yaptı: "Sınır koydum çünkü siz twitter bağımlılarının dışarı çıkması gerekiyor. Dünya için iyi şeyler yapıyorum." Bu tür bir değer artırma fikri iyi, Musk'ın ters vuruşu bir repost ve ayrıca "Gidin, arkadaşlarınızı ve ailenizi ziyaret edin" diye ayrı bir mesaj gönderdi.
Ancak şaka şaka, Musk yaptığı "test" için net bir açıklama yaptı: veri tarama ile uğraşmak. Kullanıcıların memnuniyetsizliği, veri tarama konusunda değil, mevcut sınırlama yönteminin etkili olup olmadığında da yatmaktadır.
AI girişimlerinin "verileri kazımak" için Twitter'a gelmesi ne kadar ciddi? Bir tweet'te Musk, trafikteki artışın Twitter'ı yedek sunucuları açmaya zorladığını söyledi:** "Acil bir durumda çok sayıda çevrimiçi sunucuyu gülünç derecede yüksek değerlere sahip bazı AI girişimlerine yardımcı olmak için açmak çok fazla." ."**
Mevcut limit fırtınasından bir gün önce, Epic Games CEO'su Tim Sweeney de Twitter'ın bir duvar ördüğünden şikayet eden bir tweet attı. Kullanıcı deneyimini nerelerde etkileyeceği noktasında nasıl yapalım? Her türlü fikre açığım.”
Şu an hala şikayetçi olan Tim, hızla Twitter'ın hizmet şartlarına veri taraması yasağının eklenmesi, platformun bilgi güvenliği mühendisliği ile korunması ve Twitter'ı büyük çapta suiistimal eden şirketler hakkında yasal işlem başlatılması gibi ciddi önerilerde bulundu.
Özellikle Musk, yanıtında verileri çalanlara karşı "kesinlikle" yasal işlem başlatılacağından bahsetmişti: "(iyimser bir şekilde) bundan 2 ila 3 yıl sonra, onları mahkemede görmeyi dört gözle bekliyorum."
"Ücretli aboneliklere yakacak odun ekleme" varsayımı bir kötü adam kalbi olsa da, Musk'ın kullanıcı gizliliği bayrağını yükseklerde tutması az çok bencilce olabilir. Nisan ayında Musk'ın ChatGPT'ye karşı savaşmak için yeni bir yapay zeka şirketi olan X.AI'yi kuracağı söylendi. Gerçekten geniş bir dil modeli eğitmek istiyorsanız, Twitter'ın kullanıcı verileri elbette sadece sizin içindir.
Her durumda, platformun akışını aktif olarak sınırlamak mümkündür Musk, AI girişimleriyle sonuna kadar savaşmaya hazırdır.
02
**Musk tüm platformun akışını sınırlamak için saldırırken, bu AICG çılgınlığının "başlatıcısı" ve ChatGPT'nin yaratıcısı OpenAI, bir toplu davaya dahil oldu. **
Dava, Kaliforniya'nın Kuzey Bölgesi için ABD Bölge Mahkemesinde, tamamı isimsiz, tamamı şahıs olan 16 davacı ile başlatıldı. Şikayet çok uzun, tam 157 sayfa ve Stephen Hawking'in şu cümlesiyle başlıyor: "Güçlü yapay zekanın yükselişi insanlık tarihindeki en iyi ya da en kötü şeydir." OpenAI'ye ek olarak sanık ayrıca İçine on milyarlarca dolar enjekte eden Microsoft.
Temel iddia, ChatGPT'nin "teknolojisini eğitmek" için İnternetten toplanan verileri kullandığında "sayısız kişinin telif haklarını ve mahremiyetini" ihlal ettiğidir.
İddianamede, OpenAI'nin internetten 300 milyar kelimeyi gizlice kazıdığı ve "izin alınmadan elde edilen kişisel bilgiler de dahil olmak üzere kitaplar, makaleler, web siteleri ve gönderiler" üzerinde gizlilik yasalarını ihlal ederek kulak misafiri olduğu belirtildi. OpenAI'nin sosyal medyadaki veriler de dahil olmak üzere büyük miktarda ağ verisini taradığından bahsetmişti.
Ayrıca, OpenAI'nin, Reddit gönderilerinden ve bağlantı verdikleri web sitelerinden alınan veriler de dahil olmak üzere çok büyük miktarda kişisel veri toplayan tescilli bir AI külliyatına sahip olduğuna dikkat çekiyorlar.
Bu, eğitim modelleri açısından bir suçlamadır.Ayrıca davacı, kullanıcının OpenAI ürünleriyle etkileşiminin ve ürünlerdeki özel bilgilerin de OpenAI tarafından büyük ölçüde yasa dışı bir şekilde erişildiğini ve kötüye kullanıldığını iddia etmiştir.
Bu, OpenAI'nin Amerika Birleşik Devletleri'nde ilk kez bir toplu dava davasıyla karşılaşması değil. Geçen yıl Kasım ayında Github programcıları, OpenAI'yi açık kaynak lisanslarını ihlal etmekle ve özel AI aracı GitHub Copilot'u eğitmek için katkıda bulundukları kodu kullanmakla suçlayarak Github, OpenAI ve Microsoft'a karşı bir toplu dava açtı.
O zamanlar ChatGPT henüz çevrimiçi değildi.Şimdi geriye dönüp baktığımızda, AI eğitimi sorunu o zamanlar ortaya çıktı. Bugün, en son toplu dava, daha geniş bir kullanıcı yelpazesine ve ihlal edilmiş (temelde tüm mağdurlar) daha geniş bir insan yelpazesine sahip olan ChatGPT'yi hedefliyor. Daha da önemlisi, AIGC'nin çılgınlığı altında, herhangi bir yasal emsal geleceği etkileyebilir. .
Davayı temsil eden kamu yararına çalışan hukuk firması Clarkson yaptığı açıklamada, toplu davayı "dönüm noktası niteliğindeki" bir federal dava ve bir bütün olarak yapay zekaya bir uyarı olarak nitelendirdi.
Bu açıdan bakıldığında, OpenAI'nin omuzlarındaki yük gerçekten ağır.
**OpenAI, veri yakalama ve gizlilik güvenliği nedeniyle zaten birçok sorunla karşılaştı. Platform kilitlendi ve kullanıcılar birbirine düşman oldu. Bunlar buzdağının sadece görünen kısmı. **
Avrupa'da OpenAI birçok ülke tarafından araştırıldı.Bu yılın Nisan ayında bile İtalya, ChatGPT'nin Avrupa veri koruma yasalarını ihlal edeceğinden endişelendi ve ChatGPT'yi geçici olarak yasakladı.
Tüm yapay zeka alanının düzenlenmesi ilerliyor. Fransa, Mayıs ayında bir yapay zeka eylem planı başlattı. Bunların arasında, AIGC açısından, Fransız gizlilik düzenleyicisi, internetten veri toplayan ve büyük dil modellerini eğitmek için veri kümeleri oluşturan bazı yapay zeka modellerinin uygulanmasına özel önem veriyor.
Bunlardan en önemlisi, şu anda son aşamasında olan Avrupa Birliği Yapay Zeka Düzenleme Yasasıdır (AB AI Yasası). Tasarı muhtemelen küresel yapay zeka yönetişimi için bir model haline gelecek.
03
**Platformlar, kullanıcılar ve denetim; üç kuvvet, mümkün olan en kısa sürede AIGC için kurallar oluşturma ve büyük ölçekli model eğitiminin başlangıç noktasından başlama sözü vererek bir kuşatma eğilimi oluşturdu. **
Bir yandan zaman daralıyor ve AIGC çok hızlı gelişiyor.
Musk'ın "saçma derecede yüksek değere sahip yapay zeka girişimleri" ile kimi kastettiğini bilmiyoruz. Ama bu sözler çıkar çıkmaz gerçekten de çok sayıda hit oldu, sonuçta AIGC alanında hepsi sıcak para olan finansman dalgaları var.
OpenAI, 11,3 milyar ABD doları toplam finansman ölçeğiyle yaklaşık 30 milyar ABD doları değerinde olup, onu AIGC'nin en zengini yapar; onu 4 milyar ABD dolarını aşan bir değerleme ile ikinci en zengin Anthropic izliyor. Daha birkaç gün önce 1,3 milyar dolarlık finansmanla Silikon Vadisi'ni şoke eden Inflection'ın değeri ise 4 milyar dolar ve kurulalı henüz bir yıldan fazla oldu.
Büyük olanlar henüz gelmemiş olabilir. Kendi büyük dil modelini kullanan Inflection, bu kez 1.3 milyar ABD doları topladı ve dünyanın en büyük yapay zeka kümesini oluşturmak için 22.000 Nvidia H100 yongası kuracağını duyurdu. Böylesine büyük ölçekli bir bilgi işlem gücüyle, hedef parametrelerin ve veri kümelerinin miktarı inanılmaz olacaktır.
** Öte yandan, ChatGPT birdenbire doğdu ve sorunları ortaya çıkardığında "düzeltmek" o kadar kolay değil. **OpenAI'nin birkaç nesil büyük dil modeli, GPT-2 veri setinde 40 GB metin bulunur ve GPT-3'te (yani, ChatGPT yayınlandığında kullanılan model) 570 GB eğitim verisi bulunur. Yayınlanan GPT-4'e gelince Bu yıl, veri setinin boyutu temelde açıklanmadı.
Başından beri büyük miktarda veri düzgün bir şekilde belgelenmemişti. Google'da eski bir araştırma bilimcisi olan Nicia Sambaswan, röportajlarda teknoloji şirketlerinin AI eğitim verilerini nasıl topladıklarını veya bunlara nasıl açıklama eklediklerini ve hatta veri kümesinde ne olduğunu takip etmediklerini söyledi.
Bitmiş ChatGPT bir kara kutu gibidir ve gizli bir odaya inşa edilmiş bir kara kutudur. Artık hangi verilerin tarandığını listelemek, kullanım sırasında nasıl kullanılacağını açıklamak ve kullanıcıların isteği üzerine silmek, belirli bir veri parçası aslında çok zordur.
İnternet sörfçüleri ve düzenleyiciler OpenAI'yi ısırıyor, göz ardı edilemeyecek başka bir neden daha var - sosyal medyanın gelişip büyüdüğü, kişisel ağ verilerinin korunmasına ilişkin farkındalığın henüz emekleme döneminde olduğu ve rekabet etme zamanı geldiğinde keşfedildi. çok uzağa kaçırdığını.
Zuckerberg, 2018'de kongre oturumuna ilk kez oturduğunda, sosyal medya platformu Facebook 14 yıl önce kurulmuştu. O dönemde Facebook "Cambridge Skandalı"na yakalanmıştı ve şirketin baş teknoloji sorumlusu 87 milyon kullanıcının etkilendiğini söyledi. Ayrıca veri kazımanın neden olduğu büyük bir hataydı.
Altman, bu yıl Mayıs ayında ABD Kongre oturumunda oturduğunda, kongre üyeleri sosyal medya çağında eylemsizliklerinden dolayı pişmanlık duyduklarını sık sık dile getirdiler. **
Büyük modeller birbiri ardına hala eğitiliyor ve veri yakalama bir iş parçacığı.Yalnızca onu kavrayarak AIGC'nin kafa karışıklığını gidermeyi umabiliriz.
Referans malzemeleri:
Sina Teknoloji: "Musk ve Microsoft barda mı? Twitter, Microsoft'u verilerini yasa dışı bir şekilde kullanmakla suçluyor »
Karanlık at programcısı: "Bu programcılar GitHub'a dava açtı!" 64.9 milyarlık tazminat talebi"
Jiemian News: "AB AI faturası yayınlandı, OpenAI ve diğer şirketler nasıl puan alabilir ve temel anlaşmazlıklar nelerdir?" "
Tencent Teknolojisi: "Veri açlığı OpenAI'ye zarar mı veriyor? Birçok ülke onu veri koruma yasalarını ihlal etmekle suçluyor
Netease Technology: "ChatGPT İtalya'da çevrimiçi olarak devam ediyor, ancak OpenAI'nin düzenleyici sorunları daha yeni başladı"
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Musk, OpenAI konusunda sert ve kullanıcılar talihsizlik yaşıyor
Kaynak: Alfabe Listesi, Yazar: Bi Andi, Editör: Wang Jing
Sadece sosyal medyanın kullanıcıların daha uzun süre kalmasını sağlamaya çalıştığını duydum, ancak insanlara sınır koymak için inisiyatif aldığını hiç duymadım. Şimdi gözlerinizi açın, Elon Musk tüm Twitter kullanıcılarına "küçük koruma" ekliyor ve tüm bunlar aslında yapay zeka tarafından mı zorlanıyor?
Günümüzde, Twitter kullanıcılarının her gün göz atabilecekleri maksimum tweet sayısı el hızına veya geç kalma isteksizliğine bağlı değildir, ancak net bir sayı vardır: 10.000 doğrulanmış (yani ücretli "Bluebird" hizmeti) hesap, 10.000 doğrulanmamış 1000 hesap var, ancak yeni kaydedilen doğrulanmamış hesaplar için yalnızca 500 tane var.
Bu, kızgın kullanıcılar karşısında Musk'ın iki kez yükseltilmiş standardıdır. Sebep olarak, "aşırı düzeyde veri kazıma ve sistem manipülasyonunu ele almaktır."
Modellerini eğitmek için büyük miktarda veriye ihtiyaç duyan AI şirketlerinden bahsediyordu. Musk, geçen yılın Aralık ayında OpenAI ile veri bağlantısını kesti ve bu yılın Nisan ayında Microsoft'u Twitter'ın verilerini yasa dışı bir şekilde kullanmakla suçladı.
Musk, veri kazımayı durdurmak için agresif adımlar atarken, OpenAI bir toplu dava ile karşı karşıya. Davada 16 davacı var, hepsi gerçek kişiler, yani sıradan internet sörfçüleri. OpenAI'yi gizlice "İnternetten 300 milyar kelimeyi kazımakla" ve ChatGPT'yi eğitme izni olmadan bu İnternet kullanıcısından "büyük miktarda özel bilgi" çalmakla suçluyorlar.
Bir yanda yıllar boyunca büyük miktarda UGC içeriği biriktiren internet kullanıcıları ve platformlar, diğer yanda gelişmekte olan AIGC şirketleri... Veri toplama ve gizlilik güvenliği etrafında bir savaş başladı.
01
Cum gongları ve davulları çalın. Nihayet hafta sonuydu ama Twitter kullanıcıları şaşkına dönmüştü, ekranda "oran sınırını" aştıklarını, Twitter kurallarını ihlal ettiklerini ve çok fazla tweet görüntülediklerini hatırlatan bir hata mesajı görüntülendi.
İnsanlar bunun ne anlama geldiğini hiç anlamadılar.Twitter patronu Musk öne çıktı ve gerçekten bir oran sınırı olduğunu söyledi ve duyurdu: Aşırı düzeydeki veri kazıma ve sistem manipülasyonunu çözmek için doğrulanmış, doğrulanmamış ve yeni kayıtlar. izin verilmez.Doğrulanmış hesaplar günde 6000, 600 ve 300 tweet ile sınırlıdır.
Memnuniyetsizliğin sesi yüksek, Twitter'ın rakip ürünleri Hive, Mastodon, Tumblr vb. Tartışma sırasında Musk, standardı iki kez doğrulanmış kullanıcılar tarafından 10.000 görüntülemeye ve doğrulanmamış kullanıcılar tarafından 1.000 görüntülemeye yükseltti.
AI girişimlerinin "verileri kazımak" için Twitter'a gelmesi ne kadar ciddi? Bir tweet'te Musk, trafikteki artışın Twitter'ı yedek sunucuları açmaya zorladığını söyledi:** "Acil bir durumda çok sayıda çevrimiçi sunucuyu gülünç derecede yüksek değerlere sahip bazı AI girişimlerine yardımcı olmak için açmak çok fazla." ."**
Mevcut limit fırtınasından bir gün önce, Epic Games CEO'su Tim Sweeney de Twitter'ın bir duvar ördüğünden şikayet eden bir tweet attı. Kullanıcı deneyimini nerelerde etkileyeceği noktasında nasıl yapalım? Her türlü fikre açığım.”
Şu an hala şikayetçi olan Tim, hızla Twitter'ın hizmet şartlarına veri taraması yasağının eklenmesi, platformun bilgi güvenliği mühendisliği ile korunması ve Twitter'ı büyük çapta suiistimal eden şirketler hakkında yasal işlem başlatılması gibi ciddi önerilerde bulundu.
Özellikle Musk, yanıtında verileri çalanlara karşı "kesinlikle" yasal işlem başlatılacağından bahsetmişti: "(iyimser bir şekilde) bundan 2 ila 3 yıl sonra, onları mahkemede görmeyi dört gözle bekliyorum."
"Ücretli aboneliklere yakacak odun ekleme" varsayımı bir kötü adam kalbi olsa da, Musk'ın kullanıcı gizliliği bayrağını yükseklerde tutması az çok bencilce olabilir. Nisan ayında Musk'ın ChatGPT'ye karşı savaşmak için yeni bir yapay zeka şirketi olan X.AI'yi kuracağı söylendi. Gerçekten geniş bir dil modeli eğitmek istiyorsanız, Twitter'ın kullanıcı verileri elbette sadece sizin içindir.
Her durumda, platformun akışını aktif olarak sınırlamak mümkündür Musk, AI girişimleriyle sonuna kadar savaşmaya hazırdır.
02
**Musk tüm platformun akışını sınırlamak için saldırırken, bu AICG çılgınlığının "başlatıcısı" ve ChatGPT'nin yaratıcısı OpenAI, bir toplu davaya dahil oldu. **
Dava, Kaliforniya'nın Kuzey Bölgesi için ABD Bölge Mahkemesinde, tamamı isimsiz, tamamı şahıs olan 16 davacı ile başlatıldı. Şikayet çok uzun, tam 157 sayfa ve Stephen Hawking'in şu cümlesiyle başlıyor: "Güçlü yapay zekanın yükselişi insanlık tarihindeki en iyi ya da en kötü şeydir." OpenAI'ye ek olarak sanık ayrıca İçine on milyarlarca dolar enjekte eden Microsoft.
Temel iddia, ChatGPT'nin "teknolojisini eğitmek" için İnternetten toplanan verileri kullandığında "sayısız kişinin telif haklarını ve mahremiyetini" ihlal ettiğidir.
İddianamede, OpenAI'nin internetten 300 milyar kelimeyi gizlice kazıdığı ve "izin alınmadan elde edilen kişisel bilgiler de dahil olmak üzere kitaplar, makaleler, web siteleri ve gönderiler" üzerinde gizlilik yasalarını ihlal ederek kulak misafiri olduğu belirtildi. OpenAI'nin sosyal medyadaki veriler de dahil olmak üzere büyük miktarda ağ verisini taradığından bahsetmişti.
Ayrıca, OpenAI'nin, Reddit gönderilerinden ve bağlantı verdikleri web sitelerinden alınan veriler de dahil olmak üzere çok büyük miktarda kişisel veri toplayan tescilli bir AI külliyatına sahip olduğuna dikkat çekiyorlar.
Bu, eğitim modelleri açısından bir suçlamadır.Ayrıca davacı, kullanıcının OpenAI ürünleriyle etkileşiminin ve ürünlerdeki özel bilgilerin de OpenAI tarafından büyük ölçüde yasa dışı bir şekilde erişildiğini ve kötüye kullanıldığını iddia etmiştir.
Bu, OpenAI'nin Amerika Birleşik Devletleri'nde ilk kez bir toplu dava davasıyla karşılaşması değil. Geçen yıl Kasım ayında Github programcıları, OpenAI'yi açık kaynak lisanslarını ihlal etmekle ve özel AI aracı GitHub Copilot'u eğitmek için katkıda bulundukları kodu kullanmakla suçlayarak Github, OpenAI ve Microsoft'a karşı bir toplu dava açtı.
O zamanlar ChatGPT henüz çevrimiçi değildi.Şimdi geriye dönüp baktığımızda, AI eğitimi sorunu o zamanlar ortaya çıktı. Bugün, en son toplu dava, daha geniş bir kullanıcı yelpazesine ve ihlal edilmiş (temelde tüm mağdurlar) daha geniş bir insan yelpazesine sahip olan ChatGPT'yi hedefliyor. Daha da önemlisi, AIGC'nin çılgınlığı altında, herhangi bir yasal emsal geleceği etkileyebilir. .
Davayı temsil eden kamu yararına çalışan hukuk firması Clarkson yaptığı açıklamada, toplu davayı "dönüm noktası niteliğindeki" bir federal dava ve bir bütün olarak yapay zekaya bir uyarı olarak nitelendirdi.
Bu açıdan bakıldığında, OpenAI'nin omuzlarındaki yük gerçekten ağır.
**OpenAI, veri yakalama ve gizlilik güvenliği nedeniyle zaten birçok sorunla karşılaştı. Platform kilitlendi ve kullanıcılar birbirine düşman oldu. Bunlar buzdağının sadece görünen kısmı. **
Avrupa'da OpenAI birçok ülke tarafından araştırıldı.Bu yılın Nisan ayında bile İtalya, ChatGPT'nin Avrupa veri koruma yasalarını ihlal edeceğinden endişelendi ve ChatGPT'yi geçici olarak yasakladı.
Tüm yapay zeka alanının düzenlenmesi ilerliyor. Fransa, Mayıs ayında bir yapay zeka eylem planı başlattı. Bunların arasında, AIGC açısından, Fransız gizlilik düzenleyicisi, internetten veri toplayan ve büyük dil modellerini eğitmek için veri kümeleri oluşturan bazı yapay zeka modellerinin uygulanmasına özel önem veriyor.
Bunlardan en önemlisi, şu anda son aşamasında olan Avrupa Birliği Yapay Zeka Düzenleme Yasasıdır (AB AI Yasası). Tasarı muhtemelen küresel yapay zeka yönetişimi için bir model haline gelecek.
03
**Platformlar, kullanıcılar ve denetim; üç kuvvet, mümkün olan en kısa sürede AIGC için kurallar oluşturma ve büyük ölçekli model eğitiminin başlangıç noktasından başlama sözü vererek bir kuşatma eğilimi oluşturdu. **
Bir yandan zaman daralıyor ve AIGC çok hızlı gelişiyor.
Musk'ın "saçma derecede yüksek değere sahip yapay zeka girişimleri" ile kimi kastettiğini bilmiyoruz. Ama bu sözler çıkar çıkmaz gerçekten de çok sayıda hit oldu, sonuçta AIGC alanında hepsi sıcak para olan finansman dalgaları var.
OpenAI, 11,3 milyar ABD doları toplam finansman ölçeğiyle yaklaşık 30 milyar ABD doları değerinde olup, onu AIGC'nin en zengini yapar; onu 4 milyar ABD dolarını aşan bir değerleme ile ikinci en zengin Anthropic izliyor. Daha birkaç gün önce 1,3 milyar dolarlık finansmanla Silikon Vadisi'ni şoke eden Inflection'ın değeri ise 4 milyar dolar ve kurulalı henüz bir yıldan fazla oldu.
Büyük olanlar henüz gelmemiş olabilir. Kendi büyük dil modelini kullanan Inflection, bu kez 1.3 milyar ABD doları topladı ve dünyanın en büyük yapay zeka kümesini oluşturmak için 22.000 Nvidia H100 yongası kuracağını duyurdu. Böylesine büyük ölçekli bir bilgi işlem gücüyle, hedef parametrelerin ve veri kümelerinin miktarı inanılmaz olacaktır.
** Öte yandan, ChatGPT birdenbire doğdu ve sorunları ortaya çıkardığında "düzeltmek" o kadar kolay değil. **OpenAI'nin birkaç nesil büyük dil modeli, GPT-2 veri setinde 40 GB metin bulunur ve GPT-3'te (yani, ChatGPT yayınlandığında kullanılan model) 570 GB eğitim verisi bulunur. Yayınlanan GPT-4'e gelince Bu yıl, veri setinin boyutu temelde açıklanmadı.
Başından beri büyük miktarda veri düzgün bir şekilde belgelenmemişti. Google'da eski bir araştırma bilimcisi olan Nicia Sambaswan, röportajlarda teknoloji şirketlerinin AI eğitim verilerini nasıl topladıklarını veya bunlara nasıl açıklama eklediklerini ve hatta veri kümesinde ne olduğunu takip etmediklerini söyledi.
Bitmiş ChatGPT bir kara kutu gibidir ve gizli bir odaya inşa edilmiş bir kara kutudur. Artık hangi verilerin tarandığını listelemek, kullanım sırasında nasıl kullanılacağını açıklamak ve kullanıcıların isteği üzerine silmek, belirli bir veri parçası aslında çok zordur.
İnternet sörfçüleri ve düzenleyiciler OpenAI'yi ısırıyor, göz ardı edilemeyecek başka bir neden daha var - sosyal medyanın gelişip büyüdüğü, kişisel ağ verilerinin korunmasına ilişkin farkındalığın henüz emekleme döneminde olduğu ve rekabet etme zamanı geldiğinde keşfedildi. çok uzağa kaçırdığını.
Zuckerberg, 2018'de kongre oturumuna ilk kez oturduğunda, sosyal medya platformu Facebook 14 yıl önce kurulmuştu. O dönemde Facebook "Cambridge Skandalı"na yakalanmıştı ve şirketin baş teknoloji sorumlusu 87 milyon kullanıcının etkilendiğini söyledi. Ayrıca veri kazımanın neden olduğu büyük bir hataydı.
Altman, bu yıl Mayıs ayında ABD Kongre oturumunda oturduğunda, kongre üyeleri sosyal medya çağında eylemsizliklerinden dolayı pişmanlık duyduklarını sık sık dile getirdiler. **
Büyük modeller birbiri ardına hala eğitiliyor ve veri yakalama bir iş parçacığı.Yalnızca onu kavrayarak AIGC'nin kafa karışıklığını gidermeyi umabiliriz.
Referans malzemeleri:
Sina Teknoloji: "Musk ve Microsoft barda mı? Twitter, Microsoft'u verilerini yasa dışı bir şekilde kullanmakla suçluyor »
Karanlık at programcısı: "Bu programcılar GitHub'a dava açtı!" 64.9 milyarlık tazminat talebi"
Jiemian News: "AB AI faturası yayınlandı, OpenAI ve diğer şirketler nasıl puan alabilir ve temel anlaşmazlıklar nelerdir?" "
Tencent Teknolojisi: "Veri açlığı OpenAI'ye zarar mı veriyor? Birçok ülke onu veri koruma yasalarını ihlal etmekle suçluyor
Netease Technology: "ChatGPT İtalya'da çevrimiçi olarak devam ediyor, ancak OpenAI'nin düzenleyici sorunları daha yeni başladı"