Geçtiğimiz iki yıl, Twitter (X) için tartışmalı bir şekilde çalkantılı geçti. Geçen yıl, Elon Musk platformu 44 milyar dolara satın aldı ve ardından şirketin kadrosunu, içerik incelemesini, iş modelini ve web sitesi kültürünü elden geçirdi.Bu değişiklikler, belirli politika kararlarından ziyade Elon Musk'ın yumuşak gücünden kaynaklanıyor olabilir. Bununla birlikte, bu tartışmalı hamlelerin ortasında, Twitter'daki yeni bir özellik hızla önem kazanıyor ve görünüşe göre siyasi yelpazede beğeni kazanıyor: Topluluk Notları.
Topluluk Notları, yukarıdaki Elon Musk'ınki gibi, bazen tweet'lere bağlamsal ek açıklamalar ekleyen bir gerçek kontrol aracıdır. Başlangıçta Birdwatch olarak adlandırıldı ve ilk olarak Ocak 2021'de pilot program olarak başlatıldı. O zamandan beri kademeli olarak genişledi ve en hızlı genişleme aşaması geçen yıl Elon Musk'ın Twitter'ı devralmasıyla aynı zamana denk geldi. Bugün, Topluluk Notları, tartışmalı siyasi konuları ele alanlar da dahil olmak üzere Twitter'da çok fazla dikkat çeken tweet'lerin düzenli bir özelliğidir. Kanaatimce ve siyasi yelpazedeki birçok insanla yaptığım sohbetlerden yola çıkarak, bu Notlar ortaya çıktıklarında bilgilendirici ve değerlidir.
Ama beni en çok ilgilendiren, bir "kripto projesi" olmasa da, muhtemelen ana akım dünyada gördüğümüz "kripto değerlerinin" en yakın örneği olan Topluluk Notları. Topluluk Notları, merkezi olarak seçilen bir uzman tarafından yazılmaz veya küratörlüğünü yapmaz; bunun yerine herkes yazıp oylayabilir ve hangi Notların görüntülenip görüntülenmeyeceği tamamen açık kaynaklı bir algoritma tarafından belirlenir. Twitter web sitesinde, algoritmanın nasıl çalıştığını açıklayan ayrıntılı ve kapsamlı bir kılavuz vardır ve gönderilen Notları ve oyları içeren verileri indirebilir, algoritmayı yerel olarak çalıştırabilir ve çıktının Twitter web sitesinde görünenle eşleştiğini doğrulayabilirsiniz. Mükemmel olmasa da, oldukça tartışmalı durumlarda inandırıcı tarafsızlık idealine şaşırtıcı derecede yakındır ve aynı zamanda çok faydalıdır.
Topluluk Notları algoritması nasıl çalışır?
Belirli kriterleri (temel olarak: 6 aydan uzun süredir aktif, ihlal geçmişi yok, doğrulanmış cep telefonu numarası) karşılayan bir Twitter hesabı olan herkes, Topluluk Notlarına katılmak için kaydolabilir. Şu anda, katılımcılar yavaş ve rastgele kabul ediliyor, ancak sonunda plan, uygun olan herkesin katılmasına izin vermek. Kabul edildikten sonra, önce mevcut Notların notlandırılmasına katılabilirsiniz ve notunuz yeterince iyi olduğunda (hangi notun o Notun nihai sonucuyla eşleştiğini görerek ölçülür), kendi Notlarınızı da yazabilirsiniz.
Bir Not yazdığınızda, Notlar diğer Community Notes üyelerinin incelemelerine göre bir puan alır. Bu incelemeler, "yararlı", "biraz yararlı" ve "yardımcı değil" olmak üzere üç düzeydeki oylar olarak görüntülenebilir, ancak incelemeler, algoritmada rol oynayan başka etiketler de içerebilir. Bu incelemelere göre Notes'a bir puan verilir. Notların puanı 0,40'ı aşarsa, bu Notlar görüntülenecektir, aksi takdirde bu Notlar görüntülenmeyecektir.
Algoritmayı benzersiz kılan, puanın nasıl hesaplandığıdır. Basitçe kullanıcı puanlarının bir tür toplamını veya ortalamasını hesaplamak ve bunu nihai sonuç olarak kullanmak için tasarlanmış basit algoritmaların aksine, Topluluk Notları derecelendirme algoritması, açıkça farklı bakış açılarına sahip kişilerden olumlu puanlar alanlara öncelik vermeye çalışır. Yani, genellikle derecelendirmeler konusunda aynı fikirde olmayan kişiler sonunda belirli bir Not üzerinde anlaşırlarsa, o Not yüksek puan alacaktır.
Nasıl çalıştığına daha yakından bakalım. Bir dizi kullanıcımız ve bir dizi Notumuz var; Mij hücresinin i. kullanıcının j. Notları nasıl derecelendirdiğini temsil ettiği bir M matrisi oluşturabiliriz.
Herhangi bir Not için, çoğu kullanıcı o Notu derecelendirmemiştir, bu nedenle matristeki çoğu giriş sıfır olacaktır, ancak sorun değil. Algoritmanın amacı, dört sütunlu bir kullanıcı ve Not modeli oluşturmaktır, her kullanıcıya "Samimiyet" ve "Polarite" diyebileceğimiz iki istatistik atayarak ve her Nota iki istatistik atayarak buna "yararlılık" diyoruz ve "polarite". Model, aşağıdaki formülü kullanarak matrisi bu değerlerin bir fonksiyonu olarak tahmin etmeye çalışır:
Burada, matematiksel kavramlara girmeden değişkenlerin ne anlama geldiğine dair daha sezgisel bir anlayış sağlamak için Birdwatch makalesinde kullanılan terminolojiyi ve kendi terminolojimi tanıtacağıma dikkat edin:
μ, kullanıcıların genel olarak derecelendirmeleri ne kadar yüksek derecelendirdiğini ölçen bir "kamu duyarlılığı" parametresidir.
iu, kullanıcının "dostluğu"dur, yani kullanıcının yüksek puan verme eğiliminin ne kadar yüksek olduğudur.
notun "yararlılığı"dır, yani notun yüksek puan alma olasılığı nedir? Bu, önemsediğimiz değişkendir.
fu veya fn, kullanıcının veya Notların "kutupluluğudur", yani siyasi aşırılıkların baskın eksenindeki konumları. Uygulamada, negatif kutup kabaca "sola eğilme" ve pozitif polarite "sağa eğilme" anlamına gelir, ancak uç eksenlerin kullanıcı ve Notes verilerinin analizinden türetildiğini ve sol ve sağ kavramlarının kodlanmış olmadığını unutmayın.
Algoritma, matris değerlerini tahmin etmek için en iyi değişken değerlerini bulmak için oldukça basit bir makine öğrenme modeli (standart gradyan iniş) kullanır. Belirli bir Nota atanan kullanışlılık, o Notun nihai puanıdır. Kullanışlılığı en az + 0.4 ise bir Not görüntülenecektir.
Buradaki temel ustalık, "kutupluluğun" bir Notun bazı kullanıcılar tarafından beğenilmesine ve diğer kullanıcılar tarafından beğenilmemesine neden olan özelliklerini özümsemesi, "kullanışlılık" ise bir Notun yalnızca özelliklerini ölçer, Bu özellikler onun beğenilmesine yol açar. tüm kullanıcılar tarafından. Kullanışlılığın seçilmesi, bu nedenle, kabileler arasında onaylanan Notları tanımlar ve bir kabilede selamlanan ancak başka bir kabile tarafından beğenilmeyen Notları hariç tutar.
Yukarıdakiler yalnızca algoritmanın temel kısmını açıklar. Aslında bunun üzerine eklenmiş birçok ek mekanizma var. Neyse ki, halka açık belgelerde açıklanmıştır. Bu mekanizmalar aşağıdakileri içerir:
Algoritma birden çok kez çalıştırılır ve her seferinde oylamaya rastgele oluşturulmuş aşırı "sahte oylar" eklenir. Bu, her Not için algoritmanın gerçek çıktısının bir değer aralığı olduğu ve nihai sonucun bu aralıktan alınan ve 0,32 eşiğiyle karşılaştırılan "düşük güven düzeyine" bağlı olduğu anlamına gelir.
Birçok kullanıcı (özellikle Notlar ile benzer kutuplara sahip olanlar) bir Notu "faydasız" olarak değerlendirdiyse ve aynı "etiketi" (örneğin, "tartışmacı veya taraflı dil", "kaynak Notlar desteklenmiyor") atadıysa Notların yayınlanması için gerekli olan kullanışlılık eşiği 0,4'ten 0,5'e yükselir (bu küçük görünebilir, ancak pratikte çok önemlidir).
Bir Not kabul edilirse, kullanışlılığı Notu kabul etmek için gereken 0,01 puanlık eşiğin altına düşmelidir.
Algoritmalar birden çok modelle daha fazla çalışır ve bazen 0,3 ile 0,4 arasında ham kullanışlılık puanları olan Notları artırır.
Sonuç olarak, 22 dosyaya yayılmış toplam 6282 satırlık oldukça karmaşık bir Python kodu elde edersiniz. Ama hepsi açık ve Notları ve puanlama verilerini indirebilir ve çıktının Twitter'da gerçekte olanla eşleşip eşleşmediğini görmek için kendiniz çalıştırabilirsiniz.
Peki bu pratikte nasıl görünüyor?
Muhtemelen bu algoritma ile insanların oylarından ortalama puanı alma yöntemi arasındaki en büyük fark, benim "kutupluluk" değerleri dediğim kavramdır. Algoritma dokümantasyonu bunlara fu ve fn olarak atıfta bulunur, faktör için f kullanılır, çünkü iki terim birbirini çarpar; daha genel terim, kısmen fu ve fn'yi çok boyutlu hale getirme arzusundan kaynaklanır.
Polarite kullanıcılara ve Notes'a atanır. Kullanıcı kimliği ile temel Twitter hesabı arasındaki bağlantı kasıtlı olarak gizli tutulur, ancak Notes herkese açıktır. Aslında, en azından İngilizce veri kümesi için, algoritma tarafından oluşturulan kutupluluk, sol ve sağ ile çok yakından ilişkilidir.
Polaritesi -0,8 civarında olan bazı Notes örnekleri:
Burada rastgele seçmediğime dikkat edin; bunlar aslında, algoritmayı yerel olarak çalıştırdığımda oluşturduğum puanlı_notes.tsv elektronik tablosundaki ilk üç satır ve bunların polarite puanları (elektronik tabloda coreNoteFactor 1 olarak adlandırılır) -0.8.
Şimdi, kutupları +0.8 civarında olan bazı Notlar. Görünüşe göre, birçoğu ya Brezilya siyasetinden Portekizce konuşan insanlardı ya da Tesla'nın eleştirilerini öfkeyle çürüten Tesla hayranlarıydı, bu yüzden biraz özenle seçeyim ve her iki kategoriye de girmeyen bazı Notlar bulayım:
Bir hatırlatma olarak, "sola ve sağa bölme" algoritmaya hiçbir şekilde sabit kodlanmaz, hesaplama yoluyla keşfedilir. Bu, bu algoritmayı diğer kültürel bağlamlara uygularsanız, bunların ana siyasi bölünmelerini otomatik olarak tespit edebileceğini ve aralarında köprüler kurabileceğini gösteriyor.
Bu arada, en yüksek kullanışlılığı elde eden Notlar bu şekilde görünür. Bu sefer, Notlar aslında Twitter'da göründüğü için, bir tanesinin ekran görüntüsünü alabilirim:
Ve başka:
İkinci Notlar için, son derece partizan siyasi temaları daha doğrudan ele alıyor, ancak net, yüksek kaliteli ve bilgilendirici Notlar yüksek puan alıyor. Genel olarak, algoritma çalışıyor gibi görünüyor ve kodu çalıştırarak algoritmanın çıktısını doğrulamak mümkün görünüyor.
Algoritma hakkında ne düşünüyorum?
Bu algoritmayı analiz ederken beni en çok etkileyen şey karmaşıklığıydı. Beş terimli bir vektör ve matris denklemine en uygun olanı bulmak için gradyan inişini kullanan bir "akademik makale versiyonu" var ve sonra gerçek versiyon, birçok farklı yürütmeye sahip karmaşık bir algoritmik uygulama dizisi ve çok sayıda keyfi katsayı var. .
Akademik makale sürümleri bile altta yatan karmaşıklıkları gizler. Optimize ettiği denklem negatif bir kuartiktir (çünkü tahmin formülünde ikinci dereceden bir fu*fn terimi vardır ve maliyet fonksiyonu hatanın karesini ölçer). İkinci dereceden bir denklemi herhangi bir sayıda değişken üzerinden optimize ederken, hemen hemen her zaman benzersiz bir çözüme sahipken, oldukça basit doğrusal cebirle anlayabileceğiniz benzersiz bir çözüme sahipken, ikinci dereceden bir denklemi birçok değişken üzerinden optimize etmenin genellikle birçok çözümü vardır, bu nedenle gradyan iniş algoritmasının birden çok turu Farklı cevaplar elde edilebilir. Küçük girdi değişiklikleri, inişin bir yerel minimumdan diğerine geçmesine neden olarak çıktı sonuçlarını önemli ölçüde değiştirebilir.
Bununla ikinci dereceden finansman gibi geliştirilmesine yardım ettiğim algoritmalar arasındaki fark, benim için bir ekonomistin algoritması ile bir mühendisin algoritması arasındaki fark gibidir. Ekonomistlerin algoritmaları, en iyi ihtimalle basitliğe odaklanır, analiz edilmesi nispeten kolaydır ve eldeki görev için optimal (veya en az kötü) olduklarını belirten ve ideal olarak şunu kanıtlayan net matematiksel özelliklere sahiptir. bundan yararlanmaya çalışıyor. Öte yandan, bir mühendisin algoritması, mühendisin çalışma ortamında neyin işe yarayıp neyin yaramadığını görmek için yinelemeli bir deneme yanılma sürecinden türetilir. Bir mühendisin algoritması pragmatiktir ve işi bitirir; bir iktisatçının algoritması ise beklenmedik bir durum karşısında kontrolünü tamamen kaybetmez.
Veya saygın internet filozofu roon'un (namı diğer tszzl) ilgili bir başlığa koyduğu gibi:
Tabii ki, kripto para birimlerinin "teorik estetik" yönünün, gerçekten güven vermeyen protokoller ile iyi görünen ve yüzeysel olarak iyi çalışan, ancak aslında bazı merkezi aktörlere güvenmeyi gerektiren protokolleri doğru bir şekilde ayırt edebilmek için gerekli olduğunu söyleyebilirim. Ya da daha da kötüsü, düpedüz bir dolandırıcılık olabilir.
Derin öğrenme, normal koşullar altında etkilidir, ancak çeşitli rakip makine öğrenimi saldırılarına karşı kaçınılmaz zayıflıkları vardır. Doğru yapılırsa, teknik tuzaklar ve oldukça soyut merdivenler bu saldırılara karşı koyabilir. O halde bir sorum var: Topluluk Notlarının kendisini daha çok ekonomik bir algoritma gibi bir şeye dönüştürebilir miyiz?
Bunun ne anlama geldiğini pratikte görmek için, birkaç yıl önce benzer bir amaç için tasarladığım bir algoritmayı inceleyelim: İkili sınırlı ikinci dereceden fonlama.
İkili sınırlı ikinci dereceden fonlamanın amacı, "geleneksel" ikinci dereceden fonlamadaki bir boşluğu doldurmaktır; burada iki oyuncu birbiriyle gizli anlaşma yapsa bile, sahte bir projeye çok yüksek miktarlarda katkıda bulunabilir, fonların kendilerine iade edilmesini sağlayabilir ve Getirebilir. tüm para havuzunuzu tüketen büyük sübvansiyonlar. İkili sınırlı ikinci dereceden fonlamada, her bir katılımcı çiftine sınırlı bir bütçe M atarız. Algoritma tüm olası katılımcı çiftlerini yineler ve eğer algoritma hem A katılımcısı hem de B katılımcısı desteklediği için P projesine bir sübvansiyon eklemeye karar verirse, bu sübvansiyon o çifte tahsis edilen bütçeden düşülür (A,B) . Bu nedenle k katılımcı gizli anlaşma yapsa bile mekanizmadan çaldıkları miktar en fazla k *(k-1)*M'dir.
Algoritmanın bu biçimi, Topluluk Notları bağlamında iyi çalışmaz, çünkü her kullanıcı yalnızca az sayıda oy kullanır: ortalama olarak, herhangi iki kullanıcı arasındaki ortak oy sıfırdır, bu nedenle her bir çifte ayrı ayrı bakıldığında, Kullanıcılar, Algoritmanın, kullanıcıların polaritesini bilmesinin bir yolu yoktur. Bir makine öğrenimi modelinin amacı, tam olarak bu şekilde doğrudan analiz edilemeyen çok seyrek kaynak verilerden bir matrisi "doldurmaya" çalışmaktır. Ancak bu yaklaşımın zorluğu, az sayıda kötü oy karşısında oldukça değişken sonuçlardan kaçınmak için ekstra çaba gerektirmesidir.
Topluluk Notları gerçekten Sola ve Sağa direnebilecek mi?
Community Notes algoritmasının aslında aşırılıklara karşı dirençli olup olmadığını, yani naif bir oylama algoritmasından daha iyi performans gösterip göstermediğini analiz edebiliriz. Bu oylama algoritması zaten aşırılıklara karşı biraz dirençlidir: 200 beğeni ve 100 beğenmeme olan bir gönderi, yalnızca 200 beğeni alan bir gönderiden daha kötü performans gösterecektir. Ancak Topluluk Notları daha mı iyi?
Soyut bir algoritma bakış açısından söylemek zor. Yüksek ortalama puanı olan kutuplaştırıcı bir gönderi neden güçlü bir kutupsallık ve yüksek kullanışlılık elde edemez? Fikir şu ki, eğer bu oylar çelişiyorsa, kutupluluk, gönderinin çok oy almasına neden olan özelliği "emmeli", ancak bunu gerçekten yapıyor mu?
Bunu kontrol etmek için basitleştirilmiş uygulamamı 100 tur çalıştırdım. Ortalama sonuç aşağıdaki gibidir:
Bu testte, "iyi" Notlar, aynı siyasi görüşe sahip kullanıcılar tarafından +2, zıt siyasi görüşe sahip kullanıcılar tarafından +0 ve aynı görüşe sahip kullanıcılar tarafından "iyi ama daha aşırı" Notlar +4 olarak derecelendirildi. , ve karşı grubun kullanıcılarında -2. Ortalama puan aynı olsa da kutuplaşma farklıdır. Ve aslında, "iyi" Notların ortalama kullanışlılığı, "iyi ama daha aşırı eğilimli" Notlarınkinden daha yüksek görünüyor.
"Ekonomistin algoritmasına" daha yakın bir algoritmaya sahip olmak, algoritmanın aşırılıkları nasıl cezalandırdığına dair daha net bir hikayeye sahip olacaktır.
Tüm bunlar yüksek riskli bir durumda ne kadar yararlı?
Belirli bir duruma bakarak bunlardan bazılarını öğrenebiliriz. Yaklaşık bir ay önce Ian Bremmer, bir tweet'in son derece kritik bir Topluluk Notu eklediğinden şikayet etti, ancak Notlar o zamandan beri silindi.
Bu göz korkutucu bir görev. Mekanizma tasarımı, en büyük şikayetin yalnızca 20.000 doların aşırı bir Twitter etkileyicisine gitmesi olabileceği bir Ethereum topluluk ortamında bir şeydir. Milyonlarca insanı etkileyen siyasi ve jeopolitik meseleler söz konusu olduğunda bu farklı bir hikaye ve herkes makul bir şekilde olası en kötü nedenleri varsayma eğiliminde. Ancak, mekanik tasarımcılar dünya üzerinde önemli bir etki yaratmak istiyorsa, bu yüksek riskli ortamlarla etkileşim kurmak çok önemlidir.
Neyse ki, algoritma açık kaynaklı ve doğrulanabilir, bu yüzden aslında işin özüne inebiliriz! Bunu yapalım. Orijinal tweet'in URL'si 1676157337109946369 numarasıdır ve sonunda tweet'in kimliğidir. İndirilebilir verilerde bu kimliği arayabilir ve yukarıdaki notları içeren e-tablodaki belirli satırı belirleyebiliriz:
Burada Notes'un kimliğine sahibiz, 1676391378815709184 . Daha sonra bu kimliği, algoritmayı çalıştırarak oluşturulan puanlamalı_notes.tsv ve note_status_history.tsv dosyalarında ararız. Aşağıdaki sonucu aldık:
İlk çıktıdaki ikinci sütun, Notes'un geçerli derecelendirmesidir. İkinci çıktı Notların geçmişini gösterir: mevcut durumu yedinci sütundadır (NEEDS_MORE_RATINGS) ve aldığı ilk durum NEEDS_MORE_RATINGS değildi, beşinci sütundadır (NEEDS_MORE_RATINGS ) ŞU ANDA_RATED_HELPFUL). Dolayısıyla, algoritmanın kendisinin önce Notları gösterdiğini ve ardından derecelendirmeleri biraz düştükten sonra bunları kaldırdığını görebiliriz - hiçbir merkezi müdahale dahil görünmüyor.
Oylamanın kendisine bakarak buna başka bir açıdan da bakabiliriz. Bu Notlar için tüm derecelendirmeleri izole etmek ve kaç tanesinin YARARLI ve YARARLI OLMADIĞINI__YARARLI olarak derecelendirdiğini görmek için Ratings-00000.tsv dosyasını tarayabiliriz:
Ancak, zaman damgasına göre sıralarsanız ve ilk 50 oya bakarsanız, 40 YARARLI oy ve 9 YARARLI DEĞİL oy olduğunu görürsünüz. Böylece aynı sonuca vardık: Notes, ilk hedef kitlesi tarafından daha olumlu, sonraki izleyicileri tarafından daha az puan aldı, bu nedenle puanı yüksek başladı ve zamanla düşüşe geçti.
Ne yazık ki, Notes'un durumunu tam olarak nasıl değiştirdiğini açıklamak zor: "önceden 0,40'ın üzerinde puan aldı, şimdi 0,40'ın altında derecelendirildi, dolayısıyla kaldırıldı" gibi basit bir mesele değil. Bunun yerine, yüksek sayıda NOT_HELPFUL yanıtı istisna koşullarından birini tetikleyerek Notes'un eşiğin üzerinde kalması için ihtiyaç duyduğu kullanışlılık puanını artırır.
Bu, bize bir ders veren başka bir harika öğrenme fırsatı: Güvenilir, tarafsız bir algoritmayı gerçekten güvenilir hale getirmek, onu basit tutmayı gerektirir. Bir Not kabul edilmekten kabul edilmemeye giderse, bunun neden böyle olduğuna dair basit ve net bir hikaye olmalıdır.
Elbette bu oylamanın manipüle edilebileceği bambaşka bir yol daha var: Tugay. Onaylamadıkları bir Notları gören biri, çok ilgili bir topluluğa (veya daha kötüsü, bir sahte hesap ordusuna) onu YARARLI OLMADIĞI şeklinde derecelendirmesi için başvurabilir ve Notları Kimden almak için muhtemelen çok fazla oy gerekmez " yararlı" ila "aşırı". Algoritmanın bu tür koordineli saldırılara karşı savunmasızlığını uygun şekilde azaltmak için daha fazla analiz ve çalışma gerekiyor. Olası bir iyileştirme, herhangi bir kullanıcının herhangi bir Not üzerinde oy kullanmasına izin vermemek, bunun yerine not verenlere "sizin için" algoritma önerisini kullanarak rastgele Notlar atamak ve not verenlerin yalnızca atandıkları Notlara not vermesine izin vermek olabilir.
Topluluk Notları Yeterince "cesur" değil misiniz?
Topluluk Notları hakkında gördüğüm ana eleştiri, temelde yeterince işe yaramadığıdır. Bundan bahseden iki yeni makale gördüm. Makalelerden birini alıntılamak için:
Topluluk Notlarının kamuya açık hale gelmesi için, siyasi yelpazedeki insanların fikir birliği ile genel olarak kabul edilmesi gerektiğinden, süreç ciddi bir sınırlamadan muzdariptir.
İdeolojik bir mutabakata sahip olması gerekiyor” dedi. "Bu, soldaki insanların ve sağdaki insanların notun tweet'e eklenmesi gerektiği konusunda hemfikir olması gerektiği anlamına geliyor."
Esasen, dedi, "gerçeğe dair ideolojiler arası bir anlaşma gerektiriyor ki bu, giderek partizan bir ortamda neredeyse imkansız."
Bu zor bir soru, ama nihayetinde yanlış bilgilendirme içeren on tweet'in ücretsiz olmasının, bir tweet'e haksız yere açıklama eklenmesinden daha iyi olduğunu düşünmeye meyilliyim. Cesurca ve "aslında gerçeği biliyoruz, bir tarafın diğerinden daha sık yalan söylediğini biliyoruz" bakış açısıyla yıllarca gerçek kontrolü gördük. Ne olacak?
Dürüst olmak gerekirse, teyit kavramına karşı oldukça yaygın bir güvensizlik var. Burada bir strateji şudur: Bu eleştirmenleri görmezden gelin, teyitçilerin gerçekleri herhangi bir oylama sisteminden daha iyi bildiğini unutmayın ve buna bağlı kalın. Ancak bu yaklaşımda her şeyi hesaba katmak riskli görünüyor. Herkes tarafından en azından bir şekilde saygı duyulan kabileler arası kurumlar inşa etmenin değeri vardır. William Blackstone'un hükmü ve mahkemeler gibi, bu saygıyı sürdürmenin gönüllü hatadan ziyade ihmal nedeniyle hata yapan bir sistem gerektirdiğini düşünüyorum. Bu yüzden, en azından bir büyük örgütün bu farklı yolu izlemesi ve kabileler arası ender saygıyı değerli bir kaynak olarak görmesi bana değerli görünüyor.
Topluluk Notları'nın muhafazakar olmasının sorun olmadığını düşünmemin bir başka nedeni de, her yanlış bilgilendirilmiş tweet'in, hatta çoğu yanlış bilgilendirilmiş tweet'in bir düzeltici not alması gerektiğini düşünmemem. Yanlış bilgilendirilmiş tweet'lerin yüzde birinden daha azı bağlam veya düzeltme sağlamak için açıklama eklense bile, Topluluk Notları yine de bir eğitim aracı olarak son derece değerli bir hizmet sunar. Amaç her şeyi düzeltmek değil; daha ziyade amaç, insanlara birden çok bakış açısı olduğunu, tek başına ikna edici ve ilgi çekici görünen bazı gönderilerin aslında oldukça yanlış olduğunu ve evet, genellikle temel şeyleri yapabileceğinizi hatırlatmak. yanlış olduğunu doğrulamak için internet araması yapın.
Topluluk Notları, kamusal epistemolojideki tüm sorunlara her derde deva olamaz ve böyle olması amaçlanmamıştır. Çözemediği sorunlar ne olursa olsun, ister tahmin pazarları gibi yenilikçi araçlar, ister boşlukları doldurmaya çalışmak için alan uzmanlığına sahip tam zamanlı personel işe alan yerleşik kuruluşlar olsun, diğer mekanizmaların dolduracağı çok yer var.
Sonuç olarak
Topluluk Notları, yalnızca sosyal medyada büyüleyici bir deney değil, aynı zamanda gelişmekte olan bir mekanizma tasarımının büyüleyici bir örneğidir: bilinçli olarak aşırı uçları belirlemeye çalışan ve bölünmeyi sürdürmek yerine çaprazlamayı teşvik etme eğiliminde olan mekanizmalar.
Bu kategoride bildiğim diğer iki örnek: (i) Gitcoin Hibelerinde kullanılan eşleştirilmiş ikinci dereceden finansman mekanizması ve (ii) topluluğun ortak Popüler ifadeleri tanımlamasına yardımcı olmak için kümeleme algoritmalarını kullanan bir tartışma aracı olan Polis. genellikle farklı görüşlere sahiptir. Bu mekanizma tasarımı alanı değerlidir ve umarım bu alanda daha fazla akademik çalışma görürüz.
Community Notes'un sağladığı algoritmik şeffaflık tam olarak merkezi olmayan sosyal medya değildir - Community Notes'un nasıl çalıştığına katılmıyorsanız, aynı içerik üzerinde farklı bir algoritmik bakış açısı görmeniz mümkün değildir. Ancak bu, hiper ölçekli uygulamaların önümüzdeki birkaç yıl içinde ulaşacakları en yakın noktadır ve hem merkezi manipülasyonu önleyerek hem de bu tür manipülasyonlara girmeyen platformların hak ettikleri değeri almasını sağlayarak şimdiden çok fazla değer sağladığını görebiliriz. .
Topluluk Notlarının ve benzer ruha sahip birçok algoritmanın önümüzdeki on yılda gelişip büyümesini görmeyi dört gözle bekliyorum.
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
V God: Sosyal medya deneyi Topluluk Notları çok şifrelidir
Yazar: vitalik; Derleyen: Deep Tide TechFlow
Geçtiğimiz iki yıl, Twitter (X) için tartışmalı bir şekilde çalkantılı geçti. Geçen yıl, Elon Musk platformu 44 milyar dolara satın aldı ve ardından şirketin kadrosunu, içerik incelemesini, iş modelini ve web sitesi kültürünü elden geçirdi.Bu değişiklikler, belirli politika kararlarından ziyade Elon Musk'ın yumuşak gücünden kaynaklanıyor olabilir. Bununla birlikte, bu tartışmalı hamlelerin ortasında, Twitter'daki yeni bir özellik hızla önem kazanıyor ve görünüşe göre siyasi yelpazede beğeni kazanıyor: Topluluk Notları.
Topluluk Notları, yukarıdaki Elon Musk'ınki gibi, bazen tweet'lere bağlamsal ek açıklamalar ekleyen bir gerçek kontrol aracıdır. Başlangıçta Birdwatch olarak adlandırıldı ve ilk olarak Ocak 2021'de pilot program olarak başlatıldı. O zamandan beri kademeli olarak genişledi ve en hızlı genişleme aşaması geçen yıl Elon Musk'ın Twitter'ı devralmasıyla aynı zamana denk geldi. Bugün, Topluluk Notları, tartışmalı siyasi konuları ele alanlar da dahil olmak üzere Twitter'da çok fazla dikkat çeken tweet'lerin düzenli bir özelliğidir. Kanaatimce ve siyasi yelpazedeki birçok insanla yaptığım sohbetlerden yola çıkarak, bu Notlar ortaya çıktıklarında bilgilendirici ve değerlidir.
Ama beni en çok ilgilendiren, bir "kripto projesi" olmasa da, muhtemelen ana akım dünyada gördüğümüz "kripto değerlerinin" en yakın örneği olan Topluluk Notları. Topluluk Notları, merkezi olarak seçilen bir uzman tarafından yazılmaz veya küratörlüğünü yapmaz; bunun yerine herkes yazıp oylayabilir ve hangi Notların görüntülenip görüntülenmeyeceği tamamen açık kaynaklı bir algoritma tarafından belirlenir. Twitter web sitesinde, algoritmanın nasıl çalıştığını açıklayan ayrıntılı ve kapsamlı bir kılavuz vardır ve gönderilen Notları ve oyları içeren verileri indirebilir, algoritmayı yerel olarak çalıştırabilir ve çıktının Twitter web sitesinde görünenle eşleştiğini doğrulayabilirsiniz. Mükemmel olmasa da, oldukça tartışmalı durumlarda inandırıcı tarafsızlık idealine şaşırtıcı derecede yakındır ve aynı zamanda çok faydalıdır.
Topluluk Notları algoritması nasıl çalışır?
Belirli kriterleri (temel olarak: 6 aydan uzun süredir aktif, ihlal geçmişi yok, doğrulanmış cep telefonu numarası) karşılayan bir Twitter hesabı olan herkes, Topluluk Notlarına katılmak için kaydolabilir. Şu anda, katılımcılar yavaş ve rastgele kabul ediliyor, ancak sonunda plan, uygun olan herkesin katılmasına izin vermek. Kabul edildikten sonra, önce mevcut Notların notlandırılmasına katılabilirsiniz ve notunuz yeterince iyi olduğunda (hangi notun o Notun nihai sonucuyla eşleştiğini görerek ölçülür), kendi Notlarınızı da yazabilirsiniz.
Bir Not yazdığınızda, Notlar diğer Community Notes üyelerinin incelemelerine göre bir puan alır. Bu incelemeler, "yararlı", "biraz yararlı" ve "yardımcı değil" olmak üzere üç düzeydeki oylar olarak görüntülenebilir, ancak incelemeler, algoritmada rol oynayan başka etiketler de içerebilir. Bu incelemelere göre Notes'a bir puan verilir. Notların puanı 0,40'ı aşarsa, bu Notlar görüntülenecektir, aksi takdirde bu Notlar görüntülenmeyecektir.
Algoritmayı benzersiz kılan, puanın nasıl hesaplandığıdır. Basitçe kullanıcı puanlarının bir tür toplamını veya ortalamasını hesaplamak ve bunu nihai sonuç olarak kullanmak için tasarlanmış basit algoritmaların aksine, Topluluk Notları derecelendirme algoritması, açıkça farklı bakış açılarına sahip kişilerden olumlu puanlar alanlara öncelik vermeye çalışır. Yani, genellikle derecelendirmeler konusunda aynı fikirde olmayan kişiler sonunda belirli bir Not üzerinde anlaşırlarsa, o Not yüksek puan alacaktır.
Nasıl çalıştığına daha yakından bakalım. Bir dizi kullanıcımız ve bir dizi Notumuz var; Mij hücresinin i. kullanıcının j. Notları nasıl derecelendirdiğini temsil ettiği bir M matrisi oluşturabiliriz.
Herhangi bir Not için, çoğu kullanıcı o Notu derecelendirmemiştir, bu nedenle matristeki çoğu giriş sıfır olacaktır, ancak sorun değil. Algoritmanın amacı, dört sütunlu bir kullanıcı ve Not modeli oluşturmaktır, her kullanıcıya "Samimiyet" ve "Polarite" diyebileceğimiz iki istatistik atayarak ve her Nota iki istatistik atayarak buna "yararlılık" diyoruz ve "polarite". Model, aşağıdaki formülü kullanarak matrisi bu değerlerin bir fonksiyonu olarak tahmin etmeye çalışır:
Burada, matematiksel kavramlara girmeden değişkenlerin ne anlama geldiğine dair daha sezgisel bir anlayış sağlamak için Birdwatch makalesinde kullanılan terminolojiyi ve kendi terminolojimi tanıtacağıma dikkat edin:
Algoritma, matris değerlerini tahmin etmek için en iyi değişken değerlerini bulmak için oldukça basit bir makine öğrenme modeli (standart gradyan iniş) kullanır. Belirli bir Nota atanan kullanışlılık, o Notun nihai puanıdır. Kullanışlılığı en az + 0.4 ise bir Not görüntülenecektir.
Buradaki temel ustalık, "kutupluluğun" bir Notun bazı kullanıcılar tarafından beğenilmesine ve diğer kullanıcılar tarafından beğenilmemesine neden olan özelliklerini özümsemesi, "kullanışlılık" ise bir Notun yalnızca özelliklerini ölçer, Bu özellikler onun beğenilmesine yol açar. tüm kullanıcılar tarafından. Kullanışlılığın seçilmesi, bu nedenle, kabileler arasında onaylanan Notları tanımlar ve bir kabilede selamlanan ancak başka bir kabile tarafından beğenilmeyen Notları hariç tutar.
Yukarıdakiler yalnızca algoritmanın temel kısmını açıklar. Aslında bunun üzerine eklenmiş birçok ek mekanizma var. Neyse ki, halka açık belgelerde açıklanmıştır. Bu mekanizmalar aşağıdakileri içerir:
Sonuç olarak, 22 dosyaya yayılmış toplam 6282 satırlık oldukça karmaşık bir Python kodu elde edersiniz. Ama hepsi açık ve Notları ve puanlama verilerini indirebilir ve çıktının Twitter'da gerçekte olanla eşleşip eşleşmediğini görmek için kendiniz çalıştırabilirsiniz.
Peki bu pratikte nasıl görünüyor?
Muhtemelen bu algoritma ile insanların oylarından ortalama puanı alma yöntemi arasındaki en büyük fark, benim "kutupluluk" değerleri dediğim kavramdır. Algoritma dokümantasyonu bunlara fu ve fn olarak atıfta bulunur, faktör için f kullanılır, çünkü iki terim birbirini çarpar; daha genel terim, kısmen fu ve fn'yi çok boyutlu hale getirme arzusundan kaynaklanır.
Polarite kullanıcılara ve Notes'a atanır. Kullanıcı kimliği ile temel Twitter hesabı arasındaki bağlantı kasıtlı olarak gizli tutulur, ancak Notes herkese açıktır. Aslında, en azından İngilizce veri kümesi için, algoritma tarafından oluşturulan kutupluluk, sol ve sağ ile çok yakından ilişkilidir.
Polaritesi -0,8 civarında olan bazı Notes örnekleri:
Burada rastgele seçmediğime dikkat edin; bunlar aslında, algoritmayı yerel olarak çalıştırdığımda oluşturduğum puanlı_notes.tsv elektronik tablosundaki ilk üç satır ve bunların polarite puanları (elektronik tabloda coreNoteFactor 1 olarak adlandırılır) -0.8.
Şimdi, kutupları +0.8 civarında olan bazı Notlar. Görünüşe göre, birçoğu ya Brezilya siyasetinden Portekizce konuşan insanlardı ya da Tesla'nın eleştirilerini öfkeyle çürüten Tesla hayranlarıydı, bu yüzden biraz özenle seçeyim ve her iki kategoriye de girmeyen bazı Notlar bulayım:
Bir hatırlatma olarak, "sola ve sağa bölme" algoritmaya hiçbir şekilde sabit kodlanmaz, hesaplama yoluyla keşfedilir. Bu, bu algoritmayı diğer kültürel bağlamlara uygularsanız, bunların ana siyasi bölünmelerini otomatik olarak tespit edebileceğini ve aralarında köprüler kurabileceğini gösteriyor.
Bu arada, en yüksek kullanışlılığı elde eden Notlar bu şekilde görünür. Bu sefer, Notlar aslında Twitter'da göründüğü için, bir tanesinin ekran görüntüsünü alabilirim:
Ve başka:
İkinci Notlar için, son derece partizan siyasi temaları daha doğrudan ele alıyor, ancak net, yüksek kaliteli ve bilgilendirici Notlar yüksek puan alıyor. Genel olarak, algoritma çalışıyor gibi görünüyor ve kodu çalıştırarak algoritmanın çıktısını doğrulamak mümkün görünüyor.
Algoritma hakkında ne düşünüyorum?
Bu algoritmayı analiz ederken beni en çok etkileyen şey karmaşıklığıydı. Beş terimli bir vektör ve matris denklemine en uygun olanı bulmak için gradyan inişini kullanan bir "akademik makale versiyonu" var ve sonra gerçek versiyon, birçok farklı yürütmeye sahip karmaşık bir algoritmik uygulama dizisi ve çok sayıda keyfi katsayı var. .
Akademik makale sürümleri bile altta yatan karmaşıklıkları gizler. Optimize ettiği denklem negatif bir kuartiktir (çünkü tahmin formülünde ikinci dereceden bir fu*fn terimi vardır ve maliyet fonksiyonu hatanın karesini ölçer). İkinci dereceden bir denklemi herhangi bir sayıda değişken üzerinden optimize ederken, hemen hemen her zaman benzersiz bir çözüme sahipken, oldukça basit doğrusal cebirle anlayabileceğiniz benzersiz bir çözüme sahipken, ikinci dereceden bir denklemi birçok değişken üzerinden optimize etmenin genellikle birçok çözümü vardır, bu nedenle gradyan iniş algoritmasının birden çok turu Farklı cevaplar elde edilebilir. Küçük girdi değişiklikleri, inişin bir yerel minimumdan diğerine geçmesine neden olarak çıktı sonuçlarını önemli ölçüde değiştirebilir.
Bununla ikinci dereceden finansman gibi geliştirilmesine yardım ettiğim algoritmalar arasındaki fark, benim için bir ekonomistin algoritması ile bir mühendisin algoritması arasındaki fark gibidir. Ekonomistlerin algoritmaları, en iyi ihtimalle basitliğe odaklanır, analiz edilmesi nispeten kolaydır ve eldeki görev için optimal (veya en az kötü) olduklarını belirten ve ideal olarak şunu kanıtlayan net matematiksel özelliklere sahiptir. bundan yararlanmaya çalışıyor. Öte yandan, bir mühendisin algoritması, mühendisin çalışma ortamında neyin işe yarayıp neyin yaramadığını görmek için yinelemeli bir deneme yanılma sürecinden türetilir. Bir mühendisin algoritması pragmatiktir ve işi bitirir; bir iktisatçının algoritması ise beklenmedik bir durum karşısında kontrolünü tamamen kaybetmez.
Veya saygın internet filozofu roon'un (namı diğer tszzl) ilgili bir başlığa koyduğu gibi:
Tabii ki, kripto para birimlerinin "teorik estetik" yönünün, gerçekten güven vermeyen protokoller ile iyi görünen ve yüzeysel olarak iyi çalışan, ancak aslında bazı merkezi aktörlere güvenmeyi gerektiren protokolleri doğru bir şekilde ayırt edebilmek için gerekli olduğunu söyleyebilirim. Ya da daha da kötüsü, düpedüz bir dolandırıcılık olabilir.
Derin öğrenme, normal koşullar altında etkilidir, ancak çeşitli rakip makine öğrenimi saldırılarına karşı kaçınılmaz zayıflıkları vardır. Doğru yapılırsa, teknik tuzaklar ve oldukça soyut merdivenler bu saldırılara karşı koyabilir. O halde bir sorum var: Topluluk Notlarının kendisini daha çok ekonomik bir algoritma gibi bir şeye dönüştürebilir miyiz?
Bunun ne anlama geldiğini pratikte görmek için, birkaç yıl önce benzer bir amaç için tasarladığım bir algoritmayı inceleyelim: İkili sınırlı ikinci dereceden fonlama.
İkili sınırlı ikinci dereceden fonlamanın amacı, "geleneksel" ikinci dereceden fonlamadaki bir boşluğu doldurmaktır; burada iki oyuncu birbiriyle gizli anlaşma yapsa bile, sahte bir projeye çok yüksek miktarlarda katkıda bulunabilir, fonların kendilerine iade edilmesini sağlayabilir ve Getirebilir. tüm para havuzunuzu tüketen büyük sübvansiyonlar. İkili sınırlı ikinci dereceden fonlamada, her bir katılımcı çiftine sınırlı bir bütçe M atarız. Algoritma tüm olası katılımcı çiftlerini yineler ve eğer algoritma hem A katılımcısı hem de B katılımcısı desteklediği için P projesine bir sübvansiyon eklemeye karar verirse, bu sübvansiyon o çifte tahsis edilen bütçeden düşülür (A,B) . Bu nedenle k katılımcı gizli anlaşma yapsa bile mekanizmadan çaldıkları miktar en fazla k *(k-1)*M'dir.
Algoritmanın bu biçimi, Topluluk Notları bağlamında iyi çalışmaz, çünkü her kullanıcı yalnızca az sayıda oy kullanır: ortalama olarak, herhangi iki kullanıcı arasındaki ortak oy sıfırdır, bu nedenle her bir çifte ayrı ayrı bakıldığında, Kullanıcılar, Algoritmanın, kullanıcıların polaritesini bilmesinin bir yolu yoktur. Bir makine öğrenimi modelinin amacı, tam olarak bu şekilde doğrudan analiz edilemeyen çok seyrek kaynak verilerden bir matrisi "doldurmaya" çalışmaktır. Ancak bu yaklaşımın zorluğu, az sayıda kötü oy karşısında oldukça değişken sonuçlardan kaçınmak için ekstra çaba gerektirmesidir.
Topluluk Notları gerçekten Sola ve Sağa direnebilecek mi?
Community Notes algoritmasının aslında aşırılıklara karşı dirençli olup olmadığını, yani naif bir oylama algoritmasından daha iyi performans gösterip göstermediğini analiz edebiliriz. Bu oylama algoritması zaten aşırılıklara karşı biraz dirençlidir: 200 beğeni ve 100 beğenmeme olan bir gönderi, yalnızca 200 beğeni alan bir gönderiden daha kötü performans gösterecektir. Ancak Topluluk Notları daha mı iyi?
Soyut bir algoritma bakış açısından söylemek zor. Yüksek ortalama puanı olan kutuplaştırıcı bir gönderi neden güçlü bir kutupsallık ve yüksek kullanışlılık elde edemez? Fikir şu ki, eğer bu oylar çelişiyorsa, kutupluluk, gönderinin çok oy almasına neden olan özelliği "emmeli", ancak bunu gerçekten yapıyor mu?
Bunu kontrol etmek için basitleştirilmiş uygulamamı 100 tur çalıştırdım. Ortalama sonuç aşağıdaki gibidir:
Bu testte, "iyi" Notlar, aynı siyasi görüşe sahip kullanıcılar tarafından +2, zıt siyasi görüşe sahip kullanıcılar tarafından +0 ve aynı görüşe sahip kullanıcılar tarafından "iyi ama daha aşırı" Notlar +4 olarak derecelendirildi. , ve karşı grubun kullanıcılarında -2. Ortalama puan aynı olsa da kutuplaşma farklıdır. Ve aslında, "iyi" Notların ortalama kullanışlılığı, "iyi ama daha aşırı eğilimli" Notlarınkinden daha yüksek görünüyor.
"Ekonomistin algoritmasına" daha yakın bir algoritmaya sahip olmak, algoritmanın aşırılıkları nasıl cezalandırdığına dair daha net bir hikayeye sahip olacaktır.
Tüm bunlar yüksek riskli bir durumda ne kadar yararlı?
Belirli bir duruma bakarak bunlardan bazılarını öğrenebiliriz. Yaklaşık bir ay önce Ian Bremmer, bir tweet'in son derece kritik bir Topluluk Notu eklediğinden şikayet etti, ancak Notlar o zamandan beri silindi.
Bu göz korkutucu bir görev. Mekanizma tasarımı, en büyük şikayetin yalnızca 20.000 doların aşırı bir Twitter etkileyicisine gitmesi olabileceği bir Ethereum topluluk ortamında bir şeydir. Milyonlarca insanı etkileyen siyasi ve jeopolitik meseleler söz konusu olduğunda bu farklı bir hikaye ve herkes makul bir şekilde olası en kötü nedenleri varsayma eğiliminde. Ancak, mekanik tasarımcılar dünya üzerinde önemli bir etki yaratmak istiyorsa, bu yüksek riskli ortamlarla etkileşim kurmak çok önemlidir.
Neyse ki, algoritma açık kaynaklı ve doğrulanabilir, bu yüzden aslında işin özüne inebiliriz! Bunu yapalım. Orijinal tweet'in URL'si 1676157337109946369 numarasıdır ve sonunda tweet'in kimliğidir. İndirilebilir verilerde bu kimliği arayabilir ve yukarıdaki notları içeren e-tablodaki belirli satırı belirleyebiliriz:
Burada Notes'un kimliğine sahibiz, 1676391378815709184 . Daha sonra bu kimliği, algoritmayı çalıştırarak oluşturulan puanlamalı_notes.tsv ve note_status_history.tsv dosyalarında ararız. Aşağıdaki sonucu aldık:
İlk çıktıdaki ikinci sütun, Notes'un geçerli derecelendirmesidir. İkinci çıktı Notların geçmişini gösterir: mevcut durumu yedinci sütundadır (NEEDS_MORE_RATINGS) ve aldığı ilk durum NEEDS_MORE_RATINGS değildi, beşinci sütundadır (NEEDS_MORE_RATINGS ) ŞU ANDA_RATED_HELPFUL). Dolayısıyla, algoritmanın kendisinin önce Notları gösterdiğini ve ardından derecelendirmeleri biraz düştükten sonra bunları kaldırdığını görebiliriz - hiçbir merkezi müdahale dahil görünmüyor.
Oylamanın kendisine bakarak buna başka bir açıdan da bakabiliriz. Bu Notlar için tüm derecelendirmeleri izole etmek ve kaç tanesinin YARARLI ve YARARLI OLMADIĞINI__YARARLI olarak derecelendirdiğini görmek için Ratings-00000.tsv dosyasını tarayabiliriz:
Ancak, zaman damgasına göre sıralarsanız ve ilk 50 oya bakarsanız, 40 YARARLI oy ve 9 YARARLI DEĞİL oy olduğunu görürsünüz. Böylece aynı sonuca vardık: Notes, ilk hedef kitlesi tarafından daha olumlu, sonraki izleyicileri tarafından daha az puan aldı, bu nedenle puanı yüksek başladı ve zamanla düşüşe geçti.
Ne yazık ki, Notes'un durumunu tam olarak nasıl değiştirdiğini açıklamak zor: "önceden 0,40'ın üzerinde puan aldı, şimdi 0,40'ın altında derecelendirildi, dolayısıyla kaldırıldı" gibi basit bir mesele değil. Bunun yerine, yüksek sayıda NOT_HELPFUL yanıtı istisna koşullarından birini tetikleyerek Notes'un eşiğin üzerinde kalması için ihtiyaç duyduğu kullanışlılık puanını artırır.
Bu, bize bir ders veren başka bir harika öğrenme fırsatı: Güvenilir, tarafsız bir algoritmayı gerçekten güvenilir hale getirmek, onu basit tutmayı gerektirir. Bir Not kabul edilmekten kabul edilmemeye giderse, bunun neden böyle olduğuna dair basit ve net bir hikaye olmalıdır.
Elbette bu oylamanın manipüle edilebileceği bambaşka bir yol daha var: Tugay. Onaylamadıkları bir Notları gören biri, çok ilgili bir topluluğa (veya daha kötüsü, bir sahte hesap ordusuna) onu YARARLI OLMADIĞI şeklinde derecelendirmesi için başvurabilir ve Notları Kimden almak için muhtemelen çok fazla oy gerekmez " yararlı" ila "aşırı". Algoritmanın bu tür koordineli saldırılara karşı savunmasızlığını uygun şekilde azaltmak için daha fazla analiz ve çalışma gerekiyor. Olası bir iyileştirme, herhangi bir kullanıcının herhangi bir Not üzerinde oy kullanmasına izin vermemek, bunun yerine not verenlere "sizin için" algoritma önerisini kullanarak rastgele Notlar atamak ve not verenlerin yalnızca atandıkları Notlara not vermesine izin vermek olabilir.
Topluluk Notları Yeterince "cesur" değil misiniz?
Topluluk Notları hakkında gördüğüm ana eleştiri, temelde yeterince işe yaramadığıdır. Bundan bahseden iki yeni makale gördüm. Makalelerden birini alıntılamak için:
Topluluk Notlarının kamuya açık hale gelmesi için, siyasi yelpazedeki insanların fikir birliği ile genel olarak kabul edilmesi gerektiğinden, süreç ciddi bir sınırlamadan muzdariptir.
İdeolojik bir mutabakata sahip olması gerekiyor” dedi. "Bu, soldaki insanların ve sağdaki insanların notun tweet'e eklenmesi gerektiği konusunda hemfikir olması gerektiği anlamına geliyor."
Esasen, dedi, "gerçeğe dair ideolojiler arası bir anlaşma gerektiriyor ki bu, giderek partizan bir ortamda neredeyse imkansız."
Bu zor bir soru, ama nihayetinde yanlış bilgilendirme içeren on tweet'in ücretsiz olmasının, bir tweet'e haksız yere açıklama eklenmesinden daha iyi olduğunu düşünmeye meyilliyim. Cesurca ve "aslında gerçeği biliyoruz, bir tarafın diğerinden daha sık yalan söylediğini biliyoruz" bakış açısıyla yıllarca gerçek kontrolü gördük. Ne olacak?
Dürüst olmak gerekirse, teyit kavramına karşı oldukça yaygın bir güvensizlik var. Burada bir strateji şudur: Bu eleştirmenleri görmezden gelin, teyitçilerin gerçekleri herhangi bir oylama sisteminden daha iyi bildiğini unutmayın ve buna bağlı kalın. Ancak bu yaklaşımda her şeyi hesaba katmak riskli görünüyor. Herkes tarafından en azından bir şekilde saygı duyulan kabileler arası kurumlar inşa etmenin değeri vardır. William Blackstone'un hükmü ve mahkemeler gibi, bu saygıyı sürdürmenin gönüllü hatadan ziyade ihmal nedeniyle hata yapan bir sistem gerektirdiğini düşünüyorum. Bu yüzden, en azından bir büyük örgütün bu farklı yolu izlemesi ve kabileler arası ender saygıyı değerli bir kaynak olarak görmesi bana değerli görünüyor.
Topluluk Notları'nın muhafazakar olmasının sorun olmadığını düşünmemin bir başka nedeni de, her yanlış bilgilendirilmiş tweet'in, hatta çoğu yanlış bilgilendirilmiş tweet'in bir düzeltici not alması gerektiğini düşünmemem. Yanlış bilgilendirilmiş tweet'lerin yüzde birinden daha azı bağlam veya düzeltme sağlamak için açıklama eklense bile, Topluluk Notları yine de bir eğitim aracı olarak son derece değerli bir hizmet sunar. Amaç her şeyi düzeltmek değil; daha ziyade amaç, insanlara birden çok bakış açısı olduğunu, tek başına ikna edici ve ilgi çekici görünen bazı gönderilerin aslında oldukça yanlış olduğunu ve evet, genellikle temel şeyleri yapabileceğinizi hatırlatmak. yanlış olduğunu doğrulamak için internet araması yapın.
Topluluk Notları, kamusal epistemolojideki tüm sorunlara her derde deva olamaz ve böyle olması amaçlanmamıştır. Çözemediği sorunlar ne olursa olsun, ister tahmin pazarları gibi yenilikçi araçlar, ister boşlukları doldurmaya çalışmak için alan uzmanlığına sahip tam zamanlı personel işe alan yerleşik kuruluşlar olsun, diğer mekanizmaların dolduracağı çok yer var.
Sonuç olarak
Topluluk Notları, yalnızca sosyal medyada büyüleyici bir deney değil, aynı zamanda gelişmekte olan bir mekanizma tasarımının büyüleyici bir örneğidir: bilinçli olarak aşırı uçları belirlemeye çalışan ve bölünmeyi sürdürmek yerine çaprazlamayı teşvik etme eğiliminde olan mekanizmalar.
Bu kategoride bildiğim diğer iki örnek: (i) Gitcoin Hibelerinde kullanılan eşleştirilmiş ikinci dereceden finansman mekanizması ve (ii) topluluğun ortak Popüler ifadeleri tanımlamasına yardımcı olmak için kümeleme algoritmalarını kullanan bir tartışma aracı olan Polis. genellikle farklı görüşlere sahiptir. Bu mekanizma tasarımı alanı değerlidir ve umarım bu alanda daha fazla akademik çalışma görürüz.
Community Notes'un sağladığı algoritmik şeffaflık tam olarak merkezi olmayan sosyal medya değildir - Community Notes'un nasıl çalıştığına katılmıyorsanız, aynı içerik üzerinde farklı bir algoritmik bakış açısı görmeniz mümkün değildir. Ancak bu, hiper ölçekli uygulamaların önümüzdeki birkaç yıl içinde ulaşacakları en yakın noktadır ve hem merkezi manipülasyonu önleyerek hem de bu tür manipülasyonlara girmeyen platformların hak ettikleri değeri almasını sağlayarak şimdiden çok fazla değer sağladığını görebiliriz. .
Topluluk Notlarının ve benzer ruha sahip birçok algoritmanın önümüzdeki on yılda gelişip büyümesini görmeyi dört gözle bekliyorum.