Compilation du texte original : Deep Tide TechFlow
Les deux dernières années ont sans doute été turbulentes pour Twitter (X). L'année dernière, Elon Musk a acheté la plate-forme pour 44 milliards de dollars, puis a remanié la dotation en personnel, l'examen du contenu, le modèle commercial et la culture du site Web de l'entreprise.Ces changements peuvent être davantage dus au soft power d'Elon Musk qu'à des décisions politiques spécifiques. Au milieu de ces mouvements controversés, cependant, une nouvelle fonctionnalité sur Twitter gagne rapidement en importance et semble bénéficier de la faveur de l'ensemble du spectre politique : les notes de la communauté.
Community Notes est un outil de vérification des faits qui attache parfois des annotations contextuelles aux tweets, comme celui d'Elon Musk ci-dessus, en tant qu'outil de vérification des faits et anti-désinformation. Il s'appelait à l'origine Birdwatch et a été lancé pour la première fois en tant que programme pilote en janvier 2021. Depuis lors, il s'est progressivement étendu, la phase d'expansion la plus rapide coïncidant avec le rachat de Twitter par Elon Musk l'année dernière. Aujourd'hui, les notes de la communauté sont une caractéristique régulière des tweets qui attirent beaucoup d'attention sur Twitter, y compris ceux qui traitent de sujets politiques controversés. À mon avis, et d'après mes conversations avec de nombreuses personnes de tous horizons politiques, ces notes sont informatives et précieuses lorsqu'elles paraissent.
Mais ce qui m'intéresse le plus, ce sont les Community Notes, qui, bien qu'il ne s'agisse pas d'un "projet crypto", sont probablement l'exemple le plus proche de "valeurs crypto" que nous ayons vu dans le monde grand public. Les notes de la communauté ne sont pas écrites ou organisées par un expert sélectionné de manière centralisée ; au lieu de cela, n'importe qui peut écrire et voter, et les notes à afficher ou à ne pas afficher sont entièrement déterminées par un algorithme open source. Le site Web de Twitter propose un guide détaillé et complet décrivant le fonctionnement de l'algorithme. Vous pouvez télécharger les données contenant les notes et les votes publiés, exécuter l'algorithme localement et vérifier que la sortie correspond à ce qui est visible sur le site Web de Twitter. Bien qu'il ne soit pas parfait, il est étonnamment proche de l'idéal de neutralité crédible dans des situations plutôt controversées, et est très utile en même temps.
Comment fonctionne l'algorithme Community Notes ?
Toute personne disposant d'un compte Twitter répondant à certains critères (essentiellement : actif depuis plus de 6 mois, aucun historique d'infractions, numéro de téléphone portable vérifié) peut s'inscrire pour participer aux Notes de la communauté. Actuellement, les participants sont acceptés lentement et au hasard, mais finalement le plan est de permettre à toute personne éligible de se joindre. Une fois accepté, vous pouvez d'abord participer à la notation des notes existantes, et une fois que votre note est suffisamment bonne (mesurée en voyant quelle note correspond au résultat final pour cette note), vous pouvez également rédiger vos propres notes.
Lorsque vous écrivez une note, les notes obtiennent un score basé sur l'examen des autres membres de Community Notes. Ces avis peuvent être considérés comme des votes selon les trois niveaux "utile", "plutôt utile" et "pas utile", mais les avis peuvent également contenir d'autres étiquettes qui jouent un rôle dans l'algorithme. Sur la base de ces avis, Notes reçoit une note. Si le score des notes dépasse 0,40, alors ces notes seront affichées ; sinon, ces notes ne seront pas affichées.
Ce qui rend l'algorithme unique, c'est la façon dont le score est calculé. Contrairement aux algorithmes simplistes, qui sont conçus pour calculer simplement une sorte de somme ou de moyenne des évaluations des utilisateurs et l'utiliser comme résultat final, l'algorithme d'évaluation des notes de la communauté essaie explicitement de prioriser ceux qui obtiennent des notes positives de personnes ayant des perspectives différentes Notes. Autrement dit, si des personnes qui ne sont généralement pas d'accord sur les notes finissent par s'entendre sur une note particulière, alors cette note sera très bien notée.
Voyons plus en détail comment cela fonctionne. Nous avons un ensemble d'utilisateurs et un ensemble de Notes ; nous pouvons créer une matrice M où la cellule Mij représente la façon dont le i-ème utilisateur a évalué les j-ème Notes.
Pour une note donnée, la plupart des utilisateurs n'ont pas évalué cette note, donc la plupart des entrées dans la matrice seront nulles, mais ce n'est pas grave. Le but de l'algorithme est de créer un modèle à quatre colonnes d'utilisateurs et de notes, en attribuant à chaque utilisateur deux statistiques, que nous pouvons appeler "convivialité" et "polarité", et en attribuant à chaque note deux statistiques, nous l'appelons "utilité" et "polarité". Le modèle essaie de prédire la matrice en fonction de ces valeurs, en utilisant la formule suivante :
Notez qu'ici j'introduis la terminologie utilisée dans l'article Birdwatch, ainsi que la mienne pour fournir une compréhension plus intuitive de ce que signifient les variables sans entrer dans les concepts mathématiques :
μ est un paramètre de "sentiment du public" qui mesure la manière dont les utilisateurs évaluent généralement les notes.
iu est la "convivialité" de l'utilisateur, c'est-à-dire la probabilité que l'utilisateur ait tendance à donner une note élevée.
in est "l'utilité" de la note, c'est-à-dire quelle est la probabilité que la note soit bien notée. C'est la variable qui nous intéresse.
fu ou fn est la "polarité" de l'utilisateur ou des notes, c'est-à-dire leur position sur l'axe dominant des extrêmes politiques. En pratique, la polarité négative signifie à peu près "inclinaison à gauche" et la polarité positive "inclinaison à droite", mais notez que les axes extrêmes sont dérivés de l'analyse des données de l'utilisateur et des notes, et les concepts de gauche et de droite ne sont pas codés en dur.
L'algorithme utilise un modèle d'apprentissage automatique assez basique (descente de gradient standard) pour trouver les meilleures valeurs de variable pour prédire les valeurs de la matrice. L'utilité attribuée à une note particulière est le score final pour cette note. Une note sera affichée si son utilité est d'au moins + 0,4.
L'ingéniosité de base ici est que la "polarité" absorbe les caractéristiques d'une note, ce qui la rend appréciée par certains utilisateurs et détestée par d'autres utilisateurs, tandis que "l'utilité" ne mesure que les caractéristiques d'une note. Ces caractéristiques conduisent à ce qu'elle soit appréciée. par tous les utilisateurs. La sélection de l'utilité identifie donc les notes qui sont approuvées dans toutes les tribus et exclut les notes qui sont saluées dans une tribu mais détestées par une autre.
Ce qui précède ne décrit que la partie centrale de l'algorithme. En fait, de nombreux mécanismes supplémentaires y sont ajoutés. Heureusement, ils sont décrits dans la documentation publique. Ces mécanismes comprennent les éléments suivants :
L'algorithme est exécuté plusieurs fois, ajoutant à chaque fois des "pseudo-votes" extrêmes générés aléatoirement au vote. Cela signifie que la véritable sortie de l'algorithme pour chaque note est une plage de valeurs, et le résultat final dépend d'un "niveau de confiance inférieur" tiré de cette plage et comparé à un seuil de 0,32.
Si de nombreux utilisateurs (en particulier ceux de polarité similaire aux notes) ont évalué une note comme "inutile" et qu'ils ont également attribué la même "étiquette" (par exemple, "langage argumentatif ou biaisé", "les notes sources ne sont pas prises en charge") comme le raison de notation, alors le seuil d'utilité requis pour que les Notes soient publiées passe de 0,4 à 0,5 (cela peut sembler faible, mais est très important dans la pratique).
Si une Note est acceptée, son utilité doit être inférieure au seuil de 0,01 point requis pour accepter la Note.
Les algorithmes s'exécutent plus souvent avec plusieurs modèles, augmentant parfois les notes avec des scores d'utilité bruts compris entre 0,3 et 0,4.
Dans l'ensemble, vous vous retrouvez avec un code Python assez complexe totalisant 6282 lignes réparties sur 22 fichiers. Mais tout est ouvert, et vous pouvez télécharger les notes et les données de notation et les exécuter vous-même pour voir si la sortie correspond à ce qui se passe réellement sur Twitter.
Alors, à quoi cela ressemble-t-il en pratique ?
La plus grande différence entre cet algorithme et la méthode consistant simplement à prendre le score moyen des votes des gens est probablement le concept de ce que j'appelle les valeurs de "polarité". La documentation de l'algorithme les appelle fu et fn, en utilisant f comme facteur car les deux termes se multiplient ; le terme plus général est en partie dû au désir éventuel de rendre fu et fn multidimensionnels.
La polarité est attribuée aux utilisateurs et aux notes. Le lien entre l'ID utilisateur et le compte Twitter sous-jacent est intentionnellement gardé privé, mais Notes est public. En fait, au moins pour l'ensemble de données anglais, la polarité générée par l'algorithme est très étroitement corrélée avec la gauche et la droite.
Voici quelques exemples de notes avec une polarité autour de -0,8 :
Notez que je ne sélectionne pas ici ; ce sont en fait les trois premières lignes de la feuille de calcul score_notes.tsv que je génère lorsque j'exécute l'algorithme localement avec leurs scores de polarité (appelés coreNoteFactor 1 dans la feuille de calcul) inférieurs à - 0,8.
Maintenant, voici quelques notes avec une polarité autour de +0,8. Il s'avère que beaucoup d'entre eux étaient soit des gens parlant de la politique brésilienne en portugais, soit des fans de Tesla réfutant avec colère les critiques de Tesla, alors laissez-moi choisir un peu et trouver des notes qui n'entrent dans aucune des deux catégories :
Pour rappel, la "division gauche contre droite" n'est en aucun cas codée en dur dans l'algorithme ; elle est découverte par calcul. Cela suggère que si vous appliquez cet algorithme à d'autres contextes culturels, il peut automatiquement détecter leurs principales divisions politiques et construire des ponts entre eux.
Pendant ce temps, les notes qui obtiennent la plus grande utilité ressemblent à ceci. Cette fois, puisque les notes apparaissent sur Twitter, je peux juste en capturer une :
Et un autre:
Pour les deuxièmes Notes, il traite plus directement de thèmes politiques très partisans, mais c'est une Note claire, de haute qualité et informative, et à ce titre obtient un score élevé. Dans l'ensemble, l'algorithme semble fonctionner et il semble possible de vérifier la sortie de l'algorithme en exécutant le code.
Qu'est-ce que je pense de l'algorithme ?
Ce qui m'a le plus frappé lors de l'analyse de cet algorithme, c'est sa complexité. Il existe une "version papier académique" qui utilise la descente de gradient pour trouver le meilleur ajustement à une équation vectorielle et matricielle à cinq termes, puis il y a la version réelle, une série complexe d'exécutions algorithmiques avec de nombreuses exécutions différentes, et beaucoup de coefficient arbitraire .
Même les versions papier académiques cachent des complexités sous-jacentes. L'équation qu'il optimise est une quartique négative (car il y a un terme quadratique fu*fn dans la formule de prédiction, et la fonction de coût mesure le carré de l'erreur). Alors que l'optimisation d'une équation quadratique sur un nombre quelconque de variables a presque toujours une solution unique, que vous pouvez comprendre avec une algèbre linéaire assez basique, l'optimisation d'une équation quartique sur de nombreuses variables a généralement de nombreuses solutions, donc plusieurs tours de l'algorithme de descente de gradient Différentes réponses peuvent être obtenus. De petits changements d'entrée peuvent faire basculer la descente d'un minimum local à un autre, modifiant considérablement les résultats de sortie.
La différence entre cela et les algorithmes que j'ai aidé à développer, comme le financement quadratique, est pour moi comme la différence entre l'algorithme d'un économiste et l'algorithme d'un ingénieur. Les algorithmes des économistes, au mieux, se concentrent sur la simplicité, sont relativement faciles à analyser et ont des propriétés mathématiques claires qui indiquent qu'ils sont optimaux (ou moins mauvais) pour la tâche à accomplir, et prouvent idéalement que Combien de dégâts quelqu'un peut faire dans essayer d'en profiter. L'algorithme d'un ingénieur, d'autre part, est dérivé d'un processus itératif d'essais et d'erreurs pour voir ce qui fonctionne et ce qui ne fonctionne pas dans l'environnement d'exploitation de l'ingénieur. L'algorithme d'un ingénieur est pragmatique et fait le travail ; l'algorithme d'un économiste ne perd pas complètement le contrôle face à l'inattendu.
Ou, comme l'a dit le philosophe Internet respecté roon (alias tszzl) dans un fil de discussion connexe :
Bien sûr, je dirais que l'aspect "esthétique théorique" des crypto-monnaies est nécessaire pour pouvoir distinguer avec précision les protocoles qui sont vraiment sans confiance et ceux qui ont l'air bien et fonctionnent superficiellement bien, mais nécessitent en fait de faire confiance à un acteur centralisé, Ou pire encore, il pourrait s'agir d'une arnaque pure et simple.
L'apprentissage en profondeur est efficace dans des conditions normales, mais il présente des faiblesses inévitables face à diverses attaques d'apprentissage automatique contradictoires. S'ils sont bien faits, des pièges techniques et des échelles très abstraites peuvent contrer ces attaques. Donc, j'ai une question : pouvons-nous transformer les notes communautaires elles-mêmes en quelque chose qui ressemble plus à un algorithme économique ?
Pour voir en pratique ce que cela signifie, explorons un algorithme que j'ai conçu dans un but similaire il y a quelques années : le financement quadratique lié par paires.
L'objectif du financement quadratique lié par paires est de combler une lacune du financement quadratique "conventionnel", où même si deux joueurs s'entendent, ils peuvent contribuer des montants très élevés à un faux projet, se faire rendre les fonds et obtenir de grosses subventions qui drainent tout votre pool d'argent. Dans le financement quadratique délimité par paires, nous attribuons un budget fini M à chaque paire de participants. L'algorithme itère sur toutes les paires possibles de participants, et si l'algorithme décide d'ajouter une subvention à un projet P parce que le participant A et le participant B le soutiennent, alors cette subvention est déduite du budget alloué à cette paire (A,B) . Par conséquent, même si k participants s'entendent, le montant qu'ils volent au mécanisme est au plus de k *(k-1)*M.
Cette forme de l'algorithme ne fonctionne pas bien dans le contexte des notes de la communauté, car chaque utilisateur ne vote qu'un petit nombre de votes : en moyenne, le vote commun entre deux utilisateurs est égal à zéro, donc en regardant simplement chaque paire d'utilisateurs individuellement, l'algorithme n'a aucun moyen de connaître la polarité des utilisateurs. Le but d'un modèle de machine learning est justement de tenter de "remplir" une matrice à partir de données sources très éparses et non directement analysables de cette manière. Mais le défi de cette approche est qu'un effort supplémentaire est nécessaire pour éviter des résultats très volatils face à un petit nombre de mauvais votes.
Les notes communautaires peuvent-elles vraiment résister à la gauche et à la droite ?
Nous pouvons analyser si l'algorithme Community Notes est réellement résistant aux extrêmes, c'est-à-dire s'il est plus performant qu'un algorithme de vote naïf. Cet algorithme de vote est déjà quelque peu résistant aux extrêmes : un post avec 200 likes et 100 dislikes sera moins performant qu'un post avec seulement 200 likes. Mais les Community Notes font-elles mieux ?
D'un point de vue algorithmique abstrait, c'est difficile à dire. Pourquoi un message polarisant avec une note moyenne élevée ne peut-il pas obtenir une forte polarité et une grande utilité ? L'idée est que si ces votes sont contradictoires, la polarité devrait "absorber" la fonctionnalité qui a fait que le message a obtenu beaucoup de votes, mais le fait-il réellement ?
Pour vérifier cela, j'ai exécuté mon implémentation simplifiée pendant 100 tours. Le résultat moyen est le suivant :
Dans ce test, les notes "bonnes" ont été notées +2 par les utilisateurs de la même affiliation politique, +0 par les utilisateurs de l'affiliation politique opposée, et les notes "bonnes mais plus extrêmes" ont été notées par les utilisateurs de la même affiliation notée +4 en , et -2 chez les utilisateurs de la faction opposée. Bien que le score moyen soit le même, la polarité est différente. Et de fait, l'utilité moyenne des "bonnes" Notes semble être supérieure à celle des "bonnes mais plus extrêmes".
Avoir un algorithme plus proche de "l'algorithme de l'économiste" aurait une histoire plus claire de la façon dont l'algorithme punit les extrêmes.
À quel point tout cela est-il utile dans une situation à fort enjeu ?
Nous pouvons en apprendre davantage sur certains d'entre eux en examinant une situation spécifique. Il y a environ un mois, Ian Bremmer s'est plaint qu'un tweet concernant un responsable du gouvernement chinois ait ajouté une note de communauté très critique ?item_id=888" target="_blank" rel="noopener noreferrer">En savoir plus ? item_id= 888 " target="_blank" rel="noopener noreferrer">En savoir plus ? item_id= 888" target="_blank" rel="noopener noreferrer">En savoir plus ? item_id= 888" target="_blank " rel="noopener noreferrer">En savoir plus ? item_id= 888" target="_blank" rel="noopener noreferrer">En savoir plus ? item_id= 888" target= "_blank" rel="noopener noreferrer ">Voir plus ? item_id= 888" target="_blank" rel="noopener noreferrer">Voir plus ? item_id= 888" target="_blank" rel="noopener noreferrer">Voir plus ? _id= 888" target="_blank" rel="noopener noreferrer">Voir plus ? item_id= 888" target="_blank" rel="noopener noreferrer">Voir plus ? item_id= 888" cible ="_blank" rel="noopener noreferrer">En savoir plus ? item_id= 888" target="_blank" rel="noopener noreferrer">Afficher plus, mais les notes ont été supprimées.
C'est une tâche ardue. La conception de mécanismes est une chose dans un environnement communautaire Ethereum où la plus grande plainte pourrait n'être que de 20 000 $ à un influenceur Twitter extrême. C'est une autre histoire quand il s'agit de problèmes politiques et géopolitiques qui affectent des millions de personnes, et tout le monde a tendance à assumer raisonnablement les pires motifs possibles. Mais interagir avec ces environnements à enjeux élevés est essentiel si les concepteurs de mécaniciens veulent avoir un impact significatif sur le monde.
Dans le cas de Twitter, il y a une raison évidente de suspecter une manipulation centralisée comme cause de la suppression de Notes : Elon Musk a de nombreux intérêts commerciaux en Chine, il est donc possible qu'Elon Musk ait forcé l'équipe Community Notes à intervenir dans la sortie de la Algorithme et supprimer cette note particulière.
Heureusement, l'algorithme est open source et vérifiable, nous pouvons donc aller au fond des choses ! Faisons cela. L'URL du tweet d'origine est le numéro 1676157337109946369 à la fin est l'ID du tweet. Nous pouvons rechercher cet ID dans les données téléchargeables et identifier la ligne spécifique de la feuille de calcul contenant les notes ci-dessus :
Ici, nous avons l'ID de Notes lui-même, 1676391378815709184 . Nous recherchons ensuite cet ID dans les fichiers score_notes.tsv et note_status_history.tsv générés en exécutant l'algorithme. Nous avons obtenu le résultat suivant :
La deuxième colonne de la première sortie est la note actuelle des notes. La deuxième sortie affiche l'historique de Notes : son état actuel est dans la colonne sept (NEEDS_MORE_RATINGS), et le premier état reçu qui n'était pas NEEDS_MORE_RATINGS est dans la colonne cinq (NEEDS_MORE_RATINGS ) . ACTUELLEMENT_ÉVALUÉ_UTILE). Nous pouvons donc voir que l'algorithme lui-même a d'abord montré les notes, puis les a supprimées après que leurs notes aient légèrement baissé - aucune intervention centrale ne semble être impliquée.
Nous pouvons également voir cela d'une autre manière en examinant le vote lui-même. Nous pouvons analyser le fichier ratings-00000.tsv pour isoler toutes les notes de ces Notes et voir combien sont notées UTILES et NON_UTILES :
Cependant, si vous les triez par horodatage et regardez les 50 meilleurs votes, vous verrez qu'il y a 40 votes UTILES et 9 votes NON_UTILES. Nous sommes donc arrivés à la même conclusion : les notes ont été notées plus positivement par son public initial et moins par son public ultérieur, de sorte que sa note a commencé à être élevée et a diminué au fil du temps.
Malheureusement, il est difficile d'expliquer exactement comment les notes changent de statut : ce n'est pas une simple question de "précédemment évalué au-dessus de 0,40, maintenant évalué en dessous de 0,40, donc il est supprimé". Au lieu de cela, le nombre élevé de réponses NOT_HELPFUL déclenche l'une des conditions d'exception, augmentant le score d'utilité dont Notes a besoin pour rester au-dessus du seuil.
C'est une autre excellente opportunité d'apprentissage qui nous enseigne une leçon : rendre un algorithme neutre digne de confiance vraiment digne de confiance nécessite de le garder simple. Si une note passe d'être acceptée à non acceptée, il devrait y avoir une histoire simple et claire expliquant pourquoi c'est le cas.
Bien sûr, il existe une autre manière complètement différente de manipuler ce vote : le brigadier. Quelqu'un qui voit une note qu'il n'approuve pas peut faire appel à une communauté très engagée (ou pire, à une légion de faux comptes) pour la noter NON_UTILE, et il ne faut probablement pas beaucoup de votes pour obtenir la note de " utile" à "extrême". Des analyses et des travaux supplémentaires sont nécessaires pour réduire correctement la vulnérabilité de l'algorithme à de telles attaques coordonnées. Une amélioration possible serait de ne permettre à aucun utilisateur de voter sur les notes, mais d'attribuer au hasard des notes aux évaluateurs en utilisant la recommandation de l'algorithme "pour vous", et de permettre aux évaluateurs de noter uniquement les notes auxquelles ils sont affectés.
Notes de la communauté Pas assez "courageux" ?
La principale critique que je vois de Community Notes est fondamentalement qu'elle n'en fait pas assez. J'ai vu deux articles récents en parler. Pour citer un des articles :
Le processus souffre d'une limitation sérieuse dans la mesure où pour que les notes communautaires deviennent publiques, elles doivent être généralement acceptées par un consensus de personnes de tout l'éventail politique.
"Il doit y avoir un consensus idéologique", a-t-il déclaré. "Cela signifie que les personnes de gauche et de droite doivent convenir que la note doit être jointe au tweet."
Essentiellement, a-t-il dit, cela nécessite "un accord interidéologique sur la vérité qui est presque impossible dans un environnement de plus en plus partisan".
C'est une question délicate, mais finalement j'ai tendance à penser qu'il vaut mieux avoir dix tweets de désinformation gratuits qu'un tweet injustement annoté. Nous avons vu des années de vérification des faits courageuses et du point de vue "en fait, nous connaissons la vérité, nous savons qu'un côté ment plus souvent que l'autre". Que va-t-il se passer ?
Pour être honnête, il existe une méfiance assez répandue à l'égard du concept même de vérification des faits. Ici, une stratégie consiste à dire : ignorez ces critiques, rappelez-vous que les vérificateurs des faits connaissent les faits mieux que n'importe quel système de vote, et respectez-le. Mais aller à fond sur cette approche semble risqué. Il y a de la valeur à construire des institutions intertribales qui soient au moins un peu respectées par tous. À l'instar du dicton de William Blackstone et des tribunaux, j'estime que le maintien de ce respect nécessite un système qui se trompe par omission plutôt que par erreur volontaire. Il me semble donc intéressant qu'au moins une grande organisation emprunte cette voie différente et considère son rare respect inter-tribal comme une ressource précieuse.
Une autre raison pour laquelle je pense qu'il est acceptable que les notes de la communauté soient conservatrices est que je ne pense pas que chaque tweet mal informé, ou même la plupart des tweets mal informés, devrait recevoir une note corrective. Même si moins d'un pour cent des tweets mal informés sont annotés pour fournir un contexte ou une correction, les notes de la communauté fournissent toujours un service extrêmement précieux en tant qu'outil pédagogique. Le but n'est pas de tout corriger ; le but est plutôt de rappeler aux gens qu'il y a plusieurs points de vue, que certains des messages qui semblent convaincants et engageants isolément sont en fait assez faux, et que vous, oui, vous pouvez généralement faire des choses basiques Recherche sur Internet pour vérifier que c'est faux.
Les Notes Communautaires ne peuvent pas être, et ne sont pas censées être, une panacée pour tous les problèmes d'épistémologie publique. Quels que soient les problèmes qu'il ne résout pas, il y a beaucoup de place pour d'autres mécanismes à combler, qu'il s'agisse de gadgets de nouveauté comme les marchés de prédiction ou d'organisations établies qui embauchent du personnel à temps plein avec une expertise dans le domaine pour essayer de combler les lacunes.
en conclusion
Community Notes n'est pas seulement une expérience fascinante dans les médias sociaux, mais aussi un exemple fascinant d'un type émergent de conception de mécanismes : des mécanismes qui tentent consciemment d'identifier les extrêmes et tendent à favoriser le croisement plutôt que de perpétuer la division.
Deux autres exemples dans cette catégorie que je connais sont : (i) le mécanisme de financement quadratique jumelé utilisé dans les subventions Gitcoin, et (ii) Polis, un outil de discussion qui utilise des algorithmes de regroupement pour aider la communauté à identifier les déclarations populaires communes aux personnes qui ont souvent des avis différents. Ce domaine de la conception de mécanismes est précieux, et j'espère que nous verrons plus de travaux universitaires dans ce domaine.
La transparence algorithmique fournie par Community Notes n'est pas exactement un média social entièrement décentralisé - si vous n'êtes pas d'accord avec le fonctionnement de Community Notes, il n'y a aucun moyen de voir une perspective algorithmique différente sur le même contenu. Mais c'est le plus proche que les applications hyperscale obtiendront dans les prochaines années, et nous pouvons voir qu'il offre déjà beaucoup de valeur, à la fois en empêchant la manipulation centralisée et en garantissant que les plates-formes qui ne s'engagent pas dans une telle manipulation obtiennent ce qu'elles méritent reconnu .
J'ai hâte de voir les notes de la communauté et de nombreux algorithmes d'un esprit similaire se développer et se développer au cours de la prochaine décennie.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Vitalik Buterin : L'expérience des médias sociaux Community Notes est très cryptée
Auteur original : vitalik
Compilation du texte original : Deep Tide TechFlow
Les deux dernières années ont sans doute été turbulentes pour Twitter (X). L'année dernière, Elon Musk a acheté la plate-forme pour 44 milliards de dollars, puis a remanié la dotation en personnel, l'examen du contenu, le modèle commercial et la culture du site Web de l'entreprise.Ces changements peuvent être davantage dus au soft power d'Elon Musk qu'à des décisions politiques spécifiques. Au milieu de ces mouvements controversés, cependant, une nouvelle fonctionnalité sur Twitter gagne rapidement en importance et semble bénéficier de la faveur de l'ensemble du spectre politique : les notes de la communauté.
Community Notes est un outil de vérification des faits qui attache parfois des annotations contextuelles aux tweets, comme celui d'Elon Musk ci-dessus, en tant qu'outil de vérification des faits et anti-désinformation. Il s'appelait à l'origine Birdwatch et a été lancé pour la première fois en tant que programme pilote en janvier 2021. Depuis lors, il s'est progressivement étendu, la phase d'expansion la plus rapide coïncidant avec le rachat de Twitter par Elon Musk l'année dernière. Aujourd'hui, les notes de la communauté sont une caractéristique régulière des tweets qui attirent beaucoup d'attention sur Twitter, y compris ceux qui traitent de sujets politiques controversés. À mon avis, et d'après mes conversations avec de nombreuses personnes de tous horizons politiques, ces notes sont informatives et précieuses lorsqu'elles paraissent.
Mais ce qui m'intéresse le plus, ce sont les Community Notes, qui, bien qu'il ne s'agisse pas d'un "projet crypto", sont probablement l'exemple le plus proche de "valeurs crypto" que nous ayons vu dans le monde grand public. Les notes de la communauté ne sont pas écrites ou organisées par un expert sélectionné de manière centralisée ; au lieu de cela, n'importe qui peut écrire et voter, et les notes à afficher ou à ne pas afficher sont entièrement déterminées par un algorithme open source. Le site Web de Twitter propose un guide détaillé et complet décrivant le fonctionnement de l'algorithme. Vous pouvez télécharger les données contenant les notes et les votes publiés, exécuter l'algorithme localement et vérifier que la sortie correspond à ce qui est visible sur le site Web de Twitter. Bien qu'il ne soit pas parfait, il est étonnamment proche de l'idéal de neutralité crédible dans des situations plutôt controversées, et est très utile en même temps.
Comment fonctionne l'algorithme Community Notes ?
Toute personne disposant d'un compte Twitter répondant à certains critères (essentiellement : actif depuis plus de 6 mois, aucun historique d'infractions, numéro de téléphone portable vérifié) peut s'inscrire pour participer aux Notes de la communauté. Actuellement, les participants sont acceptés lentement et au hasard, mais finalement le plan est de permettre à toute personne éligible de se joindre. Une fois accepté, vous pouvez d'abord participer à la notation des notes existantes, et une fois que votre note est suffisamment bonne (mesurée en voyant quelle note correspond au résultat final pour cette note), vous pouvez également rédiger vos propres notes.
Lorsque vous écrivez une note, les notes obtiennent un score basé sur l'examen des autres membres de Community Notes. Ces avis peuvent être considérés comme des votes selon les trois niveaux "utile", "plutôt utile" et "pas utile", mais les avis peuvent également contenir d'autres étiquettes qui jouent un rôle dans l'algorithme. Sur la base de ces avis, Notes reçoit une note. Si le score des notes dépasse 0,40, alors ces notes seront affichées ; sinon, ces notes ne seront pas affichées.
Ce qui rend l'algorithme unique, c'est la façon dont le score est calculé. Contrairement aux algorithmes simplistes, qui sont conçus pour calculer simplement une sorte de somme ou de moyenne des évaluations des utilisateurs et l'utiliser comme résultat final, l'algorithme d'évaluation des notes de la communauté essaie explicitement de prioriser ceux qui obtiennent des notes positives de personnes ayant des perspectives différentes Notes. Autrement dit, si des personnes qui ne sont généralement pas d'accord sur les notes finissent par s'entendre sur une note particulière, alors cette note sera très bien notée.
Voyons plus en détail comment cela fonctionne. Nous avons un ensemble d'utilisateurs et un ensemble de Notes ; nous pouvons créer une matrice M où la cellule Mij représente la façon dont le i-ème utilisateur a évalué les j-ème Notes.
Pour une note donnée, la plupart des utilisateurs n'ont pas évalué cette note, donc la plupart des entrées dans la matrice seront nulles, mais ce n'est pas grave. Le but de l'algorithme est de créer un modèle à quatre colonnes d'utilisateurs et de notes, en attribuant à chaque utilisateur deux statistiques, que nous pouvons appeler "convivialité" et "polarité", et en attribuant à chaque note deux statistiques, nous l'appelons "utilité" et "polarité". Le modèle essaie de prédire la matrice en fonction de ces valeurs, en utilisant la formule suivante :
Notez qu'ici j'introduis la terminologie utilisée dans l'article Birdwatch, ainsi que la mienne pour fournir une compréhension plus intuitive de ce que signifient les variables sans entrer dans les concepts mathématiques :
L'algorithme utilise un modèle d'apprentissage automatique assez basique (descente de gradient standard) pour trouver les meilleures valeurs de variable pour prédire les valeurs de la matrice. L'utilité attribuée à une note particulière est le score final pour cette note. Une note sera affichée si son utilité est d'au moins + 0,4.
L'ingéniosité de base ici est que la "polarité" absorbe les caractéristiques d'une note, ce qui la rend appréciée par certains utilisateurs et détestée par d'autres utilisateurs, tandis que "l'utilité" ne mesure que les caractéristiques d'une note. Ces caractéristiques conduisent à ce qu'elle soit appréciée. par tous les utilisateurs. La sélection de l'utilité identifie donc les notes qui sont approuvées dans toutes les tribus et exclut les notes qui sont saluées dans une tribu mais détestées par une autre.
Ce qui précède ne décrit que la partie centrale de l'algorithme. En fait, de nombreux mécanismes supplémentaires y sont ajoutés. Heureusement, ils sont décrits dans la documentation publique. Ces mécanismes comprennent les éléments suivants :
Dans l'ensemble, vous vous retrouvez avec un code Python assez complexe totalisant 6282 lignes réparties sur 22 fichiers. Mais tout est ouvert, et vous pouvez télécharger les notes et les données de notation et les exécuter vous-même pour voir si la sortie correspond à ce qui se passe réellement sur Twitter.
Alors, à quoi cela ressemble-t-il en pratique ?
La plus grande différence entre cet algorithme et la méthode consistant simplement à prendre le score moyen des votes des gens est probablement le concept de ce que j'appelle les valeurs de "polarité". La documentation de l'algorithme les appelle fu et fn, en utilisant f comme facteur car les deux termes se multiplient ; le terme plus général est en partie dû au désir éventuel de rendre fu et fn multidimensionnels.
La polarité est attribuée aux utilisateurs et aux notes. Le lien entre l'ID utilisateur et le compte Twitter sous-jacent est intentionnellement gardé privé, mais Notes est public. En fait, au moins pour l'ensemble de données anglais, la polarité générée par l'algorithme est très étroitement corrélée avec la gauche et la droite.
Voici quelques exemples de notes avec une polarité autour de -0,8 :
Notez que je ne sélectionne pas ici ; ce sont en fait les trois premières lignes de la feuille de calcul score_notes.tsv que je génère lorsque j'exécute l'algorithme localement avec leurs scores de polarité (appelés coreNoteFactor 1 dans la feuille de calcul) inférieurs à - 0,8.
Maintenant, voici quelques notes avec une polarité autour de +0,8. Il s'avère que beaucoup d'entre eux étaient soit des gens parlant de la politique brésilienne en portugais, soit des fans de Tesla réfutant avec colère les critiques de Tesla, alors laissez-moi choisir un peu et trouver des notes qui n'entrent dans aucune des deux catégories :
Pour rappel, la "division gauche contre droite" n'est en aucun cas codée en dur dans l'algorithme ; elle est découverte par calcul. Cela suggère que si vous appliquez cet algorithme à d'autres contextes culturels, il peut automatiquement détecter leurs principales divisions politiques et construire des ponts entre eux.
Pendant ce temps, les notes qui obtiennent la plus grande utilité ressemblent à ceci. Cette fois, puisque les notes apparaissent sur Twitter, je peux juste en capturer une :
Et un autre:
Pour les deuxièmes Notes, il traite plus directement de thèmes politiques très partisans, mais c'est une Note claire, de haute qualité et informative, et à ce titre obtient un score élevé. Dans l'ensemble, l'algorithme semble fonctionner et il semble possible de vérifier la sortie de l'algorithme en exécutant le code.
Qu'est-ce que je pense de l'algorithme ?
Ce qui m'a le plus frappé lors de l'analyse de cet algorithme, c'est sa complexité. Il existe une "version papier académique" qui utilise la descente de gradient pour trouver le meilleur ajustement à une équation vectorielle et matricielle à cinq termes, puis il y a la version réelle, une série complexe d'exécutions algorithmiques avec de nombreuses exécutions différentes, et beaucoup de coefficient arbitraire .
Même les versions papier académiques cachent des complexités sous-jacentes. L'équation qu'il optimise est une quartique négative (car il y a un terme quadratique fu*fn dans la formule de prédiction, et la fonction de coût mesure le carré de l'erreur). Alors que l'optimisation d'une équation quadratique sur un nombre quelconque de variables a presque toujours une solution unique, que vous pouvez comprendre avec une algèbre linéaire assez basique, l'optimisation d'une équation quartique sur de nombreuses variables a généralement de nombreuses solutions, donc plusieurs tours de l'algorithme de descente de gradient Différentes réponses peuvent être obtenus. De petits changements d'entrée peuvent faire basculer la descente d'un minimum local à un autre, modifiant considérablement les résultats de sortie.
La différence entre cela et les algorithmes que j'ai aidé à développer, comme le financement quadratique, est pour moi comme la différence entre l'algorithme d'un économiste et l'algorithme d'un ingénieur. Les algorithmes des économistes, au mieux, se concentrent sur la simplicité, sont relativement faciles à analyser et ont des propriétés mathématiques claires qui indiquent qu'ils sont optimaux (ou moins mauvais) pour la tâche à accomplir, et prouvent idéalement que Combien de dégâts quelqu'un peut faire dans essayer d'en profiter. L'algorithme d'un ingénieur, d'autre part, est dérivé d'un processus itératif d'essais et d'erreurs pour voir ce qui fonctionne et ce qui ne fonctionne pas dans l'environnement d'exploitation de l'ingénieur. L'algorithme d'un ingénieur est pragmatique et fait le travail ; l'algorithme d'un économiste ne perd pas complètement le contrôle face à l'inattendu.
Ou, comme l'a dit le philosophe Internet respecté roon (alias tszzl) dans un fil de discussion connexe :
Bien sûr, je dirais que l'aspect "esthétique théorique" des crypto-monnaies est nécessaire pour pouvoir distinguer avec précision les protocoles qui sont vraiment sans confiance et ceux qui ont l'air bien et fonctionnent superficiellement bien, mais nécessitent en fait de faire confiance à un acteur centralisé, Ou pire encore, il pourrait s'agir d'une arnaque pure et simple.
L'apprentissage en profondeur est efficace dans des conditions normales, mais il présente des faiblesses inévitables face à diverses attaques d'apprentissage automatique contradictoires. S'ils sont bien faits, des pièges techniques et des échelles très abstraites peuvent contrer ces attaques. Donc, j'ai une question : pouvons-nous transformer les notes communautaires elles-mêmes en quelque chose qui ressemble plus à un algorithme économique ?
Pour voir en pratique ce que cela signifie, explorons un algorithme que j'ai conçu dans un but similaire il y a quelques années : le financement quadratique lié par paires.
L'objectif du financement quadratique lié par paires est de combler une lacune du financement quadratique "conventionnel", où même si deux joueurs s'entendent, ils peuvent contribuer des montants très élevés à un faux projet, se faire rendre les fonds et obtenir de grosses subventions qui drainent tout votre pool d'argent. Dans le financement quadratique délimité par paires, nous attribuons un budget fini M à chaque paire de participants. L'algorithme itère sur toutes les paires possibles de participants, et si l'algorithme décide d'ajouter une subvention à un projet P parce que le participant A et le participant B le soutiennent, alors cette subvention est déduite du budget alloué à cette paire (A,B) . Par conséquent, même si k participants s'entendent, le montant qu'ils volent au mécanisme est au plus de k *(k-1)*M.
Cette forme de l'algorithme ne fonctionne pas bien dans le contexte des notes de la communauté, car chaque utilisateur ne vote qu'un petit nombre de votes : en moyenne, le vote commun entre deux utilisateurs est égal à zéro, donc en regardant simplement chaque paire d'utilisateurs individuellement, l'algorithme n'a aucun moyen de connaître la polarité des utilisateurs. Le but d'un modèle de machine learning est justement de tenter de "remplir" une matrice à partir de données sources très éparses et non directement analysables de cette manière. Mais le défi de cette approche est qu'un effort supplémentaire est nécessaire pour éviter des résultats très volatils face à un petit nombre de mauvais votes.
Les notes communautaires peuvent-elles vraiment résister à la gauche et à la droite ?
Nous pouvons analyser si l'algorithme Community Notes est réellement résistant aux extrêmes, c'est-à-dire s'il est plus performant qu'un algorithme de vote naïf. Cet algorithme de vote est déjà quelque peu résistant aux extrêmes : un post avec 200 likes et 100 dislikes sera moins performant qu'un post avec seulement 200 likes. Mais les Community Notes font-elles mieux ?
D'un point de vue algorithmique abstrait, c'est difficile à dire. Pourquoi un message polarisant avec une note moyenne élevée ne peut-il pas obtenir une forte polarité et une grande utilité ? L'idée est que si ces votes sont contradictoires, la polarité devrait "absorber" la fonctionnalité qui a fait que le message a obtenu beaucoup de votes, mais le fait-il réellement ?
Pour vérifier cela, j'ai exécuté mon implémentation simplifiée pendant 100 tours. Le résultat moyen est le suivant :
Dans ce test, les notes "bonnes" ont été notées +2 par les utilisateurs de la même affiliation politique, +0 par les utilisateurs de l'affiliation politique opposée, et les notes "bonnes mais plus extrêmes" ont été notées par les utilisateurs de la même affiliation notée +4 en , et -2 chez les utilisateurs de la faction opposée. Bien que le score moyen soit le même, la polarité est différente. Et de fait, l'utilité moyenne des "bonnes" Notes semble être supérieure à celle des "bonnes mais plus extrêmes".
Avoir un algorithme plus proche de "l'algorithme de l'économiste" aurait une histoire plus claire de la façon dont l'algorithme punit les extrêmes.
À quel point tout cela est-il utile dans une situation à fort enjeu ?
Nous pouvons en apprendre davantage sur certains d'entre eux en examinant une situation spécifique. Il y a environ un mois, Ian Bremmer s'est plaint qu'un tweet concernant un responsable du gouvernement chinois ait ajouté une note de communauté très critique ?item_id=888" target="_blank" rel="noopener noreferrer">En savoir plus ? item_id= 888 " target="_blank" rel="noopener noreferrer">En savoir plus ? item_id= 888" target="_blank" rel="noopener noreferrer">En savoir plus ? item_id= 888" target="_blank " rel="noopener noreferrer">En savoir plus ? item_id= 888" target="_blank" rel="noopener noreferrer">En savoir plus ? item_id= 888" target= "_blank" rel="noopener noreferrer ">Voir plus ? item_id= 888" target="_blank" rel="noopener noreferrer">Voir plus ? item_id= 888" target="_blank" rel="noopener noreferrer">Voir plus ? _id= 888" target="_blank" rel="noopener noreferrer">Voir plus ? item_id= 888" target="_blank" rel="noopener noreferrer">Voir plus ? item_id= 888" cible ="_blank" rel="noopener noreferrer">En savoir plus ? item_id= 888" target="_blank" rel="noopener noreferrer">Afficher plus, mais les notes ont été supprimées.
C'est une tâche ardue. La conception de mécanismes est une chose dans un environnement communautaire Ethereum où la plus grande plainte pourrait n'être que de 20 000 $ à un influenceur Twitter extrême. C'est une autre histoire quand il s'agit de problèmes politiques et géopolitiques qui affectent des millions de personnes, et tout le monde a tendance à assumer raisonnablement les pires motifs possibles. Mais interagir avec ces environnements à enjeux élevés est essentiel si les concepteurs de mécaniciens veulent avoir un impact significatif sur le monde.
Dans le cas de Twitter, il y a une raison évidente de suspecter une manipulation centralisée comme cause de la suppression de Notes : Elon Musk a de nombreux intérêts commerciaux en Chine, il est donc possible qu'Elon Musk ait forcé l'équipe Community Notes à intervenir dans la sortie de la Algorithme et supprimer cette note particulière.
Heureusement, l'algorithme est open source et vérifiable, nous pouvons donc aller au fond des choses ! Faisons cela. L'URL du tweet d'origine est le numéro 1676157337109946369 à la fin est l'ID du tweet. Nous pouvons rechercher cet ID dans les données téléchargeables et identifier la ligne spécifique de la feuille de calcul contenant les notes ci-dessus :
Ici, nous avons l'ID de Notes lui-même, 1676391378815709184 . Nous recherchons ensuite cet ID dans les fichiers score_notes.tsv et note_status_history.tsv générés en exécutant l'algorithme. Nous avons obtenu le résultat suivant :
La deuxième colonne de la première sortie est la note actuelle des notes. La deuxième sortie affiche l'historique de Notes : son état actuel est dans la colonne sept (NEEDS_MORE_RATINGS), et le premier état reçu qui n'était pas NEEDS_MORE_RATINGS est dans la colonne cinq (NEEDS_MORE_RATINGS ) . ACTUELLEMENT_ÉVALUÉ_UTILE). Nous pouvons donc voir que l'algorithme lui-même a d'abord montré les notes, puis les a supprimées après que leurs notes aient légèrement baissé - aucune intervention centrale ne semble être impliquée.
Nous pouvons également voir cela d'une autre manière en examinant le vote lui-même. Nous pouvons analyser le fichier ratings-00000.tsv pour isoler toutes les notes de ces Notes et voir combien sont notées UTILES et NON_UTILES :
Cependant, si vous les triez par horodatage et regardez les 50 meilleurs votes, vous verrez qu'il y a 40 votes UTILES et 9 votes NON_UTILES. Nous sommes donc arrivés à la même conclusion : les notes ont été notées plus positivement par son public initial et moins par son public ultérieur, de sorte que sa note a commencé à être élevée et a diminué au fil du temps.
Malheureusement, il est difficile d'expliquer exactement comment les notes changent de statut : ce n'est pas une simple question de "précédemment évalué au-dessus de 0,40, maintenant évalué en dessous de 0,40, donc il est supprimé". Au lieu de cela, le nombre élevé de réponses NOT_HELPFUL déclenche l'une des conditions d'exception, augmentant le score d'utilité dont Notes a besoin pour rester au-dessus du seuil.
C'est une autre excellente opportunité d'apprentissage qui nous enseigne une leçon : rendre un algorithme neutre digne de confiance vraiment digne de confiance nécessite de le garder simple. Si une note passe d'être acceptée à non acceptée, il devrait y avoir une histoire simple et claire expliquant pourquoi c'est le cas.
Bien sûr, il existe une autre manière complètement différente de manipuler ce vote : le brigadier. Quelqu'un qui voit une note qu'il n'approuve pas peut faire appel à une communauté très engagée (ou pire, à une légion de faux comptes) pour la noter NON_UTILE, et il ne faut probablement pas beaucoup de votes pour obtenir la note de " utile" à "extrême". Des analyses et des travaux supplémentaires sont nécessaires pour réduire correctement la vulnérabilité de l'algorithme à de telles attaques coordonnées. Une amélioration possible serait de ne permettre à aucun utilisateur de voter sur les notes, mais d'attribuer au hasard des notes aux évaluateurs en utilisant la recommandation de l'algorithme "pour vous", et de permettre aux évaluateurs de noter uniquement les notes auxquelles ils sont affectés.
Notes de la communauté Pas assez "courageux" ?
La principale critique que je vois de Community Notes est fondamentalement qu'elle n'en fait pas assez. J'ai vu deux articles récents en parler. Pour citer un des articles :
Le processus souffre d'une limitation sérieuse dans la mesure où pour que les notes communautaires deviennent publiques, elles doivent être généralement acceptées par un consensus de personnes de tout l'éventail politique.
"Il doit y avoir un consensus idéologique", a-t-il déclaré. "Cela signifie que les personnes de gauche et de droite doivent convenir que la note doit être jointe au tweet."
Essentiellement, a-t-il dit, cela nécessite "un accord interidéologique sur la vérité qui est presque impossible dans un environnement de plus en plus partisan".
C'est une question délicate, mais finalement j'ai tendance à penser qu'il vaut mieux avoir dix tweets de désinformation gratuits qu'un tweet injustement annoté. Nous avons vu des années de vérification des faits courageuses et du point de vue "en fait, nous connaissons la vérité, nous savons qu'un côté ment plus souvent que l'autre". Que va-t-il se passer ?
Pour être honnête, il existe une méfiance assez répandue à l'égard du concept même de vérification des faits. Ici, une stratégie consiste à dire : ignorez ces critiques, rappelez-vous que les vérificateurs des faits connaissent les faits mieux que n'importe quel système de vote, et respectez-le. Mais aller à fond sur cette approche semble risqué. Il y a de la valeur à construire des institutions intertribales qui soient au moins un peu respectées par tous. À l'instar du dicton de William Blackstone et des tribunaux, j'estime que le maintien de ce respect nécessite un système qui se trompe par omission plutôt que par erreur volontaire. Il me semble donc intéressant qu'au moins une grande organisation emprunte cette voie différente et considère son rare respect inter-tribal comme une ressource précieuse.
Une autre raison pour laquelle je pense qu'il est acceptable que les notes de la communauté soient conservatrices est que je ne pense pas que chaque tweet mal informé, ou même la plupart des tweets mal informés, devrait recevoir une note corrective. Même si moins d'un pour cent des tweets mal informés sont annotés pour fournir un contexte ou une correction, les notes de la communauté fournissent toujours un service extrêmement précieux en tant qu'outil pédagogique. Le but n'est pas de tout corriger ; le but est plutôt de rappeler aux gens qu'il y a plusieurs points de vue, que certains des messages qui semblent convaincants et engageants isolément sont en fait assez faux, et que vous, oui, vous pouvez généralement faire des choses basiques Recherche sur Internet pour vérifier que c'est faux.
Les Notes Communautaires ne peuvent pas être, et ne sont pas censées être, une panacée pour tous les problèmes d'épistémologie publique. Quels que soient les problèmes qu'il ne résout pas, il y a beaucoup de place pour d'autres mécanismes à combler, qu'il s'agisse de gadgets de nouveauté comme les marchés de prédiction ou d'organisations établies qui embauchent du personnel à temps plein avec une expertise dans le domaine pour essayer de combler les lacunes.
en conclusion
Community Notes n'est pas seulement une expérience fascinante dans les médias sociaux, mais aussi un exemple fascinant d'un type émergent de conception de mécanismes : des mécanismes qui tentent consciemment d'identifier les extrêmes et tendent à favoriser le croisement plutôt que de perpétuer la division.
Deux autres exemples dans cette catégorie que je connais sont : (i) le mécanisme de financement quadratique jumelé utilisé dans les subventions Gitcoin, et (ii) Polis, un outil de discussion qui utilise des algorithmes de regroupement pour aider la communauté à identifier les déclarations populaires communes aux personnes qui ont souvent des avis différents. Ce domaine de la conception de mécanismes est précieux, et j'espère que nous verrons plus de travaux universitaires dans ce domaine.
La transparence algorithmique fournie par Community Notes n'est pas exactement un média social entièrement décentralisé - si vous n'êtes pas d'accord avec le fonctionnement de Community Notes, il n'y a aucun moyen de voir une perspective algorithmique différente sur le même contenu. Mais c'est le plus proche que les applications hyperscale obtiendront dans les prochaines années, et nous pouvons voir qu'il offre déjà beaucoup de valeur, à la fois en empêchant la manipulation centralisée et en garantissant que les plates-formes qui ne s'engagent pas dans une telle manipulation obtiennent ce qu'elles méritent reconnu .
J'ai hâte de voir les notes de la communauté et de nombreux algorithmes d'un esprit similaire se développer et se développer au cours de la prochaine décennie.