Auteur : Chris Dixon, fondateur de a16z crypto ; Elizabeth Harkavy, partenaire de a16z crypto ; Traduction : 金色财经xiaozou
Les systèmes d'intelligence artificielle modernes dépendent non seulement de la puissance de calcul et des algorithmes, mais aussi des retours humains. Les entreprises utilisent des techniques d'optimisation post-formation telles que l'apprentissage par renforcement avec rétroaction humaine (RLHF) et l'optimisation des préférences directes (DPO) pour améliorer les modèles. Ces techniques peuvent réduire les biais et permettre aux modèles de répondre de manière plus qualitative et plus cohérente aux mots-clés - ce qui est essentiel pour accélérer le développement de l'IA. L'évaluation des modèles est également cruciale, mais il est nécessaire de définir d'abord ce qui est "meilleur" pour parvenir à une optimisation des modèles.
Le défi qui en résulte est le suivant : les entreprises ne souhaitent pas partager - elles considèrent leurs données et leurs processus d'entraînement comme des secrets. Cela entraîne une évaluation des modèles d'IA qui ne peut se fier qu'à des informations limitées provenant de systèmes fermés, ou à des tests de référence statiques déconnectés des applications réelles, ce qui limite considérablement la marge d'amélioration des modèles. Les utilisateurs se trouvent également dans une zone d'ignorance, ne sachant pas comment leurs retours influencent les modèles, ni même si leurs retours sont pris en compte. Certains classements de modèles et plateformes de crowdsourcing tentent d'améliorer la transparence, mais ne permettent généralement ni aux utilisateurs de retracer leurs contributions, ni de fournir un retour substantiel pour leur participation. Les plateformes qui prétendent être équitables et transparentes s'appuient souvent sur l'intégrité plutôt que sur des normes exécutables.
Nous croyons que la technologie blockchain peut apporter de la transparence et de la propriété dans cette zone grise de l'IA. La blockchain permet non seulement aux contributeurs d'accéder facilement à des récompenses, mais elle offre également aux développeurs d'IA une garantie fiable sur la qualité et l'origine des données de rétroaction. Les utilisateurs sont incités, les développeurs obtiennent des données fiables, et tout le monde peut réaliser un audit bidirectionnel sur ce marché ouvert. Pour cela, nous avons mené un tour de table de 33 millions de dollars pour le produit grand public Yupp, qui permet à chacun d'explorer et de comparer gratuitement les derniers modèles d'IA.
Yupp adopte un modèle de crowdsourcing pour l'évaluation des modèles : les utilisateurs saisissent des mots-clés et consultent en parallèle plusieurs réponses générées par l'IA, puis choisissent la meilleure réponse. Leur choix génère des données de préférence "paquet de données" avec une signature numérique, qui sont très précieuses pour l'optimisation et l'évaluation après l'entraînement de l'IA. Les utilisateurs peuvent non seulement utiliser gratuitement les derniers modèles, mais aussi recevoir des récompenses en fonction des retours fournis.
La conception de Yupp transforme le jugement humain en ressource économique renouvelable. Avec la production de nouvelles données d'interaction, les anciennes données "expirent", formant ainsi un flywheel naturel : plus d'adoption entraîne des évaluations plus fraîches ; des évaluations plus fraîches donnent naissance à des modèles de meilleure qualité ; des modèles de meilleure qualité attirent plus d'utilisateurs. Tous les participants - qu'il s'agisse d'utilisateurs ordinaires ou de développeurs de modèles d'IA - peuvent y participer et voir des règles transparentes applicables à tous, garantissant que le marché reste d'une neutralité fiable. Personne ne peut cacher les scores, et personne ne peut manipuler les récompenses ou les résultats.
L'équipe fondatrice possède une solide expérience dans les domaines de l'IA et de la cryptographie. Ils ont précédemment développé ensemble des produits d'apprentissage automatique destinés aux consommateurs au début de Twitter. Pankaj Gupta a été responsable de l'ingénierie de la consommation mondiale chez Google Pay et Coinbase, tandis que Gilad Mishne était responsable de l'apprentissage automatique chez GoogleX. L'équipe de démarrage réunit des ingénieurs senior provenant de Google, Coinbase et des laboratoires de pointe.
L'IA a besoin d'un système d'évaluation robuste et fiable basé sur de vastes contributions humaines, et la technologie blockchain est la machine de confiance qui permet d'atteindre cet objectif. En permettant aux utilisateurs du monde entier de contribuer avec des retours sur l'amélioration des modèles, Yupp s'engage à devenir la couche d'évaluation fondamentale pour l'avenir de l'IA. Nous sommes honorés de soutenir Yupp et attendons avec impatience de les aider à construire une boucle de retour d'information sur la chaîne, garantissant que les résultats de l'innovation en IA soient partagés par tous les bâtisseurs.
Le contenu est fourni à titre de référence uniquement, il ne s'agit pas d'une sollicitation ou d'une offre. Aucun conseil en investissement, fiscalité ou juridique n'est fourni. Consultez l'Avertissement pour plus de détails sur les risques.
a16z : Pourquoi avons-nous investi dans Yupp
Auteur : Chris Dixon, fondateur de a16z crypto ; Elizabeth Harkavy, partenaire de a16z crypto ; Traduction : 金色财经xiaozou
Les systèmes d'intelligence artificielle modernes dépendent non seulement de la puissance de calcul et des algorithmes, mais aussi des retours humains. Les entreprises utilisent des techniques d'optimisation post-formation telles que l'apprentissage par renforcement avec rétroaction humaine (RLHF) et l'optimisation des préférences directes (DPO) pour améliorer les modèles. Ces techniques peuvent réduire les biais et permettre aux modèles de répondre de manière plus qualitative et plus cohérente aux mots-clés - ce qui est essentiel pour accélérer le développement de l'IA. L'évaluation des modèles est également cruciale, mais il est nécessaire de définir d'abord ce qui est "meilleur" pour parvenir à une optimisation des modèles.
Le défi qui en résulte est le suivant : les entreprises ne souhaitent pas partager - elles considèrent leurs données et leurs processus d'entraînement comme des secrets. Cela entraîne une évaluation des modèles d'IA qui ne peut se fier qu'à des informations limitées provenant de systèmes fermés, ou à des tests de référence statiques déconnectés des applications réelles, ce qui limite considérablement la marge d'amélioration des modèles. Les utilisateurs se trouvent également dans une zone d'ignorance, ne sachant pas comment leurs retours influencent les modèles, ni même si leurs retours sont pris en compte. Certains classements de modèles et plateformes de crowdsourcing tentent d'améliorer la transparence, mais ne permettent généralement ni aux utilisateurs de retracer leurs contributions, ni de fournir un retour substantiel pour leur participation. Les plateformes qui prétendent être équitables et transparentes s'appuient souvent sur l'intégrité plutôt que sur des normes exécutables.
Nous croyons que la technologie blockchain peut apporter de la transparence et de la propriété dans cette zone grise de l'IA. La blockchain permet non seulement aux contributeurs d'accéder facilement à des récompenses, mais elle offre également aux développeurs d'IA une garantie fiable sur la qualité et l'origine des données de rétroaction. Les utilisateurs sont incités, les développeurs obtiennent des données fiables, et tout le monde peut réaliser un audit bidirectionnel sur ce marché ouvert. Pour cela, nous avons mené un tour de table de 33 millions de dollars pour le produit grand public Yupp, qui permet à chacun d'explorer et de comparer gratuitement les derniers modèles d'IA.
Yupp adopte un modèle de crowdsourcing pour l'évaluation des modèles : les utilisateurs saisissent des mots-clés et consultent en parallèle plusieurs réponses générées par l'IA, puis choisissent la meilleure réponse. Leur choix génère des données de préférence "paquet de données" avec une signature numérique, qui sont très précieuses pour l'optimisation et l'évaluation après l'entraînement de l'IA. Les utilisateurs peuvent non seulement utiliser gratuitement les derniers modèles, mais aussi recevoir des récompenses en fonction des retours fournis.
La conception de Yupp transforme le jugement humain en ressource économique renouvelable. Avec la production de nouvelles données d'interaction, les anciennes données "expirent", formant ainsi un flywheel naturel : plus d'adoption entraîne des évaluations plus fraîches ; des évaluations plus fraîches donnent naissance à des modèles de meilleure qualité ; des modèles de meilleure qualité attirent plus d'utilisateurs. Tous les participants - qu'il s'agisse d'utilisateurs ordinaires ou de développeurs de modèles d'IA - peuvent y participer et voir des règles transparentes applicables à tous, garantissant que le marché reste d'une neutralité fiable. Personne ne peut cacher les scores, et personne ne peut manipuler les récompenses ou les résultats.
L'équipe fondatrice possède une solide expérience dans les domaines de l'IA et de la cryptographie. Ils ont précédemment développé ensemble des produits d'apprentissage automatique destinés aux consommateurs au début de Twitter. Pankaj Gupta a été responsable de l'ingénierie de la consommation mondiale chez Google Pay et Coinbase, tandis que Gilad Mishne était responsable de l'apprentissage automatique chez GoogleX. L'équipe de démarrage réunit des ingénieurs senior provenant de Google, Coinbase et des laboratoires de pointe.
L'IA a besoin d'un système d'évaluation robuste et fiable basé sur de vastes contributions humaines, et la technologie blockchain est la machine de confiance qui permet d'atteindre cet objectif. En permettant aux utilisateurs du monde entier de contribuer avec des retours sur l'amélioration des modèles, Yupp s'engage à devenir la couche d'évaluation fondamentale pour l'avenir de l'IA. Nous sommes honorés de soutenir Yupp et attendons avec impatience de les aider à construire une boucle de retour d'information sur la chaîne, garantissant que les résultats de l'innovation en IA soient partagés par tous les bâtisseurs.