Xiao Yanghua, professeur de Fudan : l'interpréteur de code ChatGPT est une réalisation marquante

2023-07-14 02:10:59

Source: Le papier

Journaliste Shao Wen

Après la sortie de la version bêta de l'interpréteur de code ChatGPT, les utilisateurs peuvent utiliser le langage naturel pour envoyer des instructions à ChatGPT afin d'effectuer des tâches de programmation complexes, même s'ils ne sont pas programmeurs. Cela peut avoir deux impacts majeurs : éliminer le fossé linguistique et remodeler l'industrie.

Il y aura deux tendances dans l'itération rapide des grands modèles à l'avenir : premièrement, ChatGPT apprendra certainement à partir de données à plus grande échelle et plus diversifiées, et en même temps combinera plus de données professionnelles dans le domaine privé pour effectuer un apprentissage plus large ; Deuxièmement, cela augmentera le degré d'analyse des données, qui peut être considéré comme un apprentissage plus approfondi dans une certaine mesure.

Source de l'image : générée par l'outil d'IA illimitée

La version bêta de l'interpréteur de code ChatGPT est officiellement ouverte à tous les utilisateurs de ChatGPT Plus. Il peut utiliser le langage naturel humain comme instructions pour piloter de grands modèles afin d'effectuer des opérations mathématiques, d'analyser des données, de dessiner des graphiques professionnels, et même de générer des vidéos et d'analyser le marché boursier.

"La capacité ChatGPT d'OpenAI a été à nouveau mise à niveau. Il a terminé la mise à niveau d'un outil à un assistant, et cette fois, il est passé d'un assistant ordinaire à un assistant professionnel. " Le 12 juillet, Xiao Yanghua, professeur à l'Université de Fudan et directeur du Shanghai Key Laboratory of Data Science Pengpai Technology (parlant de la récente version à succès d'OpenAI : l'interpréteur de code ChatGPT (interpréteur de code).

Le 9 juillet, heure de Pékin, la version bêta de l'interpréteur de code ChatGPT a été officiellement ouverte à tous les utilisateurs de ChatGPT Plus. Il peut utiliser le langage naturel humain comme instructions pour piloter de grands modèles afin d'effectuer des opérations mathématiques, des analyses de données, des graphiques professionnels et même générer des vidéos, Analyser le marché boursier.

C'est-à-dire que même si les utilisateurs ne sont pas des programmeurs, ils peuvent donner des instructions à ChatGPT en langage naturel pour effectuer des tâches de programmation complexes. Ceci est évalué par le monde extérieur comme "la fonction la plus puissante de GPT-4 à ce jour".

"Pour utiliser une métaphore inappropriée", a déclaré Xiao Yanghua : "On peut voir qu'OpenAI devrait être" planifié depuis longtemps ". Ils ont travaillé dur pour améliorer les capacités d'interaction multimodale des grands modèles. " L'interaction multimodale est motivée par langage naturel Capacités pour les tâches multimodales telles que les images, les diagrammes spécialisés, etc.

Qu'est-ce que cela signifie d'être une aide aussi professionnelle ? "Cela signifie que ChatGPT est capable d'accomplir même beaucoup de travail hautement professionnel. On peut dire qu'il peut être compétent pour le travail des étudiants de premier cycle avec des majors connexes dans les universités, comme les majors en science des données", a déclaré Xiao Yanghua.

"La capacité d'analyser les données détermine la capacité que le grand modèle peut obtenir à l'avenir"

Quant à savoir pourquoi ChatGPT a choisi de se mettre à niveau dans ce domaine, Xiao Yanghua pense que cela est dû à l'analyse approfondie et à l'apprentissage des données.Ces données existent largement, et la plupart des articles incluent essentiellement une analyse de données professionnelle de diverses disciplines. Les versions précédentes de GPT se concentraient principalement sur l'utilisation efficace des données textuelles, mais l'utilisation de graphiques, de grilles et leur correspondance avec le texte dans ces données est relativement étendue et simple. Cette mise à niveau a en fait bénéficié de l'analyse approfondie de la littérature professionnelle et d'autres données, et de l'établissement de la relation correspondante entre le texte, les graphiques et les formules, permettant à GPT d'acquérir la capacité de piloter des graphiques et des tableaux grâce à une interaction en langage naturel.

A partir d'une telle découverte, Xiao Yanghua a eu une révélation dans la recherche et le développement technologique : "Ce type de capacité d'analyse approfondie des corpus est probablement l'un des principaux facteurs qui déterminent la capacité des grands modèles. Le développement de grands modèles ne peu importe la quantité de données Pas trop."

Pour ChatGPT, Xiao Yanghua estime que la direction des efforts d'OpenAI a été de rechercher davantage de données de haute qualité et d'analyser en profondeur les données existantes, afin de rendre ses capacités de plus en plus puissantes. Par conséquent, l'obtention de données à grande échelle, de haute qualité et diversifiées, et une analyse approfondie de ces données peuvent être l'une des idées importantes pour promouvoir le développement de grands modèles. "

"Combler le fossé linguistique"

En ce qui concerne la mise à niveau des capacités de ChatGPT en général, Xiao Yanghua estime qu'il existe deux impacts possibles dignes d'attention : premièrement, "éliminer le fossé linguistique" ; deuxièmement, remodeler la forme industrielle.

Quel est le fossé linguistique ? Depuis l'invention des ordinateurs, les êtres humains espèrent laisser les ordinateurs accomplir diverses tâches définies selon leurs propres souhaits, ce qui oblige les professionnels à exprimer leurs intentions et à émettre des instructions par le biais d'un langage non naturel ou d'un langage formel, comme le premier langage d'assemblage, et plus tard le C++ high langage de programmation de niveau , langage de requête structuré tel que SQL, etc. Le langage de la communication humaine et de la communication est le langage naturel.

Selon les légendes occidentales, afin d'empêcher les humains de construire la "Tour de Babel" qui atteint le ciel, Dieu a foiré les langues humaines, rendant impossible pour les humains de communiquer et de comprendre les autres. Xiao Yanghua pense qu'il existe également une telle situation entre les machines et les humains.Au moins, les machines n'ont pas été en mesure de comprendre avec précision le langage naturel humain, de sorte qu'en fait, les humains se sont adaptés aux machines et ont converti leurs intentions en divers langages formels.

Cependant, les tâches que les ordinateurs doivent accomplir existent dans des milliers d'industries. Xiao Yanghua a déclaré que cela signifie que pour accomplir différentes tâches, les professionnels doivent apprendre différentes langues, telles que des langues spécifiquement pour la conception de puces et des langues pour bureautique. Tous ces éléments nécessitent une formation complexe à maîtriser, de sorte que chaque tâche professionnelle nécessite un apprentissage linguistique complexe, ce qui fixe un seuil linguistique élevé pour que les personnes s'engagent dans une certaine industrie.

Mais maintenant, il semble que Xiao Yanghua juge: "Tous ces langages formels sont inutiles et peuvent fondamentalement être remplacés par un langage naturel." Dans une certaine mesure, on peut considérer que les machines "comprennent" le langage naturel humain et en même temps comprendre Il a développé divers langages formels professionnels, capables de convertir avec précision les intentions humaines exprimées dans divers langages naturels en langages formels correspondants, tels que les langages de programmation et les langages de conception de puces.

Il s'agit d'éliminer le fossé linguistique, et il n'y a plus d'obstacle pour que les machines "comprennent" les humains. "Si la première version de ChatGPT a éliminé l'écart d'expression du langage naturel entre l'homme et la machine, ce ChatGPT avec la fonction d'interpréteur de code éliminera l'écart d'expression du langage professionnel entre l'homme et la machine." Xiao Yanghua pense que cela aura un impact très important. Impact est une réalisation marquante.

"Bientôt, les grands modèles seront progressivement compétents pour les capacités de "langage" requises pour que les êtres humains s'engagent dans un travail très professionnel, comme le langage mathématique et le langage physique, ainsi que la capacité de réflexion et la capacité de résolution de problèmes correspondantes. Parce que, dans De même, le langage mathématique dont les mathématiciens ont besoin pour effectuer des travaux de recherche n'est qu'un langage formel. Tant que les données appariées du langage naturel et du langage professionnel correspondant peuvent être obtenues, les grands modèles ont la possibilité d'apprendre. Ces données sont largement disponibles dans Dans la thèse, des logiciels professionnels largement utilisés, tels que MATLAB, peuvent également être utilisés pour la synthèse de données, atténuant ainsi davantage le problème de la rareté des données dans l'apprentissage des capacités professionnelles à grande échelle », a déclaré Xiao Yanghua.

Y a-t-il encore un besoin de postes professionnels ?

Cela signifie qu'à l'avenir, la plupart des travaux professionnels qui nécessitent une maîtrise des langues professionnelles pourront être bien faits, et le grand modèle pourra peut-être bien le mener à bien. Cela soulève également une question qui mérite une réflexion approfondie. Xiao Yanghua a demandé : Avons-nous encore de la place pour que les professionnels se développent, ou leur travail est-il nécessaire ?

Selon Xiao Yanghua, avec l'amélioration de la capacité des grands modèles, tout le travail effectué à l'aide du langage sera divisé en trois étapes à l'avenir : la première étape consiste à inviter (), la deuxième étape consiste à générer et la troisième étape consiste à évaluer.

"De toute évidence, ces emplois générés, qu'ils soient professionnels ou non, peuvent être confiés au grand modèle. Mais les professionnels ont toujours leur valeur, comme écrire des mots rapides, comment susciter le professionnalisme requis pour les grands graphiques de génération de modèles, et comment pour évaluer et analyser la qualité des résultats générés. Les humains ont encore leurs avantages dans ces aspects, ou à court terme, les grands modèles ont encore besoin d'être améliorés pour être compétents », a déclaré Xiao Yanghua, cela va donc remodeler la forme de l'industrie.

De plus, la plupart des tâches liées à la génération de contenu et au travail d'analyse seront décomposées en plusieurs étapes de subdivision, parmi lesquelles les étapes de subdivision répétitives, routinières et génératives seront progressivement confiées au grand modèle, et les tâches de subdivision que les petits modèles traditionnels sont bons à sont confiés à de petits modèles, et les tâches de subdivision qui ne sont encore bonnes qu'à des humains sont confiées à des humains. Xiao Yanghua estime que décomposer des tâches complexes en plusieurs étapes (décomposition), puis compléter les étapes pour lesquelles ils sont bons (réorganisation) par de grands modèles, de petits modèles et des humains.tendance de base.

Deux tendances d'itération rapide des grands modèles

Quant à savoir si cette mise à jour représente l'émergence de GPT-4.5, Xiao Yanghua estime que ce n'est pas la clé, mais cette question a attiré tellement d'attention, ce qui reflète en fait les préoccupations des êtres humains concernant l'itération rapide de grands modèles, et à un reflète dans une certaine mesure l'impact possible de chacun sur elle. Selon lui, cette inquiétude n'est pas déraisonnable, "Dans le cas de son itération rapide, au moins nous comprenons que sa vitesse peut ne pas être en mesure de suivre sa vitesse d'itération. Nous devons même appuyer activement sur le bouton pause pour le développement de grands modèles, réfléchissez bien à ce qu'il peut et ne peut pas faire.

Pour les deux tendances d'itération rapide de grands modèles, Xiao Yanghua estime que, premièrement, ChatGPT est désormais principalement basé sur l'apprentissage des données publiques, et qu'il apprendra certainement à partir de données à plus grande échelle et plus diversifiées, tout en combinant une expertise du domaine privé. Des données plus solides. Deuxièmement, cela augmentera le degré d'analyse des données, ce qui peut être considéré comme améliorant la profondeur de l'apprentissage dans une certaine mesure. En d'autres termes, il y a deux dimensions, l'une est d'apprendre de plus en plus largement, et l'autre est d'apprendre des données anciennes de plus en plus spécialisées et approfondies.

"C'est une idée très importante dans cette version. En fait, il est très probable que les données soient toujours les mêmes, mais elles sont apprises plus en profondeur", a poursuivi Xiao Yanghua, "Si les grands modèles de chaque domaine sont fragmentés et ne peut pas être intégré , alors sa capacité peut toujours être dans la plage contrôlable. Cependant, si ChatGPT a une forte capacité de connaissances générales et combine en permanence diverses données de domaine privé pour l'apprentissage, alors sa capacité de mise à niveau peut être au-delà de nos attentes. Par conséquent, la promotion de grands modèles Il est impératif et imminent de se développer dans une direction sûre et contrôlable.

Voir l'original

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.