Le 136ème jour après avoir crié "être une version chinoise d'OpenAI", Wang Huiwen a vendu Light Years Away à Meituan.
Le 29 juin 2023, Meituan a annoncé à la Bourse de Hong Kong qu'elle acquerra intégralement 100% du capital de "Light Years Beyond" le 29 juin 2023. Le prix d'achat total comprend : 233,673 millions de dollars américains en espèces + engagement de 366,924 millions de dollars de dette en renminbi + 1 yuan, totalisant environ 2,065 milliards de yuans.
Il est difficile d'imaginer que la première start-up de mannequins à grande échelle fondée par un grand patron en Chine se terminera ainsi, ce qui a laissé d'innombrables doutes et spéculations sur le marché.
D'un point de vue commercial global, l'acquisition de Meituan à des années-lumière n'est qu'une acquisition courante parmi les entreprises. Mais pour l'industrie nationale de l'IA, cette acquisition semble indiquer que la vague d'entrepreneuriat à grande échelle de l'IA qui n'a été chaude que pendant six mois est en train de se refroidir.
Le marché des capitaux a une perception plus intuitive de la température de l'eau de l'industrie. Depuis le 26 juin, les actions conceptuelles d'IA telles que HKUST Xunfei, Kunlun Wanwei et 360 ont collectivement chuté.
Non seulement en Chine, les gens ne poursuivent même plus ChatGPT, qui était autrefois afflué.
Selon les données de l'outil d'analyse de données de site Web SimilarWeb, le taux de croissance des visites de ChatGPT au stade initial était étonnant. Le taux de croissance d'un mois sur l'autre était de 131,6 % en janvier, de 62,5 % en février et de 55,8 % en mars. a nettement ralenti en avril, avec un taux de croissance mensuel de 12,6 %, et en mai, ce chiffre n'était que de 2,8 %.
Lorsque la popularité des grands modèles a disparu, il est facile pour les gens de penser à une question : le grand modèle est-il une bonne opportunité pour démarrer une entreprise ?
Évidemment, il n'y a pas de réponse standard à cette question, et même les opinions des grands sont très différentes. Il y a quelques jours à peine, Fu Sheng, président-directeur général de Cheetah Mobile, et Zhu Xiaohu, directeur général de GSR Venture Capital Fund, se sont "disputés" dans le cercle d'amis à ce sujet.
Les incohérences cognitives du grand modèle ne se focalisent pas uniquement sur l'individu. Alors que les entrepreneurs, les investisseurs et les demandeurs ont tous des biais cognitifs, être "prudent et conservateur" avec les grands modèles est devenu un état commun pour la plupart des acteurs.
Lors de la conférence annuelle 2023 de China Film Capital qui s'est tenue le 16 juin, il y a eu une discussion animée entre les investisseurs de China Film Capital et les entreprises de technologie dure et de technologie grand public investies sur la manière dont l'industrie adopte les modèles à grande échelle et l'AIGC.
Du point de vue de "Jiazi Guangnian", le marché des modèles à grande échelle a un besoin urgent de voix rationnelles, le rythme de l'innovation ne peut être arrêté et de nombreuses questions restent à clarifier - est-ce que des modèles à grande échelle peuvent être coulés ? Comment lancer ? Quels sont les problèmes avec l'entrée dans le grand modèle? La future commercialisation de grands modèles répétera-t-elle les erreurs de l'ancienne industrie de l'IA ?
Peu importe à quel point les gens sont inquiets, il est presque acquis que l'industrie adopte le grand modèle - la question est de savoir de quelle manière.
1. Investisseurs prudents
Baichuan Intelligent, Lianyuan Technology, Lingxin Intelligent, Xihu Xinchen, MiniMax... De début 2023 à aujourd'hui, les start-up nationales à grande échelle ont émergé les unes après les autres. la force de chaque entreprise est fortement capitalisée côté approuvé.
À cette époque, il n'était pas rare qu'un certain entrepreneur vedette quitte son emploi pour démarrer une entreprise et entrer dans un grand modèle pour obtenir un financement colossal.
Par exemple, le 1er juin, il a été signalé que MiniMax, une start-up nationale de modèles à grande échelle, était sur le point de boucler un tour de financement de plus de 250 millions de dollars américains, et la valorisation de la société dépassait 1,2 milliard de dollars américains ;
À l'époque, les informations sur le financement de Light Years Away, qui venait d'être racheté par Meituan, étaient encore plus confuses. Wang Huiwen a un jour nié que la société avait reçu un financement de 230 millions de dollars de Source Code, Tencent, Wuyuan et Suhua, mais ce financement a finalement été rejeté et confirmé en raison de l'annonce d'acquisition faite par Meituan.
Cette vague d'investisseurs à la recherche d'entrepreneurs a fait penser que le grand modèle activerait tout le cercle national du capital-risque en IA, mais ce n'est pas le cas. En fait, à l'exception des équipes vedettes avec leurs propres auréoles, les investisseurs sont plus susceptibles d'attendre et de voir et d'examiner l'entrepreneuriat à grande échelle, et seul un petit nombre de personnes dépensent réellement de l'argent réel.
Dès le début de cette année, lorsque la vague ChatGPT a balayé le monde, "Jiazi Guangnian" a échangé pour la première fois avec certains investisseurs. Pendant ce temps, presque tout le monde apprenait rapidement et invitait des experts à faire de la vulgarisation scientifique au sein de l'entreprise.
À cette époque, il y avait une discussion brûlante dans le domaine de l'IA : ChatGPT est-il le moment iPhone dans le monde de l'intelligence artificielle ? À cet égard, la réponse donnée par Xianfeng est de ne pas se précipiter vers une conclusion. "Nous ne sommes pas encore sûrs de l'ampleur de cet impact, mais nous pensons que cela (le grand modèle) va certainement changer quelque chose", a déclaré Li Kang, vice-président de Xianfeng.
Cependant, certaines institutions d'investissement ont exprimé des inquiétudes concernant le grand modèle. Un investisseur du marché primaire a déclaré à "Jiazi Guangnian" qu'il était très inquiet de la réaction excessive de la Chine. Après le déclenchement de ChatGPT, les stocks de concepts d'IA nationaux ont explosé. "Nos marchés primaires et secondaires doivent se demander si l'investissement pertinent injecté peut générer des rendements correspondants. S'il s'agit d'intérêts à court terme, ce type d'investissement finira facilement par être gaspillé, car vous n'avez pas vraiment favorisé le développement de la technologie. , mais c'est un investissement conceptuel."
Selon lui, les investisseurs devraient se concentrer sur l'exploration de sciences plus fondamentales qui ont un impact sur l'avenir de l'humanité, car c'est la véritable puissance technologique avec une valeur marchande potentielle profonde. "Il est nécessaire de s'intégrer à la dynamique du marché, ainsi qu'à la valeur marchande et au progrès social réel et futur. Nous ne devons pas suivre aveuglément. Nous devons clairement comprendre ce qui peut changer l'avenir. Cela ne devrait pas être une bulle dans une vague."
Cependant, un pratiquant de la FA a déclaré à "Jiazi Guangnian": "Récemment, les investisseurs ont progressivement commencé à investir dans des projets modèles à grande échelle, mais le montant n'est pas important."
"Le problème essentiel est toujours une cognition insuffisante." Concernant l'attitude prudente des investisseurs, Zhang Gaonan, associé directeur de Huaying Capital, a donné sa propre compréhension. Il a ajouté : "Presque personne ne peut définir clairement le grand modèle. Nous devons définir les limites du grand modèle avant d'en discuter. Le grand modèle que vous avez mentionné et le grand modèle que j'ai mentionné ne sont probablement pas la même chose."
Aux yeux de certains, la prudence des investisseurs peut être un signal négatif pour l'entrepreneuriat à grande échelle, et elle jette de l'eau froide sur les modèles à grande échelle. Mais d'un point de vue objectif, prudence ne signifie pas rejet, et une étreinte rationnelle après réflexion profonde est plus précieuse.
Qu'il s'agisse d'investisseurs, d'entrepreneurs ou d'entreprises traditionnelles qui espèrent transformer et mettre à niveau leur propre entreprise à l'aide de grands modèles, ils doivent clarifier deux questions avant d'entrer réellement sur le marché des grands modèles : quelle est la limite de capacité du grand modèle, et s'ils ont besoin d'introduire un grand modèle?
2. Avant d'embrasser le grand modèle, clarifiez deux questions
Lorsqu'une nouvelle technologie émerge, la question centrale dans le monde des affaires est : où et comment cette technologie peut-elle être utilisée ?
Ceci est particulièrement important pour les grands modèles, et c'est aussi une question que les entreprises qui ne sont pas vraiment entrées dans le grand modèle doivent examiner attentivement.
Pour répondre à cette question, il est d'abord nécessaire de délimiter la frontière de capacité du grand modèle.
La particularité du grand modèle est que son algorithme de modèle interne est une énorme boîte noire.Le processus de génération du grand modèle est inexplicable et imprévisible, il est donc difficile de définir sa limite de capacité. Mais ce qui est certain, c'est que le grand modèle polyvalent n'est pas la panacée.
Lin Yonghua, vice-président et ingénieur en chef de l'Institut de recherche de Zhiyuan, a mentionné un jour dans un partage que du point de vue de la mise en œuvre industrielle, « grand modèle + apprentissage rapide » ne peut pas tout remplacer.
Elle a en outre mentionné que pour de nombreuses tâches spécifiques ou nouvelles tâches, l'apprentissage des indices peut permettre au grand modèle de produire les résultats requis via plusieurs séries d'indices, mais le grand modèle "ne peut pas se souvenir" de ce processus, et si le développeur ajoute l'indice entier dans chaque appel, d'une part, il peut le rendre de plus en plus long et dépasser la capacité de contexte du grand modèle, d'autre part, il conduira inévitablement à une augmentation du coût de chaque raisonnement, et l'effet sera difficile contrôller. Cette instabilité est encore plus fatale au débarcadère des produits qui ont investi de l'argent réel.
Zhang Yitian, expert en chef du National Speech Innovation Center, a également déclaré lors de la réunion annuelle de Huaying Capital en 2023 : « Le grand modèle est une logique générative, et ce qu'il donne n'est qu'un regroupement de vocabulaire optimal, et il n'y a pas de cause et effet entre la réponse et la question. Ce que nous obtenons n'est qu'un « résultat », qui doit être identifié, et non une « réponse ». Par conséquent, si le grand modèle peut être directement appliqué dans des domaines sérieux tels que l'éducation, les soins médicaux, et la justice peut être un problème. Mais c'est dans l'aide à la prise de décision. C'est significatif. En termes de génération directe de résultats, s'il doit être commercialisé et produit, nous pensons qu'il reste encore un long chemin à parcourir."
Par conséquent, il existe un consensus dans l'industrie sur le fait qu'à l'avenir, chaque industrie aura son propre modèle vertical, et le point clé est de savoir comment intégrer les capacités du modèle général avec les propres données de l'industrie de l'entreprise.
Mais avant d'envisager réellement la mise en œuvre du projet de modèle à grande échelle, les entrepreneurs doivent se poser une question plus importante mais facilement négligée : le modèle à grande échelle est-il un « juste besoin » pour l'entreprise ?
À cet égard, une équipe nationale de modèles multimodaux à grande échelle a dit un jour à "Jiazi Guangnian" que la question de savoir si les modèles à grande échelle sont "juste nécessaires" aux entreprises doit être comprise sous plusieurs angles. Pour certaines entreprises, ne pas introduire un modèle à grande échelle équivaut à perdre un avantage concurrentiel sur le marché, et elles doivent utiliser un modèle à grande échelle pour gagner la faveur des clients - c'est aussi un "juste besoin".
Mais dans une certaine mesure, il s'agit davantage d'un sentiment du marché au début des technologies émergentes. À long terme, l'industrialisation des technologies émergentes sera essentiellement guidée par les besoins des entreprises. À l'heure actuelle, la question de savoir si une entreprise a besoin d'un grand modèle doit tenir compte de plusieurs facteurs.
Outre les problèmes spécifiques de mise en œuvre de projets, les entreprises doivent également tenir compte des problèmes de sécurité des données et de l'impact des grands modèles sur la structure du marché d'origine.
Ces deux problèmes sont fréquemment apparus à l'ère de l'information et du numérique et ne peuvent être éradiqués. A l'ère de l'intelligence, ces problèmes peuvent apparaître de manière plus subtile.
"De nombreuses entreprises grand public ou basées sur des plateformes, si elles adoptent le grand modèle sans réserve, le grand modèle a une forte capacité à contrecarrer l'industrie, car cela signifie que l'industrie est facilement transférée de l'industrie. Le seuil d'entrée et la clé cognitive ", a déclaré Zhang Yitian.
Dans le contexte de la transformation numérique, la plupart des industries ont réalisé la transformation numérique et la mise à niveau grâce à des technologies telles que le big data et le cloud computing. Mais dans le même temps, les entreprises traditionnelles ont également transmis une grande quantité de données de l'industrie aux fabricants de technologie numérique.Les fournisseurs de technologie numérique sont devenus un acteur principal incontournable de l'industrie et la structure du marché d'origine a été modifiée.
Cependant, en raison de la faible quantité de données dans des secteurs tels que l'industrie et la construction, et de la difficulté de connecter les données entre les secteurs d'activité, les entreprises traditionnelles maintiennent encore d'importantes barrières à la concurrence.
Zhang Yitian a déclaré : « Actuellement, le secteur de la construction est le secteur le mieux protégé dans le cadre de la numérisation. Maintenant, l'informatisation du secteur de la construction, à l'exception d'un Glodon qui peut faire un budget, aucun géant ne peut intervenir. Pourquoi ? Parce que l'architecture a des dessins de conception, des dessins de construction, des dessins d'entretien, des dessins de planification, des dessins de classement et huit autres dessins, tous les dessins ne sont pas reliés les uns aux autres et les ministères ne se reconnaissent pas.Le coût d'ouverture de ces huit dessins du l'ensemble du bâtiment est suffisamment élevé, de sorte que l'industrie de la construction a maintenu la diversification de ce type de concurrence. Nous pensons généralement que la diversification de la concurrence est la source de vitalité et de puissance pour le développement industriel.
Par conséquent, sous la vague de modèles à grande échelle, pour les entreprises dont les normes de l'industrie et les avantages concurrentiels ne sont pas parfaits, adopter des modèles à grande échelle sans condition est une question que chaque entreprise doit examiner attentivement.
3. Il n'y a pas de réponse standard pour l'implémentation technique de grands modèles
Pour les entrants qui ont investi de l'argent réel sur le marché des grands modèles, la prochaine chose à faire est de résoudre le problème de mise en œuvre du projet réel.
À cet égard, l'industrie a progressivement formé un consensus sur le fait qu'à l'avenir, les grands modèles et les petits modèles se compléteront dans le processus de mise en œuvre industrielle.
Lin Yonghua a dit un jour que les scénarios de zone étroite qui nécessitent une grande précision et de faibles capacités de généralisation sont plus adaptés au paradigme "petit modèle + apprentissage par transfert". Tels que l'inspection industrielle, l'inspection de la qualité industrielle, l'analyse d'images médicales, etc.
En outre, Xuan Xiaohua, le fondateur de Huayuan Computing, a également déclaré que le modèle commercial des entreprises d'IA à l'avenir est d'intégrer le grand modèle général piloté par les big data et le petit modèle de données piloté par les connaissances pour les industries verticales afin d'atteindre deux- roue motrice.
Zhang Gaonan a également déclaré à "Jiazi Guangnian" : "Lorsque les entreprises optimisent leurs propres modèles ou forment des modèles verticaux, elles peuvent se combiner avec de grands modèles. Elles n'ont pas besoin de données de grande dimension comme les grands modèles, et elles n'ont pas besoin d'appliquer pleinement Cependant, la technologie des grands modèles peut être couplée à d'autres technologies pour former un modèle vertical industriel avec de faibles besoins en puissance de calcul, ce qui est éclairant, et il ne s'agit en aucun cas d'une simple application des grands modèles.
Par exemple, pour le problème "d'illusion" des grands modèles qui a été critiqué à plusieurs reprises, il peut être nécessaire de combiner la génération précédente de technologie d'IA pour le résoudre à court terme.
"Il existe de nombreuses raisons aux hallucinations, et cela peut être dû au fait que les données sont relativement rares et insuffisantes dans un certain domaine. Dans ce cas, nous devons fournir plus de données au modèle pour la formation. De plus, lorsque les utilisateurs posent des questions, fournissez clairement Plus les informations de base sont également un moyen de réduire les hallucinations ou de faire baisser la "température". Parfois, les hallucinations se produisent parce que les questions ne sont pas assez complètes, manquent de contexte et de prémisse. Par conséquent, la question est également très importante, et l'ingénierie est la clé. Dans De plus, si les utilisateurs veulent vraiment résoudre des problèmes précis à 100 %, ils peuvent toujours avoir besoin d'utiliser des graphes de connaissances. Les graphes de connaissances peuvent garantir l'exactitude du raisonnement logique, ainsi que des technologies plus récentes, notamment le "modèle mondial" proposé par Yann Lecun, le responsable de Meta AI », a déclaré Wu Xuening, CTO de Jinyou.com.
En plus de combiner avec la génération précédente de technologie d'IA, il est également important de combiner le processus de formation de grands modèles avec des données industrielles de haute qualité.
Par exemple, en tant que base de données hybride servant la plate-forme AI PaaS, Tianyun Data a traversé plus de dix ans et a maintenant atteint le stade de la combinaison avec de grands modèles.
Li Congwu, vice-président de Tianyun Data, a déclaré que la combinaison de lui-même et du grand modèle sera considérée sous deux aspects - premièrement, comment combiner les données du domaine privé avec le grand modèle. Par exemple, Tianyun Data a réalisé un projet similaire d'interprétation des politiques pour la China Securities Regulatory Commission En combinant diverses données telles que les réglementations, les précédents et les interprétations, Tianyun Data a généré des interprétations des violations, similaires au processus de sanctions judiciaires. les causes des infractions.
Deuxièmement, Tianyun Data a développé une base de données hybride et est l'une des premières entreprises en Chine. Dès 2018 environ, Tianyun Data a proposé le concept de base de données native AI, qui est en fait similaire à la base de données vectorielle qui prend en charge les grands modèles aujourd'hui.Tianyun Data a publié une base de données vectorielle auto-développée et l'a appliquée à ses propres modèles.
En général, il n'y a pas de réponse standard à l'implémentation technique de grands modèles.
Sur la voie de l'intelligence artificielle, la Chine ouvrira assurément une voie différente des autres pays. Il est difficile de distinguer les avantages et les inconvénients des deux voies, et elles reposent davantage sur des choix réalistes dans des conditions nationales différentes.
Li Kang, vice-président de Xianfeng, a un jour fait une analogie avec "Jiazi Guangnian" dans une interview, et cela semble toujours d'actualité aujourd'hui : "Il est injuste d'utiliser le succès d'OpenAI pour décrire les nombreux problèmes des entrepreneurs nationaux. est comme deux personnes jouant aux cartes. C'est différent, l'autre partie a soudainement joué une grosse main et a obtenu une quinte flush, vous dites simplement qu'il a bien joué, j'étais trop prudent, mais pourquoi ne l'avez-vous pas dit quand j'ai gagné ? »
Zhang Yitian a partagé que du point de vue du gouvernement central, les grands modèles, y compris les questions d'intelligence artificielle, sont un outil stratégique important pour gagner l'initiative dans la concurrence mondiale, et une stratégie importante pour promouvoir le développement par saute-mouton de la science et de la technologie de mon pays, le l'optimisation et la mise à niveau de l'industrialisation, et le bond global de la ressource de productivité.
"Lorsque le rapport du 20e Congrès national du Parti communiste chinois parlait de questions industrielles, il proposait l'intelligence artificielle séparément de la nouvelle génération de technologies de l'information. Par conséquent, d'un point de vue politique, le développement de l'intelligence artificielle et des grands- les modèles réduits n'est pas seulement une question technique et une question industrielle, mais aussi le cœur de la concurrence d'une économie nationale. La question du pouvoir, d'un point de vue plus profond, est un problème politique, et chacun devrait comprendre cette question d'un point de vue plus élevé.
Si nous sortons de Chine et prolongeons la chronologie du développement technologique, le tumulte causé par ChatGPT pourrait n'être qu'un point dans l'histoire du développement de la technologie de l'intelligence artificielle, et tous les jugements pourraient être prématurés.
Après tout, même les techniciens qui ont longtemps été immergés en première ligne de la recherche sur l'intelligence artificielle ne sont pas encore parvenus à un consensus sur l'avenir de l'intelligence artificielle et sont profondément anxieux.
Dans le livre récemment populaire "Why Greatness Can't Be Planned", les auteurs Kenneth Stanley et Joel Lehman écrivent : "Nous devons faire face au fait inconfortable que nous ne pouvons pas déterminer si des règles empiriques peuvent être des guides fiables dans la poursuite des objectifs de l'IA. ."
Lors de la Conférence Zhiyuan de Pékin en 2023 qui s'est terminée il n'y a pas longtemps, Huang Tiejun, directeur de l'Institut de recherche de Zhiyuan, avait également une anxiété très similaire. Il a directement utilisé les quatre mots "incapable de fermer" comme titre du discours de la cérémonie de clôture. Il a déclaré: "Nous sommes dans un état incertain. Est-ce que ce Near AGI est plus fort que nous? Est-il plus intelligent que nous? Ou quand nous dépassera-t-il? Je ne sais pas. Nous sommes complètement dans un état d'être hors de contrôle."
A la fin du discours de clôture, il concluait par cette phrase : « Si on peut affronter les risques avec le même enthousiasme que d'investir dans les grands modèles, au moins il est possible d'appréhender l'avenir. Mais, croyez-vous que l'humain puisse faire ça? Je ne sais pas.
En regardant toutes les technologies et industries, ce "sentiment de perte de contrôle" des techniciens de base de première ligne n'est pas courant dans d'autres domaines. Maintenant, presque tout le monde traverse la rivière en tâtant les pierres. Chaque entreprise entrant sur le marché aujourd'hui a le potentiel de devenir un pionnier dans la terre vierge technologique.
Et le temps est la meilleure preuve pour tout prouver.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Les modèles à grande échelle montent en flèche depuis six mois et seuls quelques investisseurs ont payé de l'argent réel
Auteur|Liu Yangnan
Source|Année-lumière de Jiazi
Le 136ème jour après avoir crié "être une version chinoise d'OpenAI", Wang Huiwen a vendu Light Years Away à Meituan.
Le 29 juin 2023, Meituan a annoncé à la Bourse de Hong Kong qu'elle acquerra intégralement 100% du capital de "Light Years Beyond" le 29 juin 2023. Le prix d'achat total comprend : 233,673 millions de dollars américains en espèces + engagement de 366,924 millions de dollars de dette en renminbi + 1 yuan, totalisant environ 2,065 milliards de yuans.
Il est difficile d'imaginer que la première start-up de mannequins à grande échelle fondée par un grand patron en Chine se terminera ainsi, ce qui a laissé d'innombrables doutes et spéculations sur le marché.
D'un point de vue commercial global, l'acquisition de Meituan à des années-lumière n'est qu'une acquisition courante parmi les entreprises. Mais pour l'industrie nationale de l'IA, cette acquisition semble indiquer que la vague d'entrepreneuriat à grande échelle de l'IA qui n'a été chaude que pendant six mois est en train de se refroidir.
Le marché des capitaux a une perception plus intuitive de la température de l'eau de l'industrie. Depuis le 26 juin, les actions conceptuelles d'IA telles que HKUST Xunfei, Kunlun Wanwei et 360 ont collectivement chuté.
Non seulement en Chine, les gens ne poursuivent même plus ChatGPT, qui était autrefois afflué.
Selon les données de l'outil d'analyse de données de site Web SimilarWeb, le taux de croissance des visites de ChatGPT au stade initial était étonnant. Le taux de croissance d'un mois sur l'autre était de 131,6 % en janvier, de 62,5 % en février et de 55,8 % en mars. a nettement ralenti en avril, avec un taux de croissance mensuel de 12,6 %, et en mai, ce chiffre n'était que de 2,8 %.
Lorsque la popularité des grands modèles a disparu, il est facile pour les gens de penser à une question : le grand modèle est-il une bonne opportunité pour démarrer une entreprise ?
Évidemment, il n'y a pas de réponse standard à cette question, et même les opinions des grands sont très différentes. Il y a quelques jours à peine, Fu Sheng, président-directeur général de Cheetah Mobile, et Zhu Xiaohu, directeur général de GSR Venture Capital Fund, se sont "disputés" dans le cercle d'amis à ce sujet.
Lors de la conférence annuelle 2023 de China Film Capital qui s'est tenue le 16 juin, il y a eu une discussion animée entre les investisseurs de China Film Capital et les entreprises de technologie dure et de technologie grand public investies sur la manière dont l'industrie adopte les modèles à grande échelle et l'AIGC.
Du point de vue de "Jiazi Guangnian", le marché des modèles à grande échelle a un besoin urgent de voix rationnelles, le rythme de l'innovation ne peut être arrêté et de nombreuses questions restent à clarifier - est-ce que des modèles à grande échelle peuvent être coulés ? Comment lancer ? Quels sont les problèmes avec l'entrée dans le grand modèle? La future commercialisation de grands modèles répétera-t-elle les erreurs de l'ancienne industrie de l'IA ?
Peu importe à quel point les gens sont inquiets, il est presque acquis que l'industrie adopte le grand modèle - la question est de savoir de quelle manière.
1. Investisseurs prudents
Baichuan Intelligent, Lianyuan Technology, Lingxin Intelligent, Xihu Xinchen, MiniMax... De début 2023 à aujourd'hui, les start-up nationales à grande échelle ont émergé les unes après les autres. la force de chaque entreprise est fortement capitalisée côté approuvé.
À cette époque, il n'était pas rare qu'un certain entrepreneur vedette quitte son emploi pour démarrer une entreprise et entrer dans un grand modèle pour obtenir un financement colossal.
Par exemple, le 1er juin, il a été signalé que MiniMax, une start-up nationale de modèles à grande échelle, était sur le point de boucler un tour de financement de plus de 250 millions de dollars américains, et la valorisation de la société dépassait 1,2 milliard de dollars américains ;
À l'époque, les informations sur le financement de Light Years Away, qui venait d'être racheté par Meituan, étaient encore plus confuses. Wang Huiwen a un jour nié que la société avait reçu un financement de 230 millions de dollars de Source Code, Tencent, Wuyuan et Suhua, mais ce financement a finalement été rejeté et confirmé en raison de l'annonce d'acquisition faite par Meituan.
Cette vague d'investisseurs à la recherche d'entrepreneurs a fait penser que le grand modèle activerait tout le cercle national du capital-risque en IA, mais ce n'est pas le cas. En fait, à l'exception des équipes vedettes avec leurs propres auréoles, les investisseurs sont plus susceptibles d'attendre et de voir et d'examiner l'entrepreneuriat à grande échelle, et seul un petit nombre de personnes dépensent réellement de l'argent réel.
À cette époque, il y avait une discussion brûlante dans le domaine de l'IA : ChatGPT est-il le moment iPhone dans le monde de l'intelligence artificielle ? À cet égard, la réponse donnée par Xianfeng est de ne pas se précipiter vers une conclusion. "Nous ne sommes pas encore sûrs de l'ampleur de cet impact, mais nous pensons que cela (le grand modèle) va certainement changer quelque chose", a déclaré Li Kang, vice-président de Xianfeng.
Cependant, certaines institutions d'investissement ont exprimé des inquiétudes concernant le grand modèle. Un investisseur du marché primaire a déclaré à "Jiazi Guangnian" qu'il était très inquiet de la réaction excessive de la Chine. Après le déclenchement de ChatGPT, les stocks de concepts d'IA nationaux ont explosé. "Nos marchés primaires et secondaires doivent se demander si l'investissement pertinent injecté peut générer des rendements correspondants. S'il s'agit d'intérêts à court terme, ce type d'investissement finira facilement par être gaspillé, car vous n'avez pas vraiment favorisé le développement de la technologie. , mais c'est un investissement conceptuel."
Selon lui, les investisseurs devraient se concentrer sur l'exploration de sciences plus fondamentales qui ont un impact sur l'avenir de l'humanité, car c'est la véritable puissance technologique avec une valeur marchande potentielle profonde. "Il est nécessaire de s'intégrer à la dynamique du marché, ainsi qu'à la valeur marchande et au progrès social réel et futur. Nous ne devons pas suivre aveuglément. Nous devons clairement comprendre ce qui peut changer l'avenir. Cela ne devrait pas être une bulle dans une vague."
Cependant, un pratiquant de la FA a déclaré à "Jiazi Guangnian": "Récemment, les investisseurs ont progressivement commencé à investir dans des projets modèles à grande échelle, mais le montant n'est pas important."
"Le problème essentiel est toujours une cognition insuffisante." Concernant l'attitude prudente des investisseurs, Zhang Gaonan, associé directeur de Huaying Capital, a donné sa propre compréhension. Il a ajouté : "Presque personne ne peut définir clairement le grand modèle. Nous devons définir les limites du grand modèle avant d'en discuter. Le grand modèle que vous avez mentionné et le grand modèle que j'ai mentionné ne sont probablement pas la même chose."
Aux yeux de certains, la prudence des investisseurs peut être un signal négatif pour l'entrepreneuriat à grande échelle, et elle jette de l'eau froide sur les modèles à grande échelle. Mais d'un point de vue objectif, prudence ne signifie pas rejet, et une étreinte rationnelle après réflexion profonde est plus précieuse.
Qu'il s'agisse d'investisseurs, d'entrepreneurs ou d'entreprises traditionnelles qui espèrent transformer et mettre à niveau leur propre entreprise à l'aide de grands modèles, ils doivent clarifier deux questions avant d'entrer réellement sur le marché des grands modèles : quelle est la limite de capacité du grand modèle, et s'ils ont besoin d'introduire un grand modèle?
2. Avant d'embrasser le grand modèle, clarifiez deux questions
Lorsqu'une nouvelle technologie émerge, la question centrale dans le monde des affaires est : où et comment cette technologie peut-elle être utilisée ?
Ceci est particulièrement important pour les grands modèles, et c'est aussi une question que les entreprises qui ne sont pas vraiment entrées dans le grand modèle doivent examiner attentivement.
Pour répondre à cette question, il est d'abord nécessaire de délimiter la frontière de capacité du grand modèle.
La particularité du grand modèle est que son algorithme de modèle interne est une énorme boîte noire.Le processus de génération du grand modèle est inexplicable et imprévisible, il est donc difficile de définir sa limite de capacité. Mais ce qui est certain, c'est que le grand modèle polyvalent n'est pas la panacée.
Lin Yonghua, vice-président et ingénieur en chef de l'Institut de recherche de Zhiyuan, a mentionné un jour dans un partage que du point de vue de la mise en œuvre industrielle, « grand modèle + apprentissage rapide » ne peut pas tout remplacer.
Elle a en outre mentionné que pour de nombreuses tâches spécifiques ou nouvelles tâches, l'apprentissage des indices peut permettre au grand modèle de produire les résultats requis via plusieurs séries d'indices, mais le grand modèle "ne peut pas se souvenir" de ce processus, et si le développeur ajoute l'indice entier dans chaque appel, d'une part, il peut le rendre de plus en plus long et dépasser la capacité de contexte du grand modèle, d'autre part, il conduira inévitablement à une augmentation du coût de chaque raisonnement, et l'effet sera difficile contrôller. Cette instabilité est encore plus fatale au débarcadère des produits qui ont investi de l'argent réel.
Zhang Yitian, expert en chef du National Speech Innovation Center, a également déclaré lors de la réunion annuelle de Huaying Capital en 2023 : « Le grand modèle est une logique générative, et ce qu'il donne n'est qu'un regroupement de vocabulaire optimal, et il n'y a pas de cause et effet entre la réponse et la question. Ce que nous obtenons n'est qu'un « résultat », qui doit être identifié, et non une « réponse ». Par conséquent, si le grand modèle peut être directement appliqué dans des domaines sérieux tels que l'éducation, les soins médicaux, et la justice peut être un problème. Mais c'est dans l'aide à la prise de décision. C'est significatif. En termes de génération directe de résultats, s'il doit être commercialisé et produit, nous pensons qu'il reste encore un long chemin à parcourir."
Par conséquent, il existe un consensus dans l'industrie sur le fait qu'à l'avenir, chaque industrie aura son propre modèle vertical, et le point clé est de savoir comment intégrer les capacités du modèle général avec les propres données de l'industrie de l'entreprise.
Mais avant d'envisager réellement la mise en œuvre du projet de modèle à grande échelle, les entrepreneurs doivent se poser une question plus importante mais facilement négligée : le modèle à grande échelle est-il un « juste besoin » pour l'entreprise ?
À cet égard, une équipe nationale de modèles multimodaux à grande échelle a dit un jour à "Jiazi Guangnian" que la question de savoir si les modèles à grande échelle sont "juste nécessaires" aux entreprises doit être comprise sous plusieurs angles. Pour certaines entreprises, ne pas introduire un modèle à grande échelle équivaut à perdre un avantage concurrentiel sur le marché, et elles doivent utiliser un modèle à grande échelle pour gagner la faveur des clients - c'est aussi un "juste besoin".
Mais dans une certaine mesure, il s'agit davantage d'un sentiment du marché au début des technologies émergentes. À long terme, l'industrialisation des technologies émergentes sera essentiellement guidée par les besoins des entreprises. À l'heure actuelle, la question de savoir si une entreprise a besoin d'un grand modèle doit tenir compte de plusieurs facteurs.
Outre les problèmes spécifiques de mise en œuvre de projets, les entreprises doivent également tenir compte des problèmes de sécurité des données et de l'impact des grands modèles sur la structure du marché d'origine.
Ces deux problèmes sont fréquemment apparus à l'ère de l'information et du numérique et ne peuvent être éradiqués. A l'ère de l'intelligence, ces problèmes peuvent apparaître de manière plus subtile.
"De nombreuses entreprises grand public ou basées sur des plateformes, si elles adoptent le grand modèle sans réserve, le grand modèle a une forte capacité à contrecarrer l'industrie, car cela signifie que l'industrie est facilement transférée de l'industrie. Le seuil d'entrée et la clé cognitive ", a déclaré Zhang Yitian.
Dans le contexte de la transformation numérique, la plupart des industries ont réalisé la transformation numérique et la mise à niveau grâce à des technologies telles que le big data et le cloud computing. Mais dans le même temps, les entreprises traditionnelles ont également transmis une grande quantité de données de l'industrie aux fabricants de technologie numérique.Les fournisseurs de technologie numérique sont devenus un acteur principal incontournable de l'industrie et la structure du marché d'origine a été modifiée.
Cependant, en raison de la faible quantité de données dans des secteurs tels que l'industrie et la construction, et de la difficulté de connecter les données entre les secteurs d'activité, les entreprises traditionnelles maintiennent encore d'importantes barrières à la concurrence.
Zhang Yitian a déclaré : « Actuellement, le secteur de la construction est le secteur le mieux protégé dans le cadre de la numérisation. Maintenant, l'informatisation du secteur de la construction, à l'exception d'un Glodon qui peut faire un budget, aucun géant ne peut intervenir. Pourquoi ? Parce que l'architecture a des dessins de conception, des dessins de construction, des dessins d'entretien, des dessins de planification, des dessins de classement et huit autres dessins, tous les dessins ne sont pas reliés les uns aux autres et les ministères ne se reconnaissent pas.Le coût d'ouverture de ces huit dessins du l'ensemble du bâtiment est suffisamment élevé, de sorte que l'industrie de la construction a maintenu la diversification de ce type de concurrence. Nous pensons généralement que la diversification de la concurrence est la source de vitalité et de puissance pour le développement industriel.
Par conséquent, sous la vague de modèles à grande échelle, pour les entreprises dont les normes de l'industrie et les avantages concurrentiels ne sont pas parfaits, adopter des modèles à grande échelle sans condition est une question que chaque entreprise doit examiner attentivement.
3. Il n'y a pas de réponse standard pour l'implémentation technique de grands modèles
Pour les entrants qui ont investi de l'argent réel sur le marché des grands modèles, la prochaine chose à faire est de résoudre le problème de mise en œuvre du projet réel.
À cet égard, l'industrie a progressivement formé un consensus sur le fait qu'à l'avenir, les grands modèles et les petits modèles se compléteront dans le processus de mise en œuvre industrielle.
Lin Yonghua a dit un jour que les scénarios de zone étroite qui nécessitent une grande précision et de faibles capacités de généralisation sont plus adaptés au paradigme "petit modèle + apprentissage par transfert". Tels que l'inspection industrielle, l'inspection de la qualité industrielle, l'analyse d'images médicales, etc.
En outre, Xuan Xiaohua, le fondateur de Huayuan Computing, a également déclaré que le modèle commercial des entreprises d'IA à l'avenir est d'intégrer le grand modèle général piloté par les big data et le petit modèle de données piloté par les connaissances pour les industries verticales afin d'atteindre deux- roue motrice.
Zhang Gaonan a également déclaré à "Jiazi Guangnian" : "Lorsque les entreprises optimisent leurs propres modèles ou forment des modèles verticaux, elles peuvent se combiner avec de grands modèles. Elles n'ont pas besoin de données de grande dimension comme les grands modèles, et elles n'ont pas besoin d'appliquer pleinement Cependant, la technologie des grands modèles peut être couplée à d'autres technologies pour former un modèle vertical industriel avec de faibles besoins en puissance de calcul, ce qui est éclairant, et il ne s'agit en aucun cas d'une simple application des grands modèles.
Par exemple, pour le problème "d'illusion" des grands modèles qui a été critiqué à plusieurs reprises, il peut être nécessaire de combiner la génération précédente de technologie d'IA pour le résoudre à court terme.
"Il existe de nombreuses raisons aux hallucinations, et cela peut être dû au fait que les données sont relativement rares et insuffisantes dans un certain domaine. Dans ce cas, nous devons fournir plus de données au modèle pour la formation. De plus, lorsque les utilisateurs posent des questions, fournissez clairement Plus les informations de base sont également un moyen de réduire les hallucinations ou de faire baisser la "température". Parfois, les hallucinations se produisent parce que les questions ne sont pas assez complètes, manquent de contexte et de prémisse. Par conséquent, la question est également très importante, et l'ingénierie est la clé. Dans De plus, si les utilisateurs veulent vraiment résoudre des problèmes précis à 100 %, ils peuvent toujours avoir besoin d'utiliser des graphes de connaissances. Les graphes de connaissances peuvent garantir l'exactitude du raisonnement logique, ainsi que des technologies plus récentes, notamment le "modèle mondial" proposé par Yann Lecun, le responsable de Meta AI », a déclaré Wu Xuening, CTO de Jinyou.com.
En plus de combiner avec la génération précédente de technologie d'IA, il est également important de combiner le processus de formation de grands modèles avec des données industrielles de haute qualité.
Par exemple, en tant que base de données hybride servant la plate-forme AI PaaS, Tianyun Data a traversé plus de dix ans et a maintenant atteint le stade de la combinaison avec de grands modèles.
Li Congwu, vice-président de Tianyun Data, a déclaré que la combinaison de lui-même et du grand modèle sera considérée sous deux aspects - premièrement, comment combiner les données du domaine privé avec le grand modèle. Par exemple, Tianyun Data a réalisé un projet similaire d'interprétation des politiques pour la China Securities Regulatory Commission En combinant diverses données telles que les réglementations, les précédents et les interprétations, Tianyun Data a généré des interprétations des violations, similaires au processus de sanctions judiciaires. les causes des infractions.
Deuxièmement, Tianyun Data a développé une base de données hybride et est l'une des premières entreprises en Chine. Dès 2018 environ, Tianyun Data a proposé le concept de base de données native AI, qui est en fait similaire à la base de données vectorielle qui prend en charge les grands modèles aujourd'hui.Tianyun Data a publié une base de données vectorielle auto-développée et l'a appliquée à ses propres modèles.
En général, il n'y a pas de réponse standard à l'implémentation technique de grands modèles.
Sur la voie de l'intelligence artificielle, la Chine ouvrira assurément une voie différente des autres pays. Il est difficile de distinguer les avantages et les inconvénients des deux voies, et elles reposent davantage sur des choix réalistes dans des conditions nationales différentes.
Li Kang, vice-président de Xianfeng, a un jour fait une analogie avec "Jiazi Guangnian" dans une interview, et cela semble toujours d'actualité aujourd'hui : "Il est injuste d'utiliser le succès d'OpenAI pour décrire les nombreux problèmes des entrepreneurs nationaux. est comme deux personnes jouant aux cartes. C'est différent, l'autre partie a soudainement joué une grosse main et a obtenu une quinte flush, vous dites simplement qu'il a bien joué, j'étais trop prudent, mais pourquoi ne l'avez-vous pas dit quand j'ai gagné ? »
Zhang Yitian a partagé que du point de vue du gouvernement central, les grands modèles, y compris les questions d'intelligence artificielle, sont un outil stratégique important pour gagner l'initiative dans la concurrence mondiale, et une stratégie importante pour promouvoir le développement par saute-mouton de la science et de la technologie de mon pays, le l'optimisation et la mise à niveau de l'industrialisation, et le bond global de la ressource de productivité.
"Lorsque le rapport du 20e Congrès national du Parti communiste chinois parlait de questions industrielles, il proposait l'intelligence artificielle séparément de la nouvelle génération de technologies de l'information. Par conséquent, d'un point de vue politique, le développement de l'intelligence artificielle et des grands- les modèles réduits n'est pas seulement une question technique et une question industrielle, mais aussi le cœur de la concurrence d'une économie nationale. La question du pouvoir, d'un point de vue plus profond, est un problème politique, et chacun devrait comprendre cette question d'un point de vue plus élevé.
Si nous sortons de Chine et prolongeons la chronologie du développement technologique, le tumulte causé par ChatGPT pourrait n'être qu'un point dans l'histoire du développement de la technologie de l'intelligence artificielle, et tous les jugements pourraient être prématurés.
Après tout, même les techniciens qui ont longtemps été immergés en première ligne de la recherche sur l'intelligence artificielle ne sont pas encore parvenus à un consensus sur l'avenir de l'intelligence artificielle et sont profondément anxieux.
Dans le livre récemment populaire "Why Greatness Can't Be Planned", les auteurs Kenneth Stanley et Joel Lehman écrivent : "Nous devons faire face au fait inconfortable que nous ne pouvons pas déterminer si des règles empiriques peuvent être des guides fiables dans la poursuite des objectifs de l'IA. ."
Lors de la Conférence Zhiyuan de Pékin en 2023 qui s'est terminée il n'y a pas longtemps, Huang Tiejun, directeur de l'Institut de recherche de Zhiyuan, avait également une anxiété très similaire. Il a directement utilisé les quatre mots "incapable de fermer" comme titre du discours de la cérémonie de clôture. Il a déclaré: "Nous sommes dans un état incertain. Est-ce que ce Near AGI est plus fort que nous? Est-il plus intelligent que nous? Ou quand nous dépassera-t-il? Je ne sais pas. Nous sommes complètement dans un état d'être hors de contrôle."
A la fin du discours de clôture, il concluait par cette phrase : « Si on peut affronter les risques avec le même enthousiasme que d'investir dans les grands modèles, au moins il est possible d'appréhender l'avenir. Mais, croyez-vous que l'humain puisse faire ça? Je ne sais pas.
En regardant toutes les technologies et industries, ce "sentiment de perte de contrôle" des techniciens de base de première ligne n'est pas courant dans d'autres domaines. Maintenant, presque tout le monde traverse la rivière en tâtant les pierres. Chaque entreprise entrant sur le marché aujourd'hui a le potentiel de devenir un pionnier dans la terre vierge technologique.
Et le temps est la meilleure preuve pour tout prouver.