Après plus de 200 jours d'entrepreneuriat à grande échelle, la mentalité des explorateurs chinois est passée de l'excitation idéale à la réalité.
Avant cela, en plus de l'entreprise elle-même, l'esprit d'entreprise du modèle d'IA était doté de plus de significations telles que le sentiment national et la tendance de l'époque.Face à l'émergence du modèle polyvalent ChatGPT, les entrepreneurs chinois sont rapidement parvenus à un consensus sur la manière de construire une version chinoise d'OpenAI et de ChatGPT.
Il ne fait aucun doute que ChatGPT est le meilleur joueur au monde cette année. Grâce à cela, le trafic du site Web OpenAI a dépassé 1,8 milliard en avril, se classant parmi les 20 premiers du classement mondial du trafic. Cependant, selon les données publiées par la société d'analyse Web Similarweb, après six mois de croissance rapide, les visites de ChatGPT ont connu une croissance négative pour la première fois, et les visites en juin ont chuté de 9,7 % par rapport au mois précédent.
La chute soudaine du trafic ChatGPT a suscité des inquiétudes et des discussions au sein de la communauté technologique mondiale sur le risque d'une bulle dans l'industrie de l'IA. Le magazine The Economist a même conclu que "la route vers une IA plus grande et meilleure n'est plus faisable". L'idée de devenir une "version chinoise de ChatGPT" s'éloigne également du cercle entrepreneurial chinois.
Zhu Xiaohu, associé fondateur de GSR, a écrit dans Moments : "Ne soyez pas superstitieux à propos du modèle général, car l'année prochaine, GPT-3.5 deviendra une marchandise (infrastructure générale), et trois ans plus tard, GPT-4 le sera également. Pour la plupart des entrepreneurs, la scène est la priorité, et les données sont reines !"
En même temps que la mentalité des praticiens a changé, le marché entrepreneurial à grande échelle a commencé à se diviser.
Les entreprises chinoises de modélisation à grande échelle ne sont plus obsédées par l'objectif idéalisé de "devenir l'OpenAI de la Chine", ni par la recherche de modèles paramétriques et de puissance de calcul. Elles ont des réponses plus pragmatiques et accordent plus d'attention à la résolution de problèmes dans des scénarios industriels réels.
La concurrence des grands modèles d'IA a inauguré un nouveau nœud de piste.
Pragmatisme collectif
Au début de cette année, Liang Jianzhang, fondateur et président du conseil d'administration de Ctrip, a commencé à contacter ChatGPT. Ces dernières années, il a été actif dans les milieux universitaires et commerciaux en tant que démographe, mais il a également été le premier et le plus jeune programmeur en Chine et est presque devenu un doctorat en intelligence artificielle.
À l'âge de 13 ans, Liang Jianzhang a conçu un programme d'écriture de poèmes métriques et a remporté un prix national. À l'âge de 15 ans, il a été admis dans la classe junior de l'Université de Fudan. Après avoir obtenu son diplôme, il est allé aux États-Unis pour étudier et a obtenu une maîtrise en informatique du Georgia Institute of Technology à l'âge de 21 ans. À l'âge de 22 ans, Liang Jianzhang, qui étudiait pour un doctorat, a soudainement réalisé les limites des connaissances théoriques et a choisi d'abandonner son doctorat pour rejoindre Oracle aux États-Unis.
L'émergence de ChatGPT a rendu Liang Jianzhang heureux de ne pas avoir poursuivi ses études de doctorat en intelligence artificielle, car "Tous ces algorithmes de traitement du langage naturel ont été complètement vaincus par lui (ChatGPT)". Il a rappelé que lorsqu'il est entré en contact avec ChatGPT pour la première fois, il était "très, très choqué", et le deuxième sentiment était l'humilité, "L'algorithme le plus intelligent que nous ayons finalement créé était si proche de la structure biologique du cerveau humain."
Liang Jianzhang a commencé à réfléchir à la combinaison du grand modèle d'IA et de l'activité Ctrip.
Selon Liang Jianzhang, dans le contexte d'une société intelligente, le tourisme, en tant qu'« industrie de la demande spirituelle difficile à automatiser », sa demande augmentera avec l'amélioration de la richesse sociale globale, et sa part dans l'économie augmentera également. Il a verrouillé ses yeux sur le modèle vertical de l'industrie du tourisme.
Au cours des six derniers mois, des membres des différentes entreprises de Ctrip ont formé l'équipe technique de modèles à grande échelle de Ctrip. Au stade initial du développement d'un grand modèle, Ctrip a ajusté sa structure organisationnelle en fonction des exigences stratégiques du grand modèle et a formé différents départements, notamment l'équipe technique générale, l'équipe de stratégie de contenu, l'équipe de liste, etc., et a adapté l'équipe technique en fonction de la mise à niveau et de l'itération continues des produits de grands modèles.
Liang Jianzhang a déclaré que Ctrip n'épargnera aucun effort pour investir dans le grand modèle : "Nous devrions investir très fermement à long terme s'il est précieux pour nos clients ou nos commerçants. Ce (grand modèle) est très nouveau, et l'équipe technique optimise constamment le montant de son investissement, mais nous n'avons aucune limite."
À la mi-juillet, Ctrip a officiellement publié un grand modèle vertical de l'industrie du tourisme. Asked a examiné 20 milliards de données touristiques non structurées, combinées aux données structurées en temps réel existantes de Ctrip, ainsi qu'aux robots et algorithmes de recherche historiquement formés de Ctrip, et a mené une formation sur le modèle vertical auto-développé. "En même temps, nous avons investi beaucoup de main-d'œuvre dans la génération et la vérification du contenu général des réponses de voyage", a souligné Liang Jianzhang.
Avant la publication de la question, Ctrip avait effectué un test interne, et le personnel du service client Wang Yun a visiblement estimé que son travail avait subi de grands changements. Dans le passé, elle devait répondre à plus de 150 appels par jour pour répondre aux questions des clients sur les annulations de commandes après-vente et les bagages perdus ; maintenant, Wang Yun s'est transformée en recommandant le service client avant le voyage et entre dans la salle de diffusion en direct depuis les coulisses pour fournir aux internautes des services et des suggestions qui doivent être préparés avant le voyage.
Selon Liang Jianzhang, sur la base d'un modèle à grande échelle à usage général, résoudre le problème de la précision dans l'industrie du tourisme reste la clé : "Le voyage est une industrie à forte consommation. Même si la planification permet de gagner une demi-heure, il peut y avoir 5 % de chances que le résultat de l'hôtel ou de l'itinéraire recommandé soit erroné."
Bien qu'il ne soit pas aussi bon que le grand modèle général en termes de paramètres, il n'a pas non plus les exigences strictes en matière de puissance de calcul et d'autres conditions du grand modèle général, mais le grand modèle vertical met en avant des exigences plus élevées pour les données et les scénarios.
Le plus grand défi dans la formation de modèles à grande échelle d'Ask est que dans la scène réelle, dans le processus d'obtention d'informations de voyage par les utilisateurs, plusieurs cycles de collecte et de nettoyage de données interactives, le volume et l'exactitude des données doivent être constamment corrigés, en particulier l'industrie du tourisme a subi d'énormes changements, et les informations de destination il y a trois ans peuvent être complètement obsolètes maintenant, en particulier l'impact de l'épidémie sur l'industrie mondiale du tourisme a exacerbé l'actualité des données.
A l'instar de Ctrip, de plus en plus d'entreprises placent la piste de grands modèles dans le champ vertical.
La feuille de réponses du modèle à grande échelle Yanxi remise par JD.com considère également le modèle industriel à grande échelle comme une caractéristique importante. Selon Xu Ran, le nouveau PDG de Jingdong Group, le développement de la technologie de l'intelligence artificielle dans le passé a été à plusieurs reprises au bord de l'explosion des applications, mais cela a souvent été de courte durée à la fin, et l'une des raisons importantes est que la technologie n'a pas formé une application solide dans l'industrie**.
Lors de la conférence de presse de Huawei Pangu Large Model 3.0 le 7 juillet, Zhang Pingan, PDG de Huawei Cloud, a même déclaré sans ambages : « Pangu Large Model n'a pas le temps d'écrire des poèmes et de discuter. Peu importe le nombre de paramètres et la qualité de la capacité de dialogue, s'il ne peut pas résoudre les problèmes pratiques, il ne sera pas d'une grande utilité.
Tencent n'a pas encore annoncé les progrès du modèle général à grande échelle Hunyuan, mais il a annoncé l'itinéraire du modèle à grande échelle de l'industrie de manière très médiatisée, en lançant plus de 50 solutions pour 10 grandes industries en une seule fois. Li Qiang, vice-président de Tencent et président des activités gouvernementales et d'entreprise de Tencent, a également déclaré : « Les grands modèles généraux ne sont pas la seule direction pour l'application des modèles, et les modèles pour les industries verticales deviendront le point de basculement de la valeur des grands modèles.
Changement d'état d'esprit
Un nœud évident dans le changement de mentalité des grands entrepreneurs a commencé lorsque Wang Huiwen a reçu un diagnostic de dépression et a été acquis par Meituan à des années-lumière de sa fondation. Tout le monde s'est soudain rendu compte que même l'entreprise vedette que tout le monde attendait et qui nourrissait de grands espoirs pourrait devoir arrêter de travailler à cause de divers accidents.
Il y a à peine six mois, les autres points de vente semblaient se dissiper du jour au lendemain, et seul le grand modèle était en position C. Les entrepreneurs et les investisseurs des cercles technologiques chinois se sont envolés pour la Silicon Valley pour apprendre d'OpenAI. Zhang Yiming, Ma Huateng et Wang Xing, les figures centrales n° 1 ou décisionnelles de ces géants, sont revenus du jour au lendemain à l'état d'excitation et de curiosité lorsqu'ils ont démarré leur entreprise, lisant des journaux et échangeant des technologies tard dans la nuit.
À cette époque, il semblait que chaque explorateur de modèles chinois à grande échelle pensait aux problèmes liés aux sentiments de la famille et du pays. Face à l'itération rapide de ChatGPT, les objectifs fixés par les entrepreneurs chinois sont de savoir comment réaliser des dépassements en combien de temps.
Li Yanhong a déclaré : " Baidu Wenxinyiyan était au stade de la recherche et du développement, et l'équipe technique de Baidu a effectué un test comparatif avec ChatGPT. À cette époque, l'écart était de 40 points et il pourrait se rattraper en un mois. " Wang Xiaochuan a également déclaré qu'il créera le meilleur grand modèle linguistique en Chine d'ici la fin de l'année.
Zhou Hongyi, le fondateur de 360, a déclaré dans une interview à "Chinese Entrepreneur" que les grands modèles ne sont plus la dimension de la concurrence commerciale. Si la fermeture de l'Internet chinois et le problème de l'îlot de données entre les applications causé par l'Internet mobile ne sont pas résolus, cela conduira probablement aux limites de la formation des moteurs d'intelligence artificielle, ce qui pourrait conduire à un nouveau cycle de révolution de l'IA entre la Chine et les États-Unis. Fossé intergénérationnel.
Quant à savoir pourquoi aucune entreprise comme OpenAI n'est née en Chine, les entrepreneurs chinois ont même commencé à réfléchir à cette époque : dans le passé, l'exploration de l'intelligence artificielle nationale était trop pragmatique, et tout était orienté KPI, de sorte que tout le monde n'avait pas la détermination et la patience d'y investir, alors ils ont raté un nœud si important.
Avec passion, après que Baidu Wenxin a tiré le premier coup, plus de 80 grands modèles d'IA ont émergé en six mois, et plus de 30 grands modèles sont apparus lors de la seule Conférence mondiale sur l'intelligence artificielle tenue à Shanghai en 2023. Il n'est pas exagéré de décrire la popularité des grands modèles comme une "guerre des cent modèles".
Mais a-t-on vraiment besoin d'autant de gros modèles ? De quel type de grand modèle avons-nous besoin ?
En fait, Robin Li a proposé très tôt : "Cela n'a pas beaucoup de sens pour les startups de recréer ChatGPT. Je pense qu'il existe une excellente opportunité de développer des applications basées sur ce grand modèle de langage. Il n'est pas nécessaire de réinventer la roue. Une fois la roue disponible, la valeur de la fabrication de voitures et d'avions peut être supérieure à celle de la roue."
He Xiaodong, vice-président de la technologie chez JD Group, a également réalisé dès le début : « Si le grand modèle doit avoir de la valeur, il doit être placé dans l'industrie, et il est préférable d'être dans un domaine à haute valeur industrielle. Ce n'est qu'ainsi qu'il peut vraiment devenir une chose durable à long terme, sinon il peut devenir une chose de courte durée.
NOUVELLE VARIABLE
Juste au moment où les entrepreneurs nationaux avaient du mal à explorer le modèle de l'IA, le grand mouvement de Zuckerberg a apporté de nouvelles variables à ce domaine en constante évolution.
Aux premières heures du 19 juillet, heure de Pékin, Meta a publié le grand modèle open source Llama 2, qui a une fois de plus fait exploser le cercle de l'IA : Llama 2 a non seulement les mêmes performances que GPT-3, mais est également gratuit, open source et disponible dans le commerce. Llama 2 est la suite du modèle Llama publié par Meta plus tôt en mars.
Lors de la conférence des partenaires Microsoft Inspire qui a suivi, le PDG de Microsoft, Satya Nadella, a annoncé la nouvelle de la coopération entre Meta et Microsoft.Cette coopération permet à Llama 2 de fonctionner sur le service cloud de Microsoft, Microsoft Azure. Dans le même temps, le cloud Amazon AWS a également rejoint la coopération avec Meta.
L'importance de Llama 2 pour les entrepreneurs de modèles à grande échelle est que, tout comme le système Android l'est pour le développement d'APP, les développeurs n'ont pas besoin de réinventer la roue et d'obtenir directement l'infrastructure de modèles à grande échelle au moindre coût, afin qu'ils puissent se concentrer davantage sur leurs propres scénarios industriels.
Dans une certaine mesure, cela signifie également que pour la plupart des entrepreneurs, choisir de se concentrer sur les applications verticales de l'industrie s'est avéré être une voie plus pratique.
Cependant, à la différence des grands modèles généraux, **Les grands modèles industriels proposent également des seuils et des exigences différents pour les participants de l'industrie :**D'une part, les grands modèles industriels exigent que les développeurs aient une certaine accumulation et force techniques ; d'autre part, les grands modèles industriels exigent également que les opérateurs aient des scénarios de pratique d'application industrielle riches.
Liang Jianzhang a déclaré à "Chinese Entrepreneur": "L'indicateur le plus important d'un grand modèle général peut être le nombre de paramètres ou le nombre de GPU utilisés, etc., mais le grand modèle vertical et le grand modèle de langage n'en sont qu'une partie. Il a également une combinaison avec d'autres données, y compris la vérification manuelle, etc. Celles-ci sont plus importantes. En fin de compte, cela indique s'il est possible de tester dans quelle mesure l'efficacité, la précision et la fiabilité de ces questions et réponses des clients peuvent être améliorées. "
"Le plus gros problème dans le tourisme est la fiabilité. C'est en effet plus compliqué que d'écrire des poèmes, des articles et des romans avec l'IA. C'est aussi un travail de longue haleine. Tout ce qui peut améliorer cela à 80 %, 90 %, 95 % ou même 99 % vaut la peine d'être fait", a finalement déclaré Liang Jianzhang.
Voir l'original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
modèle, cool
Après plus de 200 jours d'entrepreneuriat à grande échelle, la mentalité des explorateurs chinois est passée de l'excitation idéale à la réalité.
Avant cela, en plus de l'entreprise elle-même, l'esprit d'entreprise du modèle d'IA était doté de plus de significations telles que le sentiment national et la tendance de l'époque.Face à l'émergence du modèle polyvalent ChatGPT, les entrepreneurs chinois sont rapidement parvenus à un consensus sur la manière de construire une version chinoise d'OpenAI et de ChatGPT.
Il ne fait aucun doute que ChatGPT est le meilleur joueur au monde cette année. Grâce à cela, le trafic du site Web OpenAI a dépassé 1,8 milliard en avril, se classant parmi les 20 premiers du classement mondial du trafic. Cependant, selon les données publiées par la société d'analyse Web Similarweb, après six mois de croissance rapide, les visites de ChatGPT ont connu une croissance négative pour la première fois, et les visites en juin ont chuté de 9,7 % par rapport au mois précédent.
La chute soudaine du trafic ChatGPT a suscité des inquiétudes et des discussions au sein de la communauté technologique mondiale sur le risque d'une bulle dans l'industrie de l'IA. Le magazine The Economist a même conclu que "la route vers une IA plus grande et meilleure n'est plus faisable". L'idée de devenir une "version chinoise de ChatGPT" s'éloigne également du cercle entrepreneurial chinois.
Zhu Xiaohu, associé fondateur de GSR, a écrit dans Moments : "Ne soyez pas superstitieux à propos du modèle général, car l'année prochaine, GPT-3.5 deviendra une marchandise (infrastructure générale), et trois ans plus tard, GPT-4 le sera également. Pour la plupart des entrepreneurs, la scène est la priorité, et les données sont reines !"
En même temps que la mentalité des praticiens a changé, le marché entrepreneurial à grande échelle a commencé à se diviser.
Les entreprises chinoises de modélisation à grande échelle ne sont plus obsédées par l'objectif idéalisé de "devenir l'OpenAI de la Chine", ni par la recherche de modèles paramétriques et de puissance de calcul. Elles ont des réponses plus pragmatiques et accordent plus d'attention à la résolution de problèmes dans des scénarios industriels réels.
La concurrence des grands modèles d'IA a inauguré un nouveau nœud de piste.
Pragmatisme collectif
Au début de cette année, Liang Jianzhang, fondateur et président du conseil d'administration de Ctrip, a commencé à contacter ChatGPT. Ces dernières années, il a été actif dans les milieux universitaires et commerciaux en tant que démographe, mais il a également été le premier et le plus jeune programmeur en Chine et est presque devenu un doctorat en intelligence artificielle.
À l'âge de 13 ans, Liang Jianzhang a conçu un programme d'écriture de poèmes métriques et a remporté un prix national. À l'âge de 15 ans, il a été admis dans la classe junior de l'Université de Fudan. Après avoir obtenu son diplôme, il est allé aux États-Unis pour étudier et a obtenu une maîtrise en informatique du Georgia Institute of Technology à l'âge de 21 ans. À l'âge de 22 ans, Liang Jianzhang, qui étudiait pour un doctorat, a soudainement réalisé les limites des connaissances théoriques et a choisi d'abandonner son doctorat pour rejoindre Oracle aux États-Unis.
L'émergence de ChatGPT a rendu Liang Jianzhang heureux de ne pas avoir poursuivi ses études de doctorat en intelligence artificielle, car "Tous ces algorithmes de traitement du langage naturel ont été complètement vaincus par lui (ChatGPT)". Il a rappelé que lorsqu'il est entré en contact avec ChatGPT pour la première fois, il était "très, très choqué", et le deuxième sentiment était l'humilité, "L'algorithme le plus intelligent que nous ayons finalement créé était si proche de la structure biologique du cerveau humain."
Liang Jianzhang a commencé à réfléchir à la combinaison du grand modèle d'IA et de l'activité Ctrip.
Selon Liang Jianzhang, dans le contexte d'une société intelligente, le tourisme, en tant qu'« industrie de la demande spirituelle difficile à automatiser », sa demande augmentera avec l'amélioration de la richesse sociale globale, et sa part dans l'économie augmentera également. Il a verrouillé ses yeux sur le modèle vertical de l'industrie du tourisme.
Au cours des six derniers mois, des membres des différentes entreprises de Ctrip ont formé l'équipe technique de modèles à grande échelle de Ctrip. Au stade initial du développement d'un grand modèle, Ctrip a ajusté sa structure organisationnelle en fonction des exigences stratégiques du grand modèle et a formé différents départements, notamment l'équipe technique générale, l'équipe de stratégie de contenu, l'équipe de liste, etc., et a adapté l'équipe technique en fonction de la mise à niveau et de l'itération continues des produits de grands modèles.
Liang Jianzhang a déclaré que Ctrip n'épargnera aucun effort pour investir dans le grand modèle : "Nous devrions investir très fermement à long terme s'il est précieux pour nos clients ou nos commerçants. Ce (grand modèle) est très nouveau, et l'équipe technique optimise constamment le montant de son investissement, mais nous n'avons aucune limite."
À la mi-juillet, Ctrip a officiellement publié un grand modèle vertical de l'industrie du tourisme. Asked a examiné 20 milliards de données touristiques non structurées, combinées aux données structurées en temps réel existantes de Ctrip, ainsi qu'aux robots et algorithmes de recherche historiquement formés de Ctrip, et a mené une formation sur le modèle vertical auto-développé. "En même temps, nous avons investi beaucoup de main-d'œuvre dans la génération et la vérification du contenu général des réponses de voyage", a souligné Liang Jianzhang.
Avant la publication de la question, Ctrip avait effectué un test interne, et le personnel du service client Wang Yun a visiblement estimé que son travail avait subi de grands changements. Dans le passé, elle devait répondre à plus de 150 appels par jour pour répondre aux questions des clients sur les annulations de commandes après-vente et les bagages perdus ; maintenant, Wang Yun s'est transformée en recommandant le service client avant le voyage et entre dans la salle de diffusion en direct depuis les coulisses pour fournir aux internautes des services et des suggestions qui doivent être préparés avant le voyage.
Selon Liang Jianzhang, sur la base d'un modèle à grande échelle à usage général, résoudre le problème de la précision dans l'industrie du tourisme reste la clé : "Le voyage est une industrie à forte consommation. Même si la planification permet de gagner une demi-heure, il peut y avoir 5 % de chances que le résultat de l'hôtel ou de l'itinéraire recommandé soit erroné."
Bien qu'il ne soit pas aussi bon que le grand modèle général en termes de paramètres, il n'a pas non plus les exigences strictes en matière de puissance de calcul et d'autres conditions du grand modèle général, mais le grand modèle vertical met en avant des exigences plus élevées pour les données et les scénarios.
Le plus grand défi dans la formation de modèles à grande échelle d'Ask est que dans la scène réelle, dans le processus d'obtention d'informations de voyage par les utilisateurs, plusieurs cycles de collecte et de nettoyage de données interactives, le volume et l'exactitude des données doivent être constamment corrigés, en particulier l'industrie du tourisme a subi d'énormes changements, et les informations de destination il y a trois ans peuvent être complètement obsolètes maintenant, en particulier l'impact de l'épidémie sur l'industrie mondiale du tourisme a exacerbé l'actualité des données.
A l'instar de Ctrip, de plus en plus d'entreprises placent la piste de grands modèles dans le champ vertical.
La feuille de réponses du modèle à grande échelle Yanxi remise par JD.com considère également le modèle industriel à grande échelle comme une caractéristique importante. Selon Xu Ran, le nouveau PDG de Jingdong Group, le développement de la technologie de l'intelligence artificielle dans le passé a été à plusieurs reprises au bord de l'explosion des applications, mais cela a souvent été de courte durée à la fin, et l'une des raisons importantes est que la technologie n'a pas formé une application solide dans l'industrie**.
Lors de la conférence de presse de Huawei Pangu Large Model 3.0 le 7 juillet, Zhang Pingan, PDG de Huawei Cloud, a même déclaré sans ambages : « Pangu Large Model n'a pas le temps d'écrire des poèmes et de discuter. Peu importe le nombre de paramètres et la qualité de la capacité de dialogue, s'il ne peut pas résoudre les problèmes pratiques, il ne sera pas d'une grande utilité.
Tencent n'a pas encore annoncé les progrès du modèle général à grande échelle Hunyuan, mais il a annoncé l'itinéraire du modèle à grande échelle de l'industrie de manière très médiatisée, en lançant plus de 50 solutions pour 10 grandes industries en une seule fois. Li Qiang, vice-président de Tencent et président des activités gouvernementales et d'entreprise de Tencent, a également déclaré : « Les grands modèles généraux ne sont pas la seule direction pour l'application des modèles, et les modèles pour les industries verticales deviendront le point de basculement de la valeur des grands modèles.
Changement d'état d'esprit
Un nœud évident dans le changement de mentalité des grands entrepreneurs a commencé lorsque Wang Huiwen a reçu un diagnostic de dépression et a été acquis par Meituan à des années-lumière de sa fondation. Tout le monde s'est soudain rendu compte que même l'entreprise vedette que tout le monde attendait et qui nourrissait de grands espoirs pourrait devoir arrêter de travailler à cause de divers accidents.
Il y a à peine six mois, les autres points de vente semblaient se dissiper du jour au lendemain, et seul le grand modèle était en position C. Les entrepreneurs et les investisseurs des cercles technologiques chinois se sont envolés pour la Silicon Valley pour apprendre d'OpenAI. Zhang Yiming, Ma Huateng et Wang Xing, les figures centrales n° 1 ou décisionnelles de ces géants, sont revenus du jour au lendemain à l'état d'excitation et de curiosité lorsqu'ils ont démarré leur entreprise, lisant des journaux et échangeant des technologies tard dans la nuit.
À cette époque, il semblait que chaque explorateur de modèles chinois à grande échelle pensait aux problèmes liés aux sentiments de la famille et du pays. Face à l'itération rapide de ChatGPT, les objectifs fixés par les entrepreneurs chinois sont de savoir comment réaliser des dépassements en combien de temps.
Li Yanhong a déclaré : " Baidu Wenxinyiyan était au stade de la recherche et du développement, et l'équipe technique de Baidu a effectué un test comparatif avec ChatGPT. À cette époque, l'écart était de 40 points et il pourrait se rattraper en un mois. " Wang Xiaochuan a également déclaré qu'il créera le meilleur grand modèle linguistique en Chine d'ici la fin de l'année.
Zhou Hongyi, le fondateur de 360, a déclaré dans une interview à "Chinese Entrepreneur" que les grands modèles ne sont plus la dimension de la concurrence commerciale. Si la fermeture de l'Internet chinois et le problème de l'îlot de données entre les applications causé par l'Internet mobile ne sont pas résolus, cela conduira probablement aux limites de la formation des moteurs d'intelligence artificielle, ce qui pourrait conduire à un nouveau cycle de révolution de l'IA entre la Chine et les États-Unis. Fossé intergénérationnel.
Quant à savoir pourquoi aucune entreprise comme OpenAI n'est née en Chine, les entrepreneurs chinois ont même commencé à réfléchir à cette époque : dans le passé, l'exploration de l'intelligence artificielle nationale était trop pragmatique, et tout était orienté KPI, de sorte que tout le monde n'avait pas la détermination et la patience d'y investir, alors ils ont raté un nœud si important.
Avec passion, après que Baidu Wenxin a tiré le premier coup, plus de 80 grands modèles d'IA ont émergé en six mois, et plus de 30 grands modèles sont apparus lors de la seule Conférence mondiale sur l'intelligence artificielle tenue à Shanghai en 2023. Il n'est pas exagéré de décrire la popularité des grands modèles comme une "guerre des cent modèles".
Mais a-t-on vraiment besoin d'autant de gros modèles ? De quel type de grand modèle avons-nous besoin ?
En fait, Robin Li a proposé très tôt : "Cela n'a pas beaucoup de sens pour les startups de recréer ChatGPT. Je pense qu'il existe une excellente opportunité de développer des applications basées sur ce grand modèle de langage. Il n'est pas nécessaire de réinventer la roue. Une fois la roue disponible, la valeur de la fabrication de voitures et d'avions peut être supérieure à celle de la roue."
He Xiaodong, vice-président de la technologie chez JD Group, a également réalisé dès le début : « Si le grand modèle doit avoir de la valeur, il doit être placé dans l'industrie, et il est préférable d'être dans un domaine à haute valeur industrielle. Ce n'est qu'ainsi qu'il peut vraiment devenir une chose durable à long terme, sinon il peut devenir une chose de courte durée.
NOUVELLE VARIABLE
Juste au moment où les entrepreneurs nationaux avaient du mal à explorer le modèle de l'IA, le grand mouvement de Zuckerberg a apporté de nouvelles variables à ce domaine en constante évolution.
Aux premières heures du 19 juillet, heure de Pékin, Meta a publié le grand modèle open source Llama 2, qui a une fois de plus fait exploser le cercle de l'IA : Llama 2 a non seulement les mêmes performances que GPT-3, mais est également gratuit, open source et disponible dans le commerce. Llama 2 est la suite du modèle Llama publié par Meta plus tôt en mars.
Lors de la conférence des partenaires Microsoft Inspire qui a suivi, le PDG de Microsoft, Satya Nadella, a annoncé la nouvelle de la coopération entre Meta et Microsoft.Cette coopération permet à Llama 2 de fonctionner sur le service cloud de Microsoft, Microsoft Azure. Dans le même temps, le cloud Amazon AWS a également rejoint la coopération avec Meta.
L'importance de Llama 2 pour les entrepreneurs de modèles à grande échelle est que, tout comme le système Android l'est pour le développement d'APP, les développeurs n'ont pas besoin de réinventer la roue et d'obtenir directement l'infrastructure de modèles à grande échelle au moindre coût, afin qu'ils puissent se concentrer davantage sur leurs propres scénarios industriels.
Dans une certaine mesure, cela signifie également que pour la plupart des entrepreneurs, choisir de se concentrer sur les applications verticales de l'industrie s'est avéré être une voie plus pratique.
Cependant, à la différence des grands modèles généraux, **Les grands modèles industriels proposent également des seuils et des exigences différents pour les participants de l'industrie :**D'une part, les grands modèles industriels exigent que les développeurs aient une certaine accumulation et force techniques ; d'autre part, les grands modèles industriels exigent également que les opérateurs aient des scénarios de pratique d'application industrielle riches.
Liang Jianzhang a déclaré à "Chinese Entrepreneur": "L'indicateur le plus important d'un grand modèle général peut être le nombre de paramètres ou le nombre de GPU utilisés, etc., mais le grand modèle vertical et le grand modèle de langage n'en sont qu'une partie. Il a également une combinaison avec d'autres données, y compris la vérification manuelle, etc. Celles-ci sont plus importantes. En fin de compte, cela indique s'il est possible de tester dans quelle mesure l'efficacité, la précision et la fiabilité de ces questions et réponses des clients peuvent être améliorées. "
"Le plus gros problème dans le tourisme est la fiabilité. C'est en effet plus compliqué que d'écrire des poèmes, des articles et des romans avec l'IA. C'est aussi un travail de longue haleine. Tout ce qui peut améliorer cela à 80 %, 90 %, 95 % ou même 99 % vaut la peine d'être fait", a finalement déclaré Liang Jianzhang.