C'est trop bouclé ! 36 Notes et vérité sur les grands modèles et l'AIGC

Source de l'image : générée par Unbounded AI

Source : je cheval noir

Dans l’après-midi du 12 septembre, le siège pékinois de la startup Dark Horse a inauguré une vague de « nouvelles forces de l’IA ».

Huawei Cloud, APUS, Tors, SenseTime, Kuaishou, 360 Group, Qingbo Intelligence, Dark Horse Tianqi, MiniMax, Sinovation Ventures, Qiji Chuangtan, China Academy of Information and Communications Technology... Il existe des sociétés cotées, des sociétés leaders et des animaux licornes des entreprises, ainsi que des institutions d’investissement et des instituts de recherche scientifique de premier plan dans le domaine de l’IA.

Les invités présents à la réunion sont allés directement au sujet——

" Le statut actuel des grands modèles dans l'industrie ? Comment les entreprises peuvent-elles mieux commercialiser ? Quelles sont les nouvelles tendances et opportunités auxquelles il convient de prêter attention ? "

J'ai l'honneur de participer à cette réunion à huis clos sur l'IA. Je partagerai avec vous 38 notes et vérités.

**01. De combien de volumes dispose l'industrie ? **

Selon les dernières statistiques, plus de 130 grands modèles ont été lancés en Chine et plus de 70 modèles d'algorithmes ont été enregistrés auprès de l'Administration chinoise du cyberespace. Les géants de l'Internet tels que BAT ont tous lancé de grands modèles d'IA. Rien qu'en 2023, plus de 60 startups ont reçu un financement et les produits regorgent de couches de base, de couches de modèles et de couches d'application. La nouvelle génération d’IA générative devra peut-être revenir sur les pièges de la génération précédente d’IA et éviter la complaisance de l’industrie pour éviter la réincarnation de l’hiver précédent. Les praticiens dans ce domaine doivent clairement voir l'évolution de l'industrie et les problèmes des clients, et ne pas se laisser berner par la soupe au poulet des grands.

  1. Maintenant, un client vient nous voir et nous dit qu'il y a 20 scènes et que chaque scène coûte X millions de yuans ? Ensuite, j'ai fait du porte-à-porte pour demander des prix : Huawei le ferait-il ? Alibaba le fera-t-il ? Baidu le fera-t-il ? Si vous continuez ainsi, vous ne gagnerez finalement pas d’argent.

  2. 80 à 90 % de l'argent collecté par chacun est utilisé pour la puissance de calcul. C'est la situation actuelle. Vous savez, ce n'est plus que de la formation maintenant. Le coût de la formation est contrôlable, mais le coût de l'inférence est incontrôlable.

  3. Nous disposons de 30 000 GPU et d'une puissance de calcul de 6 000p. Nous nous efforcerons d'avoir une puissance de calcul supérieure à 12 000p d'ici la fin de l'année. En termes de données, 2 000 milliards de jetons sont nettoyés et annotés chaque mois, et il y en aura 10 000 milliards d’ici la fin de l’année.

  4. À l’heure actuelle, l’industrie manque encore de certaines applications révolutionnaires, ce qui rend difficile la commercialisation.

  5. Comment trouver un équilibre entre coût et effet ?C'est un point difficile. Ils utilisent tous de grands modèles et le coût est trop élevé.

  6. Au bout d’un certain temps, ce pour quoi tout le monde sera en compétition, c’est la capacité d’optimiser les infrastructures. Par exemple, en termes de capacités d'optimisation du réseau, si vous continuez lorsque d'autres échouent, vous pourrez vous entraîner plus de fois que les autres.

  7. Dans le cas d’une puissance de calcul limitée, nous faisons quelques tentatives techniques tournées vers l’avenir. Vous ne pensiez peut-être pas que dans notre grande entreprise de modélisme, il y a plus d'étudiants qui font des infrastructures que du modélisme. Leurs prix sont généralement assez chers et difficiles à recruter.

  8. Les grands modèles se trouvent désormais dans une situation embarrassante : ils ne peuvent pas se vendre à un prix élevé. En fin de compte, seuls ceux qui vendent des nuages, des cartes et de la puissance de calcul gagnent de l'argent.

  9. Au début, je pensais que le modèle était très précieux, mais maintenant il est à nouveau tombé dans l'involution. J'ai rencontré un client il y a quelque temps, et BAT et d'autres l'ont cité. Le devis initial était assez cher, plus de 10 millions. Est-ce que quelqu'un sait quel était le prix unitaire final ? Trop bouclé.

  10. Les grands modèles comportant des dizaines de milliards de paramètres sont considérés comme gratuits par certains clients particuliers.

02, Voix de première ligne

Les entreprises dans le domaine de l'intelligence artificielle devraient toujours se rappeler ce que le président Mao a dit : « passer de pratique en pratique ». Ce n'est qu'en enlevant votre robe et votre veste mandarin et en marchant vers les champs que vous pourrez obtenir les commentaires les plus authentiques lorsque vous êtes à côté de vos clients. Il y a trop de pseudo-experts dans le domaine de l'IA actuellement, il est donc préférable d'écouter davantage de voix en première ligne.

  1. Nous avons parlé à environ 150 clients. Les exigences relatives au grand modèle lui-même sont principalement divisées en deux catégories. L'une concerne les exigences textuelles du grand modèle lui-même. Les exigences des clients pour le grand modèle linguistique sont exactes à 100 %. L'autre est l'agent IA, qui comprend des appels de fonctions, des affichages de code et des appels à des outils tiers.

  2. Au cours de notre coopération, un conflit est survenu. Les clients auront le sentiment que les données ne peuvent pas vous être fournies avant de décider de les déployer en interne. Mais sans ces données, comment pouvons-nous former un modèle adapté aux besoins des clients ?

  3. Lorsque nous travaillions sur le projet, nous avons constaté que les utilisateurs ne sont pas disposés à payer pour de grands modèles, mais qu'ils paient quand même pour votre application. Certains clients se demanderont directement, avec de grands modèles, si certaines des anciennes plates-formes intermédiaires intelligentes et graphiques de connaissances ne sont plus nécessaires ? Au final, j'ai trouvé que la scène était le noyau.

  4. Nous devons trouver des scènes sexy. Il existe plusieurs normes. Tout d’abord, la petite incision. Deuxièmement, faites correspondre les avantages des grands modèles. Troisièmement, laissez les utilisateurs qui prennent la décision de payer avoir une forte perception. Par exemple, autrefois, l'obtention de certaines données, conclusions ou services nécessitait différents processus. Aujourd'hui, grâce à de grands modèles, les décideurs peuvent les obtenir et les compléter rapidement sur des appareils mobiles.

  5. Pour réussir dans un modèle à grande échelle, trois choses sont nécessaires : 1) Si vous pouvez obtenir suffisamment d'argent pour acheter de la puissance de calcul. 2) Pouvons-nous obtenir suffisamment de données ? 3) La densité des talents est-elle suffisamment élevée ? Il ne s’agit pas de quantité, mais de savoir s’il y a suffisamment de scientifiques de haute qualité.

  6. Nous rencontrons désormais trois types de clients. Le premier type est celui des clients anxieux, comme les clients financiers qui veulent le faire parce que leurs concurrents le font, mais ils ne savent pas quels sont leurs besoins. L'un d'entre eux est celui des clients qui souhaitent réduire leurs coûts. La direction du client estime qu'il s'agit principalement d'une question de réduction des coûts et des dépenses, mais il est difficile de juger de la valeur spécifique des économies réalisées par le modèle. La dernière catégorie est celle des clients qui espèrent gagner de l'argent en déployant des modèles open source. Ils s'appuient sur ce modèle pour générer des revenus. Il est plus pratique pour ces clients de payer.

**03, ToC ou ToB ? **

Il est entendu que le coût de la formation unique de GPT-4 s'élève à environ 63 millions de dollars et nécessite une quantité énorme de 1,8 billion de paramètres. Pour certains grands modèles actuellement commercialisés en Chine, la direction ToC reste le modèle gratuit d'Internet. Mais les praticiens savent tous que le développement et l'exploitation de grands modèles nécessitent des coûts importants, ce qui facilite le bon fonctionnement du modèle commercial de ToB. En termes d’exploration de commercialisation, ToB ou ToC a toujours été un sujet de préoccupation pour l’industrie. Lors de la réunion à huis clos, nous avons entendu à plusieurs reprises deux mots clés : 1) gènes et 2) transgression. "Vous ne pouvez pas être ce que vous n'êtes pas."

  1. Nous pensons que des opportunités résident toujours dans le modèle vertical tob, et que le point central réside dans les données et le scénario eux-mêmes, qui constituent le noyau.

  2. Nous réfléchissons également nous-mêmes à la manière dont l'intelligence artificielle peut être combinée avec Internet, la numérisation, etc., et à la manière de mieux rendre les scènes originales plus intelligentes.

  3. ToC ou ToB, pour parler franchement, cela est lié aux gènes de chacun. Ce n’est pas parce que nous ne pouvons pas le faire que les autres ne peuvent pas le faire. Par exemple, certaines applications ToC sont jouées par des enfants nés en 2000 ou 10 ans, ce qui dépasse notre compréhension d'âge.

  4. Toc et Tob sont encore très différents. ToC a un taux de tolérance aux pannes relativement élevé. TOB est le contraire. Prenons, par exemple, les questions et réponses intelligentes. Comment garantir l’exactitude ? Comme le gouvernement, il y a des lignes rouges. La manière d’éviter l’illusion du modèle est actuellement étudiée en conséquence.

  5. Au contraire, nous pensons qu'il est plus facile de gagner de l'argent avec la ToC. Il y a un problème avec ToB : le processus d’un projet est relativement long. Le cycle financier est très long depuis l’approbation du budget du client jusqu’à l’établissement et la mise en œuvre du projet.

  6. Je pense qu’il y a trop d’opportunités maintenant. N’allouez pas de ressources à des endroits pour lesquels vous n’êtes pas qualifié. Il est très important de faire des choix stratégiques.

04, ToB et ToG sont également très difficiles

  1. Le plus gros bug du côté B est qu’il s’agit finalement d’une externalisation humaine avancée.

  2. Tous les projets ont des cycles et tous les paiements sont basés sur les nœuds du cycle. Il m'est impossible de vous aider à entraîner et à optimiser un modèle sans restrictions.

  3. Les créations AIGC sont plus tolérantes et peuvent comporter quelques erreurs. Mais lorsqu'il s'agit de production et de fabrication par certaines entreprises, les exigences en matière de précision sont très élevées. Il est souvent plus facile pour nous de sélectionner un ou deux meilleurs cas à partir du modèle, mais il reste assez difficile de le maintenir à un niveau élevé sans mauvais cas.

  4. Lorsque nous travaillions sur un projet de gouvernement numérique intelligent dans une province économiquement développée, nous avons proposé plus de 5 scénarios et le client a finalement approuvé 3 scénarios. Ensuite, nous irons au fond des choses sur la sécurité, les données et la couche inférieure. Ensuite, je demanderai quelles sont les différences et les avantages entre vous et les autres grands modèles ? Enfin, toutes les parties doivent s’asseoir et élaborer un système d’évaluation. Après avoir passé le système d'évaluation, nous devons encore évaluer les performances.

05. Utiliser des projets pour incuber des produits et des solutions

  1. Utiliser des projets pour incuber des produits.Après avoir terminé plusieurs projets, extraire les solutions techniques correspondantes. Cet ensemble de solutions n'est probablement pas un modèle, mais un grand modèle + petits modèles, et enfin une solution globale formée de plusieurs modèles.

  2. Au cours des deux dernières années, il se peut que ce soit le processus d'innovation et de production de produits, et le cycle de récupération des liquidités sera relativement long.

06、Agent

Imaginez une IA imitant les tâches humaines quotidiennes pour gérer un grand nombre de comportements sociaux complexes. Un article de l'Université de Stanford intitulé « Agents génératifs : simulacres interactifs du comportement humain, intitulé » examine en profondeur les agents IA qui se souviennent, réagissent et planifient. AI Agent est considéré comme la prochaine direction des efforts d'OpenAI. Le co-fondateur d'OpenAI a également déclaré lors d'un événement récent : « Par rapport aux méthodes de formation de modèles, OpenAI accorde actuellement plus d'attention aux changements dans le domaine des agents. Chaque fois qu'un nouvel article sur les agents AI sortira, nous serons très enthousiastes et en discuterons. en interne sérieusement." .

  1. On imagine toujours que les grands modèles sont tout-puissants et peuvent résoudre divers problèmes ? Est-ce le cas ? Les grands modèles ne sont que de grands modèles.

  2. Nous gérons l’IA en interne, appelée IA invisible. Devant les utilisateurs, nous n'insisterons pas de quel modèle il s'agit ni du nombre de paramètres dont il dispose. Notre définition de l’IA est l’assistance humaine.

  3. En contournant le modèle et la puissance de calcul, la prochaine opportunité pourrait être Agent.

  4. Le plus gros problème affectant actuellement l’utilisation des clients : le rapport entrées-sorties. Une fois que vous arrivez à la fin de la conversation avec le client et que vous parlez du budget du projet, s'il s'agit uniquement d'un texte et que l'investissement est de quelques millions ou quelques millions, le client ne sera pas très satisfait. De plus, si de grands modèles sont intégrés dans des environnements de production réels à l’aide d’agents IA pour résoudre des problèmes réels, les clients seront tout à fait disposés à payer.

  5. Basé sur le grand modèle, AI Agent dispose de capacités améliorées telles que la mémoire, la planification et l'exécution. Nous avons cette fois investi dans plus de 60 projets de start-up, dont plus de 20 sont des Agents.

  6. Les produits ToC, les modes de paiement et les formes de produits sont très différents entre la Chine et les pays étrangers. Récemment, nous avons investi dans certaines sociétés d'agents.

  7. Cependant, à ce stade, AI Agent n’en est qu’à une nouvelle étape expérimentale, et il existe encore un certain écart entre lui et l’intelligence générale. À l’avenir, outre les capacités complètes d’un seul agent IA, il faudra également résoudre des avancées en matière de collaboration et de capacités émotionnelles entre plusieurs agents IA.

  8. Les grands joueurs modèles doivent veiller à rester à la table de poker afin d'avoir une chance de voir de nouvelles choses sortir en seconde période.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)