Sortie de Wenxin Big Model 4.0 ! Prétend à l’étalonnage GPT 4.0

Source de l’article : Geek Park

Auteur | Li Yuan

Modifier | Jing Yu

De la recherche à l’analyse commerciale, en passant par la bibliothèque et l’analyse commerciale, les grands modèles d’IA sont devenus la « ligne verticale » de Baidu.

« Bienvenue dans l’ère de l’IA générative ! **」

Le 17 octobre 2023, vêtu d’une chemise blanche et de petites chaussures blanches, Robin Li, fondateur, président et PDG de Baidu, a annoncé l’arrivée d’une nouvelle ère sur scène.

Lors de cette conférence de presse intitulée « Generating the Future », Robin Li a officiellement publié la dernière version 4.0 du grand modèle de langage de la société, Wenxin Big Model, et a enseigné aux gens comment utiliser des mots rapides pour faire appliquer le grand modèle Wenxin amélioré, aidant les gens à utiliser le fonds de prévoyance de Pékin pour acheter des maisons dans le Hebei, faire des publicités et des vidéos, et créer des romans en ligne.

Robin Li a directement comparé le modèle Wenxin 4.0 avec GPT-4 lors de la réunion|Baidu

Lors de la réunion, Robin Li a déclaré avec confiance que les capacités de la version 4.0 du modèle Wen Xin ne sont « pas inférieures à celles de GPT-4 ».

Dans le même temps, l’affirmation selon laquelle « toutes les applications valent la peine d’être reconstruites avec de grands modèles » annoncée il y a six mois a également porté ses fruits lors de la réunion du même jour. Qu’il s’agisse de la recherche principale de l’entreprise, de la bibliothèque Baidu, du disque réseau, de la carte ou d’autres applications de compartiment de la famille Baidu, ils ont été connectés au grand modèle Wenxin, montrant de meilleures capacités d’interaction et de logique.

Du côté B, Robin Li a également exposé des outils GBI (generative business analysis), ainsi que des assistants de bureau avec de grandes capacités de modélisation « Ruliu ».

Si l’IA générative active l’ensemble du monde de la technologie, alors Baidu est peut-être le géant qui en profite le plus.

01 Wen Xin 4.0 Direct Benchmark GPT-4

Dès le début de la conférence de presse, Robin Li a annoncé pour la première fois la sortie de la version 4.0 du modèle Wenxin.

Baidu divise quatre critères définissant les capacités des grands modèles : la compréhension, la génération, la logique et la mémoire. Cette fois-ci, la mise à niveau du grand modèle 4.0 de Wen Xin, l’infrastructure est toujours la même que les versions 3.0 et 3.5, mais prétend être grandement améliorée en termes de logique et de mémoire.

Robin Li annonce le Wenxin Grand Model 4.0|Baidu

Selon Wang Haifeng, directeur technique de Baidu, l’amélioration de la compréhension et de la capacité de génération de Wenxin Big Model 4.0 est similaire, tandis que l’amélioration de la logique est 3 fois supérieure à celle de la compréhension et l’amélioration de la mémoire est 2 fois supérieure à celle de la compréhension**.

Quatre fonctionnalités différentes peuvent améliorer l’efficacité de différents scénarios d’application. Pour ces capacités, Li Yanhong l’a montré sur place.

La compréhension est la base de l’IA conversationnelle pour aider les utilisateurs, et elle est très importante dans les affaires gouvernementales, le marketing, le service client et d’autres domaines.

En termes de capacité de compréhension, la scène utilisait une inversion de l’ordre des mots et une expression vague (invite) pour tester la capacité du modèle : « Je veux retourner à Chengde pour acheter une maison, puis-je utiliser le prêt du fonds de prévoyance ? » Qu’en est-il des procédures? Je travaille à Pékin.

Pour comprendre cette phrase, Amnesty International doit comprendre que « travailler à Pékin » et « retourner à Chengde pour acheter une maison » ont en fait « une caisse de prévoyance payante à Pékin, et le hukou est à Chengde ». Ce type de sous-texte avec des caractéristiques chinoises peut apporter des réponses précises dont les utilisateurs ont besoin. Et bien sûr, Wen Xin comprit rapidement la clé de la question et fit une réponse correcte.

Robin Li explique les quatre principales capacités de l’IA|Baidu

La capacité de génération peut principalement améliorer l’efficacité du marketing de marque, de la rédaction et du travail créatif.

Sur les lieux, Li Yanhong a montré que, selon une image, avec des invites en langage naturel, vous pouvez effectuer une transformation d’arrière-plan, un flou de sujet et générer des affiches et des textes en fonction des informations du site officiel.

En plus de ces traitements d’image traditionnels, Baidu a également démontré sa capacité à générer des vidéos. Grâce au langage naturel, lors de la démonstration en direct, Wen Xin a généré une publicité vidéo orale humaine numérique avec presque aucun délai. La vidéo incorpore des images de produits, ajoute beaucoup d’arrière-plan de transition, et une personne numérique en costume apparaît de temps en temps pour présenter les caractéristiques du produit collectées sur le site officiel.

Affichage en direct des capacités de génération de publicité du modèle Wenxin 4.0|Baidu

L’effet qui ne pouvait être obtenu que par la coopération de plusieurs produits AIGC a été intégré de manière transparente dans cet écran. Un film publicitaire, 5 textes publicitaires et une affiche ont pris moins de 3 minutes à générer.

Le raisonnement logique, qui se manifeste généralement sous la forme d’un test de logique mathématique. Dans cette vitrine, Baidu a mis en avant son potentiel dans le domaine de l’éducation.

Li Yanhong a donné un problème d’application impliquant la transformation d’un volume conique en volume cubique, et Wen Xin a non seulement donné la solution, mais a également résolu le problème étape par étape et a analysé les points de connaissance impliqués dans chaque étape.

Utiliser l’intelligence artificielle générative pour donner des cours particuliers aux enfants avec des devoirs est plus simple|Baidu

Pour l’affichage de la capacité de mémoire, le choix de Baidu est plus spécial.

Baidu a choisi de laisser Wen Xin écrire les grandes lignes d’un roman d’arts martiaux. Une fois l’écriture terminée, sur le plan d’origine, laissez le grand modèle augmenter la relation entre les personnages et augmenter le conflit dramatique, pour montrer que le grand modèle peut se souvenir du cadre original et de la capacité du personnage après avoir ajouté des informations complexes, sans utiliser l’imagination sans but.

Baidu a également partagé le support technique pour l’amélioration des capacités des grands modèles de Wenxin.

Baidu a déjà annoncé que le modèle Wenxin est le premier grand modèle entraîné à l’aide de l’amas Wanka en Chine, et de nombreuses personnes spéculent que l’échelle des paramètres du modèle Wenxin 4.0 devrait dépasser le niveau de billion. Cependant, lors de cette conférence, Baidu n’a pas mis l’accent sur le niveau des paramètres du grand modèle.

En plus de la formation Wanka, le directeur technique de Baidu a également mentionné que la moyenne hebdomadaire de la stabilité de l’entraînement de l’algorithme de Baidu a dépassé 98 % et que la technologie d’amélioration des points de connaissance a été mise en œuvre en termes d’entrée et de sortie.

02 « Refactoring » Baidu Family Bucket

Bien qu’elles soient présentées séparément, en fait, le plus souvent, les quatre capacités de base des grands modèles sont appliquées en combinaison.

En mai, Baidu a annoncé l’utilisation de grands modèles pour reconstruire les applications de Baidu. Lors de cette conférence, Baidu a également présenté les dernières réalisations de l’application de Baidu de la reconstruction de grands modèles Wenxin.

Parmi eux, le plus étonnant est la refonte de la recherche.

En février, Microsoft a lancé New Bing basé sur la technologie de GPT pour refactoriser sa recherche. Dans son dernier témoignage, Nadella de Microsoft a déclaré que la part de Microsoft sur le marché de la recherche n’avait pratiquement pas changé depuis l’ajout de capacités d’IA à Bing.

Le New Bing de Microsoft a principalement lancé un système de bots conversationnels qui peuvent discuter avec New Bing pour poser des questions afin d’obtenir des informations intégrées avec des liens. Le Bard de Google est similaire.

Baidu utilise l’IA pour reconstruire sa recherche d’activité principale|Baidu

Cependant, la reconstruction de la recherche de Baidu va cette fois plus loin dans l’ensemble du système de recherche. Baidu le décrit comme « une satisfaction ultime, une stimulation des recommandations et de multiples cycles d’interaction ».

La satisfaction ultime se traduit par la saisie d’une question dans le champ de recherche, La recherche ne peut plus donner de lien, mais générer directement la meilleure réponse.

Dans sa présentation, Robin Li a soulevé la question de savoir quel est le classement de la valeur ajoutée industrielle des différents pays au cours des 20 dernières années.

Contrairement à New Bing et Bard, qui peuvent donner une réponse à des données liées, le nouveau Baidu peut directement donner un graphique sous forme de tableau dynamique, sous la forme d’un graphique à barres, montrant les valeurs de croissance industrielle de différents pays. Ce graphique est même dynamique, il grandit et change au fil du temps.

La fonction d’excitation de la recommandation est quelque peu équivalente aux questions pertinentes du moteur de recherche actuel, ce qui peut inciter l’utilisateur à continuer à comprendre certaines questions connexes en fonction de l’invite, telles que « Quelle est la relation entre la valeur ajoutée industrielle et le PIB ? » « Quel est l’impact de l’industrie sur le développement de l’économie nationale ? ».

Robin Li partage l’expérience de l’application de la famille Baidu sur l’IA et reconstruit la famille Baidu|Baidu

Et les multiples cycles d’interaction sont également très intéressants.

Dans la vague actuelle d’entrepreneuriat des grands modèles de langage, l’un des nombreux entrepreneurs travaille dur pour utiliser, c’est-à-dire pour utiliser de grands modèles de langage avec des moteurs de recommandation pour mener plusieurs cycles de dialogue afin de fournir aux utilisateurs le meilleur choix.

En septembre, Baidu a organisé le projet de concours d’entrepreneuriat Wenxin Cup, et le premier lauréat Buysmart.AI a été le leader dans cette direction. Les utilisateurs utilisent le langage naturel et les clics pour clarifier constamment leurs besoins, et Buysmart.AI utilise le moteur de recommandation pour recommander les produits dont les utilisateurs ont le plus besoin.

La recherche Baidu reconstruite ajoute directement une fonction de direction similaire à la recherche.

Dans la démo, l’invite de recherche de Baidu demande « Où faire de la randonnée autour de Pékin ? » Après avoir donné plusieurs réponses telles que Baihuashan, la montagne Haituo, etc., le moteur de recherche permet aux utilisateurs de cliquer davantage pour compléter et choisir leur propre situation. Par exemple, si vous choisissez d’ajouter des novices en randonnée parents-enfants, le moteur de recherche changera pour recommander des endroits tels que Xishan et Baiwangshan, qui sont relativement faciles à escalader et plus conviviaux pour les activités parents-enfants.

En plus de la reconstruction de la recherche, Baidu a également montré la reconstruction du disque réseau Baidu, de la carte Baidu, de la bibliothèque Baidu et d’autres applications.

Le cloud de Baidu Network Disk, un assistant cloud personnel, a déjà été lancé. En tant que premier assistant personnel dans le cloud au monde, il compte actuellement 20 millions d’utilisateurs. Vous pouvez utiliser le langage naturel pour communiquer avec l’assistant, trouver une vidéo dans le cloud personnel en une phrase, comprendre le contenu de la vidéo, trouver un certain contenu dans la vidéo, résumer la phrase d’or de la vidéo, etc.

Baidu Map, selon la promotion de Baidu, est le premier produit cartographique natif de l’IA au monde. Parler à l’assistant de la carte permet d’accéder à des milliers de services dans un menu à plusieurs niveaux en une seule étape. Vous pouvez également recommander des restaurants avec des emplacements appropriés, choisir dans l’environnement du restaurant et enfin réserver directement un taxi.

En s’appuyant sur des milliards de ressources manuscrites passées, Baidu Wenku peut sélectionner directement le type d’article nécessaire, de la littérature académique sérieuse ou des documents grand public après que les utilisateurs aient recherché des informations sur des sujets spécifiques, et générer des articles en un clic.

La bibliothèque Baidu reconstruite ajoute également la fonction de génération PPT, qui peut comprendre si les vues sont juxtaposées ou progressives, et changer de style PPT en un clic, Baidu affirme que « bien au-delà des autres outils de génération PPT sur le marché ».

03 Puissance face B

Dans cette démonstration, Baidu a également montré de nouvelles applications de la face B.

Parmi eux, Baidu s’est concentré sur le lancement d’un produit de business intelligence. Baidu GBI, Intelligence d’affaires générative.

Il s’agit d’un nouveau produit lancé par Baidu, qui est le premier produit d’intelligence économique générative en Chine, capable de prendre en charge l’interaction en langage naturel, l’analyse inter-bases de données et l’apprentissage des connaissances professionnelles, réduisant ainsi le travail d’analyse de données que les analystes commerciaux peuvent effectuer en quelques jours à quelques minutes.

Les produits Baidu GBI ciblant la face B|Baidu

Dans la publicité, la question « Quel est le coût estimé ? » Quel est le prix plancher sans perdre d’argent ? Le client nous a demandé d’effectuer la livraison dans les 3 mois, pouvons-nous le faire ? Quelle est la durée la plus rapide ? Si la concurrence est bonne, comme notre prix bas, que peut-on faire ? Pour cette série de questions connexes d’analyse financière, d’interaction de projet et d’analyse des utilisateurs, Baidu GBI peut donner directement des réponses par le biais d’un dialogue en langage naturel et générer des réponses illustrées.

Aucun expert n’est requis et aucune opération supplémentaire n’est requise pour accéder aux données dans les bases de données et les tables. En outre, les entreprises peuvent également les former pour qu’ils acquièrent des connaissances professionnelles et deviennent des experts de l’industrie.

Un autre produit de la face B est Ruliu. Après avoir utilisé l’IA générative pour le refactoring, Flow peut générer des procès-verbaux de réunion en un clic, résumant le contenu de milliers de groupes de travail. Combiné avec le système CRM de l’entreprise, proposer des informations de fond et des discussions sur le projet pour les gestionnaires. Selon l’itinéraire personnel, planifier des plans de travail, envoyer des invitations à des réunions, etc.

En plus de la mise en place du bureau, Baidu a également démontré l’autonomisation des grands modèles pour la conduite autonome, le cockpit intelligent et les projets de surveillance intelligente du gouvernement.

Depuis sa sortie il y a plus de six mois, Wenxin a rapidement itéré pour reconstruire les applications Baidu, tout en établissant progressivement l’écosystème Wenxin.

Baidu a également présenté la plateforme Lingjing récemment lancée lors de la conférence de presse. Qu’il s’agisse de données ou d’applications personnelles ou d’entreprise, elles peuvent être rapidement transformées en plug-in sur la plate-forme Lingjing, et l’API peut être utilisée pour accéder aux capacités du grand modèle Wenxin.

Robin Li prédit l’ère écologique de l’IA|Baidu

Baidu a annoncé qu’au cours du mois en cours depuis le lancement de la plate-forme Lingjing, 27 000 développeurs ont postulé pour s’installer, couvrant plus de 20 domaines, notamment la consultation juridique, la génération de CV, la production de cartes cérébrales, la pratique de la parole et d’autres applications natives dans divers scénarios. Les données privées de l’entreprise peuvent être facilement et rapidement accessibles aux capacités de ce grand modèle de pointe, sans risque de fuite.

« La Chine dispose d’une multitude de scénarios d’application, et les utilisateurs chinois sont naturellement disposés à adopter de nouvelles technologies, et avec de grands modèles de base avancés, nous pouvons construire un écosystème d’IA florissant et créer conjointement un nouveau cycle de croissance économique. » », a déclaré Li Yanhong.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Partager
Commentaire
0/400
Aucun commentaire
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)