Le texte intégral du discours est de 11500 mots | Baidu Robin Li : Nous sommes sur le point d’entrer dans l’ère de l’IA native !

Source de l’article : AI Dark Horse

Invité partageur: Baidu Robin Li

Bilan de terrain : Cheval noir de l’entrepreneuriat

Le monde a retrouvé son aspect d’antan, et certaines personnes disent que Robin a une publicité sérieuse sur scène, révélant le sens futuriste et la curiosité des produits technologiques. C’est l’espoir et la résonance de l’avenir de la technologie sur scène et en dehors, de l’entreprise et des utilisateurs.

Le Baidu World Congress 2023 est la plus importante conférence de Baidu sur la stratégie, la technologie et le lancement de produits, qui se tient depuis 17 ans depuis 2006.

**Le 17 octobre, le cheval noir de l’entrepreneuriat a été invité à participer à la conférence mondiale de Baidu, a enregistré 10 contenus importants sur place, a trié le texte intégral du discours de Robin Li et l’a partagé avec tout le monde. **

  1. Bienvenue dans l’ère de l’intelligence artificielle générative ! La plus grande innovation technologique de l’année écoulée a été l’émergence de l’intelligence à partir de grands modèles, qui constitue la base du développement d’applications natives de l’IA. Le modèle Wenxin 4.0 a été officiellement publié, réalisant une mise à niveau complète du modèle de base, et a considérablement amélioré ses capacités de compréhension, de génération, de logique et de mémoire, et le niveau complet n’est pas inférieur à celui de GPT-4.

2.AI Les applications natives d’IA sont des applications développées sur la base de la compréhension, de la génération, de la logique et des capacités de mémoire de grands modèles. Ces capacités n’étaient pas disponibles dans les époques passées, ouvrant ainsi un espace illimité pour l’innovation.

  1. L’IA générative et la recherche font bon ménage. La recherche Baidu a été reconstruite sur la base du grand modèle de l’IA, et la nouvelle recherche présente trois caractéristiques : une satisfaction extrême, une stimulation de la recommandation et une interaction à plusieurs niveaux. Il améliore non seulement la qualité de la recherche, mais dépasse également le champ d’application de la recherche et repousse les limites du produit.

  2. Baidu GBI est le premier produit d’intelligence d’affaires générative en Chine, qui peut raccourcir le travail d’analyse de données et de rédaction de rapports que les analystes commerciaux peuvent effectuer en plus de dix jours au niveau de la minute, et est un outil de prise de décision basé sur de grandes capacités de modèle.

  3. La bibliothèque Baidu est le produit le plus complet de la reconstruction de l’IA. Baidu Wenku, qui est basé sur la reconstruction de grands modèles, a été dévoilé, passant d'« outils de contenu » à « outils de productivité ». Il évolue rapidement dans des fonctions telles que la compréhension des matériaux, la rédaction d’articles, la génération intelligente de PPT et le changement de style.

  4. Le disque réseau Baidu a terminé la reconstruction de l’IA. L’assistant intelligent personnel en nuage « Cloud One » réalise la transformation de l’interaction de l’interface graphique à l’interaction en langage naturel, améliore la compréhension des informations multimodales et peut localiser avec précision les vidéos, résumer le contenu vidéo en un clic et affiner les phrases d’or, en tête du monde.

  5. Le plug-in est une application native spéciale d’IA, avec le seuil le plus bas et le plus facile à utiliser. Le plug-in améliore les capacités des grands modèles, les rendant plus pratiques et plus faciles à utiliser, et permet également à de nombreuses données privées d’entreprise d’être utilisées facilement et rapidement sans risque de fuite.

  6. Les futures applications natives de l’IA doivent être multimodales, et la conduite autonome est une application typique des grands modèles visuels pour reconstruire le monde physique.

  7. Baidu promeut vigoureusement l’intégration profonde de la technologie numérique et de l’économie réelle, et la technologie des grands modèles a été appliquée dans la fabrication, l’énergie, l’énergie électrique, l’industrie chimique, les transports et d’autres industries réelles, en utilisant l’inspection intelligente pour réduire les risques potentiels pour la sécurité, en utilisant la planification intelligente pour raccourcir le cycle de livraison, en utilisant la prise de décision intelligente pour améliorer l’efficacité de l’entreprise, le contrôle intelligent de l’information pour résoudre les embouteillages, et le grand modèle devient une force motrice importante pour la nouvelle industrialisation.

  8. Nous sommes sur le point d’entrer dans une ère de l’IA native, une ère d’interaction homme-machine !

Ce qui suit est le texte intégral du discours du fondateur et PDG de Baidu, Robin Li, édité par Dark Horse of Entrepreneurship :

Bonjour les invités! Bienvenue au Baidu World Congress 2023 !

Bienvenue dans l’ère de l’IA générative ! **

**Le thème de cette conférence est les applications natives de l’IA. Je vais partager avec vous en détail l’expérience de Baidu dans le processus de reconstruction native de l’IA de ses différentes gammes de produits au cours des derniers mois, et j’espère qu’elle vous sera utile. **

Comme nous le savons tous, les applications natives de l’IA sont développées sur la base de grands modèles. La plus grande innovation dans le secteur de la technologie au cours de l’année écoulée a sans aucun doute été l’émergence de l’intelligence apportée par les grands modèles, qui est la base du développement d’applications natives de l’IA.

Par conséquent, les applications natives d’IA de Baidu sont également développées sur la base de nos mots Wen Xin. Les mots de Wen Xin ont été publiés pour la première fois le 16 mars de cette année, et depuis lors, nous avons rapidement itéré et été approuvés pour nous ouvrir au monde le 31 août, obtenant beaucoup de commentaires des utilisateurs, et la vitesse de l’innovation s’accélère.

Aujourd’hui, j’ai le plaisir d’annoncer la sortie officielle de Wenxin Grand Model 4.0.

Nous avons également commencé à inviter des tests en même temps. Amis sur les lieux, il vous suffit de scanner le code QR sur la carte d’hôte, de recevoir le coupon d’expérience et de vous connecter au site officiel de Wenxin Yiyan ou à l’application Wenxin Yiyan pour découvrir Wenxin Model 4.0.

C’est le grand modèle Wenxin le plus puissant à ce jour, il a réalisé une mise à niveau complète du modèle de base, de la compréhension, de la génération, de la logique et de la mémoire, quatre capacités majeures, par rapport à la version actuelle de Wenxin Yiyan ont été considérablement améliorées, le niveau complet n’est pas inférieur à GPT4 !

**L’application dite native de l’IA, telle que je la comprends, est une application développée sur la base des capacités de compréhension, de génération, de logique et de mémoire de grands modèles. Ces capacités n’étaient pas disponibles dans les époques passées, elles peuvent donc ouvrir un espace illimité pour l’innovation. **

Ci-dessous, je vais combiner les scénarios d’application pour vous présenter les quatre capacités des mots de Wen Xin. L’application dotée de ces quatre capacités est l’application native de l’ère de l’IA.

** Le premier est la capacité de comprendre. C’est la chose la plus étonnante que j’ai ressentie après être entrée en contact avec le grand modèle. **

Dans le passé, nous avons dit que l’IA était une « déficience intellectuelle artificielle », c’est-à-dire que l’IA ne peut souvent pas comprendre les mots des gens et, avec le temps, vous n’osez pas trop lui parler.

Aujourd’hui, chaque mot que vous prononcez peut très probablement le comprendre, bien mieux que vos amis et collègues ne comprennent ce que vous dites.

Par exemple, vous êtes un jeune homme travaillant à Pékin qui souhaite acheter une maison dans le Hebei et qui veut savoir si vous pouvez demander un prêt de prévoyance à Pékin.

Entrons une ligne.

[Je veux retourner à Chengde pour acheter une maison, puis-je utiliser le prêt de la caisse de prévoyance, que dois-je faire avec les procédures?] Je travaille à Pékin. 】

Jetons un coup d’œil aux résultats. Wen Xin a répondu qu’il pouvait utiliser le prêt du fonds de prévoyance. Pourquoi cette séance de questions-réponses reflète-t-elle la capacité à comprendre le modèle dans son ensemble ? En fait, ce que je vous ai dit tout à l’heure, apparemment simple, comporte plusieurs petits pièges à comprendre :

Tout d’abord, il s’agit d’une expression de va-et-vient. Lorsque la plupart des gens appellent pour poser des questions, ils pensent à l’endroit où dire, pas si rigoureux, comme ça, j’ai d’abord parlé de l’achat d’une maison et de la gestion du fonds de prévoyance, et finalement j’ai dit « Je travaille à Pékin », ce qui met en avant des exigences plus élevées pour la compréhension.

Deuxièmement, j’utilise délibérément deux expressions vagues ici. L’un est « travailler à Pékin », le sous-texte est « déposer la caisse de prévoyance à Pékin », l’autre est « retourner à Chengde pour acheter une maison », juste un mot « retour », en fait, ce qui implique que je suis très probablement un hukou de Chengde.

Troisièmement, Wen Xin a combiné le contexte et combiné tous les points d’information pour comprendre avec précision la vraie question, c’est-à-dire « un utilisateur enregistré à Chengde, dans la province du Hebei, peut-il utiliser le fonds de prévoyance de Pékin pour acheter une maison à Chengde avec un prêt », puis a donné une réponse et des étapes de traitement pour cette question.

On peut voir que les mots de Wen Xin peuvent déjà avoir une compréhension assez précise des « expressions dans le désordre, des intentions d’expression relativement vagues et du sous-texte dans les mots ». Cette capacité a un très large éventail de perspectives d’application dans les affaires gouvernementales, le marketing, le service à la clientèle et d’autres domaines.

**La deuxième capacité importante des grands modèles est la « génération », qui peut générer du contenu multimodal tel que du texte, des images et des vidéos. **

Alors, comment utiliser l’énergie de production? J’ai demandé à Wen Xin de générer un ensemble de créations en un mot.

Saisissez-y d’abord une image, puis entrez un paragraphe.

[Il s’agit du véhicule à énergie nouvelle de Changan.] S’il vous plaît, aidez-moi à générer deux images avec un printemps, un paysage vibrant en arrière-plan et la sensation de la voiture qui accélère. 】

Nous constatons que cette génération utilise les paysages extérieurs vibrants du printemps, accompagnés du flou de la vitesse.

Je lui ai demandé de générer une affiche verticale directement pour moi.

[Combiné avec les informations de Changan Qiyuan sur le site officiel de Changan, faites une affiche publicitaire verticale et rédigez un texte marketing simple et élégant, faisant écho au style du corps.] 】

Comme vous pouvez le voir, nous avons généré une affiche publicitaire verticale avec des images et du texte.

Nous avons maintenant une affiche publicitaire, et nous avons besoin d’un texte publicitaire plus riche, vous pouvez demander à Wen Xin d’écrire quelques mots de plus :

[Cette voiture met l’accent sur l’intelligence numérique du cockpit, le design Fuguang et la qualité de conduite. Veuillez écrire 5 autres textes publicitaires, chacun avec un titre court et une description]

La rédaction écrite par l’IA, qui a la beauté de la science et de la technologie, la tendance de l’époque, met également l’accent sur l’interaction homme-machine, la rédaction est plus professionnelle et fluide, a atteint la norme du marketing de marque.

Que se passe-t-il si je veux quand même une vidéo ?

[Veuillez combiner les informations du site Web officiel et le contenu vidéo existant pour générer une vidéo orale humaine numérique, je veux diffuser des publicités dans le flux.] 】

Il a été généré, puis nous ouvrons la vidéo pour voir l’effet.

Il s’agit en effet d’une vidéo de diffusion de population numérique plus distinctive, et elle reflète également les caractéristiques de cette voiture.

Maintenant, nous avons 1 film commercial, 5 textes publicitaires et 1 affiche, et je n’ai donné à Wen Xin qu’un mot d’une image et quelques mots comme « voiture intelligente numérique » et « conduite de qualité », et l’ensemble du processus a pris moins de 3 minutes.

Il n’y a pas si longtemps, nous avons également utilisé cette fonctionnalité pour lancer la plateforme de création marketing d’AIGC, Steering Engine, permettant à une personne de devenir une équipe de marketing IA. Il y a peut-être des amis rédacteurs sur la scène aujourd’hui, en voyant cela, pensez-vous que les grands modèles peuvent apporter plus d’inspiration créative et vous aider à améliorer votre efficacité ?

Ensuite, parlons de la troisième capacité des grands modèles : la logique. **

De nombreuses personnes doivent souvent aider leurs enfants à faire leurs devoirs. Certaines personnes plaisantent en disant que « si vous n’écrivez pas les devoirs, la mère est la piété filiale, et quand vous écrivez les devoirs, la poule vole et le chien saute ». Voyons voir, les mots de Wen Xin peuvent-ils aider les parents à résoudre le problème du tutorat ?

Laissez-moi inventer un problème de mathématiques et voir comment il se comporte :

[Le tas de sable en forme de cône, la zone inférieure est de 8 mètres carrés, la hauteur est de 12 décimètres, étalez ce tas de sable sur une route de 2 mètres de large, 5 cm d’épaisseur, combien de mètres peuvent être pavés? ] 】

C’est une sorte de problème mathématique que nous avons peut-être fait quand nous étions enfants, et à en juger par la réponse de Wen Xin, sa logique de réponse est assez claire. Chaque étape est écrite. Les parents peuvent voir s’il est plus détaillé que ce qui est donné dans certains supports de tutorat.

Même si l’IA peut pointer du doigt les points de connaissance utilisés dans la résolution de problèmes pour aider les enfants à consolider leurs apprentissages, demandons-le à nouveau :

[Quels sont les points de connaissance impliqués dans le processus de résolution de problèmes ci-dessus ?] 】

Wen Xin a clairement donné les points de connaissance impliqués dans cette question, tels que la formule du volume du cône, l’unité de mesure unifiée, le volume restant inchangé et la résolution d’équations. C’est pratique pour les élèves, les enseignants et les parents. Une fois que ces points de connaissance sont clairement maîtrisés, les enfants auront la capacité de tirer des inférences les uns des autres.

La capacité super logique du grand modèle ne peut certainement pas seulement être utilisée pour la résolution de problèmes. La planification d’itinéraires pour les cartes intelligentes, les assistants intelligents pour les tâches complexes, le contrôle des feux de circulation dans les systèmes de transport intelligents, etc., nécessitent tous l’utilisation de capacités logiques.

Ensuite, examinons le quatrième point, qui est la capacité de mémoire du grand modèle. **

La mémoire ici se réfère principalement à ce que vous avez dit plus tôt, si l’IA s’en souvient, le contenu généré par l’IA, sera-t-il contradictoire. Il s’agit d’un indicateur important pour distinguer l’intelligence des grands modèles, et le dialogue à plusieurs tours est l’incarnation de la capacité de mémoire.

Je sais que beaucoup de créateurs utilisent Wen Xin pour écrire des romans. Et si le contenu du roman est incohérent, alors il n’est pas lisible. Aujourd’hui, je vais lui demander d’écrire un roman sur place, d’intercaler quelques distractions avec des questions, et de voir s’il peut se souvenir de ce qu’il a écrit.

Je vais d’abord en saisir un :

[S’il vous plaît, aidez-moi à écrire un roman d’arts martiaux, le protagoniste est une femme, et l’intrigue a des hauts et des bas.] 】

Eh bien, voyons, les grandes lignes du roman sont sorties :

Le premier est l’arrière-plan de l’histoire, dans l’ancien monde des arts martiaux, des forces obscures se lèvent ; L’héroïne s’appelle Ling’er, et elle a le pouvoir de manipuler les forces internes et le vol.

Je vais d’abord en saisir un :

[S’il vous plaît, aidez-moi à écrire un roman d’arts martiaux, le protagoniste est une femme, et l’intrigue a des hauts et des bas.] 】

Eh bien, voyons, les grandes lignes du roman sont sorties :

Le premier est l’arrière-plan de l’histoire, dans l’ancien monde des arts martiaux, des forces obscures se lèvent ; L’héroïne s’appelle Ling’er, et elle a le pouvoir de manipuler les forces internes et le vol.

Ensuite, il y a le début de l’histoire. Ling’er veut vaincre les forces obscures et sauver les arts martiaux. À l’apogée du roman, elle mène une bataille à mort contre le méchant, vainc le méchant et sauve les arts martiaux et toutes les sectes.

En fin de compte, Ling’er et ses alliés ont également créé ensemble l’Institut de Cultivation du Pouvoir Interne.

Maintenant que l’histoire est essentiellement formée, mais qu’elle est un peu simple, je veux ajouter quelques exigences supplémentaires pour les personnages :

[Maintenant, la relation entre les personnages est trop simple, il n’y a que deux personnages, et 4 autres personnages sont ajoutés]

Wen Xin a donné quatre autres rôles en un mot, chacun avec une identité et une personnalité différentes, avec une personnalité différente, ce Murong Gucheng est une génération de grands maîtres, et il y a un prophète Xiao Hanyan qui peut prédire l’avenir.

Mais maintenant, il y a toujours un élément nécessaire dans le conflit dramatique et romanesque. Une histoire sans conflit n’est pas une bonne histoire, et le processus de l’héroïne qui vainc les forces obscures tout à l’heure est trop simple, voyons si nous pouvons le rendre plus difficile.

Entrez un autre

[Il est également nécessaire d’ajouter le conflit dramatique de la ligne principale à l’histoire pour rendre l’histoire plus regardable]

Nous le voyons, c’est déjà écrit pour un conflit dramatique. Voici un renversement, derrière les forces obscures, le véritable leader est une figure de niveau grand maître très respectée, ce qui a mis l’héroïne en danger à plusieurs reprises. Jusqu’à la bataille décisive, l’héroïne avait une chance de se défendre.

Comme vous pouvez le voir, il se souvient que la ligne principale de l’histoire est la confrontation entre Ling’er et les forces obscures, et le conflit tourne également autour de cette ligne principale.

Alors, Wen Xin se souvient-il encore de l’histoire qu’il vient d’écrire et fait-il le lien entre ces personnages et l’histoire ?

Faisons une dernière demande :

[Intégrez ces personnages dans le plan de l’histoire que vous avez conçue pour moi, et concevez un titre.] 】

Les résultats ont été montrés sur grand écran, et le roman s’intitule « La bataille vertueuse des rivières et des lacs », ce qui ajoute des personnages supplémentaires et des conflits dramatiques au plan de l’histoire. Les quatrième et cinquième chapitres nous disent aussi que le grand maître de ce méchant est Murong Gucheng qui vient d’être présenté.

Tout au long du processus, j’ai continué à augmenter la difficulté et à proposer de nouvelles exigences pour interférer avec sa mémoire, et Wen Xin se souvenait toujours de tous les besoins et réponses précédents, et pouvait correspondre avec précision à l’histoire et aux personnages, et sa mémoire était très étonnante.

Ensuite, tout le monde sur la scène de test maintenant, vous souvenez-vous, quelle est la capacité spéciale du protagoniste Linger ?

Peut-être que la plupart des gens ne s’en souviennent pas, alors voyons si Wen Xin s’en souvient ?

[Quelle est la capacité de l’héroïne ?] 】

Eh bien, la réponse est là, c’est le pouvoir de manipuler les forces internes et la fuite. C’est l’exemple de texte écrit par Wen Xin dans le premier tour de dialogue. Aujourd’hui, après cinq séries de dialogues et quelques milliers de mots de fiction, il peut encore se souvenir de ce qu’il a écrit auparavant, c’est-à-dire la capacité de mémoire du grand modèle.

Nous venons d’expérimenter les quatre capacités du grand modèle, bien sûr, la plupart du temps, ces quatre capacités n’apparaissent pas seules, elles se complètent. **

Par exemple, pour créer un texte publicitaire, il doit comprendre le thème de la création, clarifier la logique de la création et maintenir la cohérence grâce à la mémoire.

Dans la résolution de problèmes, il est également nécessaire d’appliquer de manière exhaustive la capacité de comprendre, de générer, de logiquer et de se souvenir.

Prenons un exemple d’application complet :

Tout d’abord, nous ouvrons l’application Baidu reconstruite, scannons la boîte de médicaments sortie par le patient avec l’appareil photo, et il n’est pas nécessaire de consulter les instructions en petits caractères, et le médecin humain numérique vous aidera à expliquer.

Les questions qui sont apparues à l’écran tout à l’heure, telles que « s’il faut manger avant ou après les repas », « si boire de l’alcool peut manger », « quelles autres précautions », sont de nombreux patients dans les médicaments quotidiens rencontreront des problèmes.

Nous constatons que le grand modèle peut non seulement aider les patients à interpréter les instructions du médicament, mais aussi combiner les besoins personnalisés pour améliorer l’efficacité de la médication et assurer l’exactitude et la rapidité de la médication des patients.

Il n’y a pas si longtemps, nous avons combiné le modèle Wen Xin avec des connaissances médicales professionnelles et avons publié le Grand Modèle de Médecine Spirituelle, qui peut aider les patients et les médecins à parler et à générer des dossiers médicaux en appliquant le Robot de Médecine Spirituelle. Cet exemple utilise non seulement la capacité de comprendre et de générer de la mémoire logique, mais aussi la capacité de la parole multimodale, de la vision, etc.

La démonstration précédente reflète principalement les progrès du modèle de Wenxin dans les quatre capacités de compréhension, de génération, de logique et de mémoire, qui sont à la base de la survie de toutes les applications natives de l’IA. De même, sans une riche écologie d’applications natives de l’IA construite sur le modèle de base, un grand modèle ne vaut rien.

J’ai déclaré publiquement en mai que Baidu serait la première entreprise à restructurer tous ses produits, et que nous utiliserions la pensée de l’IA pour créer des applications natives de l’IA.

**Au cours des derniers mois, nos recherches, telles que les flux, les cartes, les disques en ligne, les bibliothèques, etc., vous rencontreront avec un nouveau look. Au cours de cette période, j’ai marché sur beaucoup de stands, et je suis prêt à partager avec vous, j’espère que vous pourrez prendre des routes moins tortueuses dans le processus de développement. **

Ensuite, je vais vous montrer à quoi ressemblent ces produits reconstruits avec de grands modèles ? Il s’agit également de développer l’imagination de chacun et d’inspirer tout le monde à créer des applications natives d’IA plus étonnantes.

La première chose que je vous montre, c’est la recherche, et c’est là que Baidu a commencé. Beaucoup de gens ont l’impression de la recherche que vous entrez un mot-clé et que Baidu vous donne un lien Web. Plus maintenant!

Baidu nouvelle recherche, lors de l’ouverture de l’interface, en plus de voir un champ de recherche, les résultats de la recherche seront complètement différents du passé.

**La nouvelle recherche reconstruite présente trois caractéristiques : une satisfaction extrême, une stimulation de la recommandation et de multiples cycles d’interaction. **

Qu’est-ce que la satisfaction ultime ? Lorsque vous tapez une question dans le champ de recherche, telle que « Qu’est-ce que le MBTI ? » « Comment se garer sur le côté », la nouvelle recherche n’est plus de vous donner un tas de liens, mais de comprendre à travers le grand modèle et de générer une meilleure réponse

Par exemple, si vous demandez « le classement de la valeur ajoutée industrielle par pays au cours des 20 dernières années », la nouvelle recherche vous donnera non seulement la réponse directement, mais affichera également la réponse avec des graphiques dynamiques.

Sur le grand écran derrière moi, je peux voir qu’au cours des deux dernières décennies, notre industrie manufacturière industrielle a connu un développement rapide et qu’elle est en train de passer d’un pays manufacturier à une puissance manufacturière.

C’est la satisfaction ultime : une étape pour vous donner la réponse ultime.

Donc, la deuxième étape, après avoir vu la réponse, que voulez-vous voir d’autre ?

C’est là que la stimulation par recommandation est utilisée. Par exemple, après le graphique dynamique, la fonction d’excitation de la recommandation donne également « quelle est la relation entre la valeur ajoutée industrielle et le PIB » et « quel est l’impact de l’industrie sur le développement de l’économie nationale » ces questions peuvent également vous préoccuper. Cliquez ici pour obtenir la réponse.

Bien sûr, tous les besoins n’ont pas une seule bonne réponse. Les besoins des utilisateurs peuvent parfois être complexes, et ce n’est pas clair en une phrase ou deux. Il est également difficile pour les utilisateurs d’exprimer pleinement une exigence très complexe à travers une grande description à la fois.

À l’heure actuelle, nous devons utiliser un modèle de recherche plus novateur et personnalisé pour servir les utilisateurs, c’est-à-dire : l’interaction multi-tours.

Jetons un coup d’œil à cet exemple :

Par exemple, si vous demandez « où est l’endroit recommandé pour faire de l’alpinisme autour de Pékin », il donne plusieurs réponses telles que la montagne Baihua et la montagne Haituo, orientées vers les itinéraires de randonnée ;

Ensuite, il donne plusieurs conseils pour compléter votre choix de situation, vous pouvez choisir entre débutants, parent-enfant et visionnage des feuilles mortes. Maintenant, il a changé pour recommander la montagne de l’Ouest et la montagne Baiwang, qui sont relativement faciles à escalader et plus conviviales pour les activités parents-enfants.

Ensuite, continuez à demander, de quel équipement avez-vous besoin pour l’alpinisme et la randonnée ? La réponse était des bâtons de randonnée, des chaussures de randonnée, etc., et il s’est également souvenu qu’il avait choisi un circuit parent-enfant plus tôt, et a surtout donné des conseils sur la façon de prendre soin des enfants.

On peut dire que l’IA générative et la recherche sont un mariage parfait.

La recherche, bien qu’elle commence toujours à partir de cette simple boîte, mais l’étape suivante, a dépassé et reconstruit le mode de recherche d’origine, a non seulement amélioré la qualité de la recherche, mais a également franchi le champ d’application de la recherche et élargi la frontière du produit. tel

La recherche interactive basée sur l’IA sera à l’origine de la transformation générationnelle de l’industrie de la recherche.

Dans un avenir proche, la recherche deviendra un assistant intime, capable d’évoquer, de résoudre des problèmes et même de briser les limites de la « fin » à tout moment, afin de répondre à tout moment, n’importe où, de répondre aux besoins et d’accompagner l’ensemble du processus.

Ensuite, jetons un coup d’œil au deuxième produit de pensée native de l’IA, Baidu GBI, Generative Business Intelligence, c’est-à-dire l’intelligence d’affaires générative. **

Il s’agit d’un produit à partir de zéro, et non d’une refactorisation d’un produit existant. **

Dans notre monde des affaires, le plus indissociable est l’analyse d’affaires, c’est-à-dire la BI, comment prendre les décisions d’affaires les plus rapides ? Ressentons d’abord à travers une vidéo :

Comme vous pouvez le voir, dans la vidéo, le président a posé une variété de questions professionnelles. Il y a l’analyse financière, la livraison de projets et l’analyse des utilisateurs, et l’assistant du président de GBI peut rapidement donner des résultats et laisser le président prendre des décisions sur place.

Il s’agit d’un outil d’aide à la décision basé sur de grandes capacités de modèle, le premier produit de business intelligence générative en Chine, Baidu GBI. Avec GBI, faites tout rapidement!

Non seulement les personnes disposant d’outils avancés ne seront pas remplacées par l’IA, mais « les promotions et les augmentations ne sont pas un rêve ». Les personnes qui n’utilisent pas d’outils avancés risquent de perdre leur emploi. **

Alors, comment Baidu GBI a-t-il pris une longueur d’avance ? Il subvertit l’analyse traditionnelle des données de trois manières :

Tout d’abord, la BI traditionnelle ne peut être utilisée que par des professionnels, tandis que GBI peut directement comprendre les questions du président et les exécuter en temps réel ;

Deuxièmement, GBI fournit une méthode d’accès pratique, les entreprises peuvent accéder aux données, poser des questions et analyser n’importe quelle donnée en langage naturel, et n’ont plus besoin d’effectuer manuellement diverses opérations professionnelles dans les bases de données et les tables ;

Troisièmement, GBI a également la capacité d’apprendre, et les entreprises peuvent injecter leur propre expertise sectorielle pour devenir des experts de l’industrie.

Il s’agit de Baidu GBI, qui peut raccourcir le travail d’analyse de données et de rédaction de rapports que les analystes commerciaux peuvent effectuer en une douzaine de jours au niveau de la minute. Les soi-disant arts martiaux du monde ne peuvent être brisés que rapidement ;

** Compétition d’entreprise, pas les gros poissons mangent les petits poissons, mais les poissons rapides mangent les poissons lents, la prise de décision plus rapide que les concurrents, il est probable que vous gagnerez! **

En parlant de prise de décision rapide, chez Baidu, nous nous appuyons sur une plateforme de bureau intelligent appelée Ruliu, et nous avons également réimaginé cette application avec l’IA.

Aujourd’hui, c’est devenu un super assistant dont les gens de Baidu ne peuvent plus se passer.

Maintenant, tout le monde s’il vous plaît voyez, c’est comme un flux qui fait un enregistrement en temps réel. Voyons s’il peut se souvenir de tous les points qui viennent d’être mentionnés :

Il s’agit de la fonction de génération en un clic des procès-verbaux de réunion. Nous disons que la façon de mener efficacement des réunions est un travail technique. Cette fonctionnalité réduit considérablement la charge de travail de la réunion et raccourcit la durée de la réunion de 40 %.

Un autre scénario courant est celui des groupes de travail. La plupart des gens sur le lieu de travail sont souvent bombardés de divers messages de discussion de groupe. Ensuite, résumer rapidement les points clés de la discussion de groupe devient une fonctionnalité extrêmement utile.

Jetons un coup d’œil à la façon dont nos chefs de produit l’utilisent.

Il dispose de 9 groupes de travail, retarde pendant un certain temps, il peut y avoir plus d’un millier d’informations non lues, et Ruliu peut non seulement « 1000 messages, obtenir la mise au point en une seconde », mais aussi diviser intelligemment le contenu qui doit être lu en plusieurs catégories: « en attente que je confirme », « se concentrer sur », « discussion sur le sujet », ce qui améliore considérablement l’efficacité du travail.

Alors, est-il affiné avec précision, sera-t-il mal compris ou manquera-t-il des informations clés ? Cela teste la capacité à comprendre et à générer de grands modèles. Plus la compréhension est profonde, plus le résumé est précis. Ne dites pas 1 000, 10 000 éléments d’information, tels que le super assistant de flux, peuvent également donner une classification intelligente et un résumé intelligent en quelques secondes.

Regardons un autre scénario au travail : les voyages.

Billets d’avion, hôtels, négociations, etc., ces tâches transactionnelles sont fastidieuses et chronophages ! Si vous aviez un assistant IA pour vous aider à résoudre des tâches triviales, aimeriez-vous travailler davantage ?

Par exemple, récemment, le chef de produit de Ruliu a prévu de se rendre à Shanghai pour rencontrer M. Wang de PICC. Nous savons que PICC promeut l’innovation dans les produits et services, les modèles commerciaux, la technologie numérique et d’autres aspects, et notre technologie d’intelligence artificielle chez Baidu peut jouer un rôle.

Cet itinéraire de voyage d’affaires peut être confié à Ruliu, le super assistant, et jetons un coup d’œil à ses performances.

Le super assistant peut organiser le voyage en fonction de ses informations d’emploi du temps.

Comme la dernière réunion se termine à 16 heures, réservez donc un vol après 19h30 ; Et, selon ses normes de voyage, l’aider à trouver des hôtels où il peut séjourner. Enfin, une invitation a été adressée au client.

Il peut avoir besoin d’un peu de contexte avant de rencontrer un client, et un super-assistant peut également l’aider à cet égard. Grâce à la connexion avec le CRM et d’autres données du système de l’entreprise, telles que le flux, des données détaillées telles que les projets de coopération et les enregistrements de visites.

En comprenant la situation de coopération commerciale et les informations externes, telles que le flux, il peut également l’aider à générer une référence de discussion, à définir les questions que le client peut poser et à donner des suggestions de coopération. De ce point de vue, Ruliu ressemble-t-il davantage à un véritable assistant ?

Nous venons de voir qu’en seulement trois mots, Ruliu a complété la réservation des bordereaux de voyage, du vin de machine et des horaires, et a même préparé des documents de référence pour la négociation, ce qui est le « voyage en un clic » de Ruliu. Comment s’y prend-il ?

Il s’agit d’une application complète de la capacité de compréhension, de génération, de logique et de mémoire d’un grand modèle, qui désassemble automatiquement les tâches complexes en plusieurs tâches simples à effectuer séparément, puis fusionne pour générer le résultat final. Nous disons que l’amélioration de l’efficacité signifie l’amélioration de la compétitivité, par exemple en laissant le « travail intelligent » remplacer le « travail acharné ».

Maintenant, jetons un coup d’œil à la nouvelle bibliothèque Baidu. C’est aussi le produit qui, je pense, a été complètement remanié jusqu’à présent. **

La bibliothèque Baidu changera complètement nos habitudes de travail, d’apprentissage et de création.

Comment avons-nous créé dans le passé ? Par exemple, disons que vous faites une présentation sur l’application de l’IA en psychologie. Il faut plusieurs jours pour vérifier les informations, trier les matériaux, écrire des manuscrits, écrire PPT et embellir PPT.

Aujourd’hui, sur Baidu Wenko, vous pouvez commencer à travailler avec une phrase, regarder le grand écran : d’abord, vous voulez qu’il écrive un discours, et il trouve des dizaines de documents sur le sujet de l’intelligence artificielle et de la psychologie.

Il peut également identifier ceux qui sont des revues universitaires, des rapports faisant autorité et ceux qui ne sont que des documents de masse. Si vous voulez écrire un article vivant, choisissez des documents populaires, tels que des essais et de la vulgarisation scientifique.

Ensuite, si vous voulez un discours académique rigoureux, vous ne pouvez vérifier que le contenu faisant autorité pour vous assurer de l’exactitude du contenu. Ensuite, en comprenant ces manuscrits, la bibliothèque produit un article bien structuré et bien défini, tout en peaufinant et en mettant en forme le contenu.

Cela peut être fait parce que Baidu Wenku a déjà 1 milliard de documents de haute qualité, basés sur la compréhension de ces contenus, écrivez des documents vraiment pratiques et clairs, plutôt que des absurdités sérieuses comme de nombreux grands modèles, et ce ne sera pas non plus un discours vide général.

Ensuite, la présentation a également besoin de PPT. La bibliothèque peut combiner le manuscrit que vous venez de faire avec certains des matériaux que vous avez collectés pour générer automatiquement le cadre du PPT, puis embellir le dessin pour en faire un PPT de plusieurs dizaines de pages.

Il existe également des fonctionnalités de jeu avec des capacités de génération multimodale, telles que la sélection de style et le changement de style en un clic. Mais il y a des endroits qui testent davantage la capacité de la bibliothèque et exigent qu’elle ait une compréhension précise du contenu. Par exemple, il a besoin de connaître la relation entre les idées, qu’elles soient juxtaposées ou subordonnées, afin de concevoir le bon graphique.

En raison de cette capacité de compréhension, la bibliothèque peut également écrire le script vocal correspondant à ce PPT sur la base de la génération de PPT. Non seulement cela, mais il peut également utiliser ce contenu pour déduire les questions que le public peut poser et vous préparer à des réponses.

Nous avons évalué que la capacité à générer des bibliothèques, en particulier PPT, dépasse de loin tout autre outil sur le marché, qu’il soit étranger ou national. Dans le passé, les gens venaient à la bibliothèque pour trouver du contenu prêt à l’emploi. À l’avenir, les gens seront en mesure de produire du contenu comme ils le souhaitent, plus efficacement que tout autre outil de productivité.

Sur la base des quatre capacités du modèle Wenxin, il n’est pas exagéré de dire que Baidu Wenku a fondamentalement révolutionné sa propre vie et achevé l’évolution des « outils de contenu » aux « outils de productivité »**.

Il n’y a pas si longtemps, le premier jour de la nouvelle version de Baidu Wenku, la nouvelle fonction d’IA a ouvert la voie à plus de 2 millions d’expériences. Maintenant, nous sommes plus confiants pour dire qu’à l’ère des grands modèles, Baidu Wenku est le meilleur point de départ pour produire du contenu.

Comme Wenku, le disque réseau Baidu est également un vieil ami familier. Au cours des 11 dernières années, le disque réseau Baidu a servi 800 millions d’utilisateurs, le volume de fichiers a atteint 4 billions et les utilisateurs téléchargent plus d’un milliard d’images chaque jour.

Dans le sens de la reconstruction de l’IA, le disque réseau Baidu se concentre sur le bon travail des services intelligents pour les fichiers personnels.

Ce que vous voyez maintenant est la nouvelle page d’accueil du disque réseau Baidu.

**Le disque réseau reconstruit réalise non seulement la transformation de l’interaction de l’interface graphique à l’interaction en langage naturel, mais améliore également la compréhension de l’information multimodale. **

Maintenant, avec une seule phrase, vous pouvez opérer sur les fichiers, les images, les vidéos, etc. dans votre lecteur en ligne.

Il s’agit du disque réseau Baidu « Cloud One », qui est le premier assistant intelligent personnel en nuage de l’industrie et même au monde. Voyons quels sont les problèmes que « Cloud One » peut résoudre et apporter de nouvelles expériences ?

Le premier point est de trouver des photos ou des vidéos. Parfois, nous pensons à une image et voulons la trouver dans le disque réseau, souvent après de nombreuses étapes, en lançant pendant une demi-journée ne peut pas être trouvée. Maintenant, vous dites un mot à « Cloud One », et cela peut vous aider à l’identifier :

Eh bien, cela m’a aidé à trouver rapidement ce que le scientifique en chef d’OpenAI, LLYA, a interviewé sur les transformateurs.

Derrière cette recherche apparemment simple se cache le rôle de multiples capacités d’IA, qui doivent être capables de comprendre le contenu vidéo, d’identifier les personnages et de former des souvenirs contextuels pour localiser avec précision une certaine image de la vidéo, ce qui est une technologie de pointe dans le domaine mondial du cloud personnel.

La deuxième fonctionnalité de Yunyi est d’aider les utilisateurs à comprendre rapidement le contenu de la vidéo, jetons un coup d’œil :

Vous pouvez voir que deux capacités sont démontrées, l’une est la capacité de résumer et de résumer le contenu, et la capacité d’extraire des phrases d’or. Il s’agit d’une interview de 43 minutes, grâce à la compréhension et à la capacité logique de l’IA, Yun Yiduo a résumé et affiné la vidéo, présentant Llya et ses idées principales.

Mais souvent, nous aurons l’impression que le texte original est très excitant, après avoir distillé l’idée principale ou le résumé, il n’est pas si attrayant, donc la deuxième fonction tout à l’heure, je pense qu’elle m’est en fait plus utile, c’est-à-dire que nous devons trouver la partie la plus excitante de la vidéo originale, qui est ces phrases d’or. Par exemple, LLYA dit que « l’apprentissage des lois statistiques est beaucoup plus important que de voir les apparences ». La percée clé dans l’extraction de cette phrase d’or est l’extraction efficace de l’information multimodale, qui est la technologie de pointe au monde. Il peut trouver les meilleures parties du long contenu de l’entretien, ce qui améliore considérablement notre apprentissage et notre efficacité au travail.

Il s’agit du nouveau disque réseau après la reconstruction de l’IA. À la date d’hier, Yunyi a atteint 20 millions d’utilisateurs.

Il s’agit d’un assistant intelligent basé sur l’IA basé sur un cloud personnel. Au cours de la dernière décennie, Baidu a défini ce que l’on appelle un disque réseau ; Au cours de la prochaine décennie, Baidu utilisera l’IA pour redéfinir de nouveaux disques réseau.

Intéressons-nous maintenant à un produit plus historique, Baidu Map. **

Nous avons reconstruit ce produit vieux de 18 ans avec une pensée native de l’IA, qui est également le premier produit cartographique natif de l’IA au monde.

Au cours des 18 dernières années, Baidu Maps a accumulé une multitude de fonctions, il peut naviguer, héler un taxi, trouver un chauffeur de remplacement, réserver un hôtel, acheter un billet et même répondre aux besoins de recherche de points d’intérêt dans des conditions plus complexes. Dans le passé, ces opérations étaient complexes et nécessitaient souvent six ou sept étapes ou plus.

Désormais, tant que l’utilisateur exprime la demande, la carte peut mobiliser des milliers d’interfaces d’API de service, et le menu à plusieurs niveaux devient une réponse directe et rapide en une seule étape.

Jetons un coup d’œil maintenant, comment Baidu Map est-il mis en œuvre ?

Dans la vidéo, les utilisateurs testent la compréhension de Baidu Map de la demande panoramique, de la sélection de points de rencontre intermédiaires, de la comparaison d’informations provenant de plusieurs endroits, ainsi que de la recommandation et de la réservation de futurs voyages, et il donne des solutions raisonnables.

En effet, la capacité de Wen Xin à parler a été fusionnée avec les connaissances uniques de la carte sur les points d’intérêt de niveau milliard et les données de perception du trafic de niveau billion, et peut être appelée à tout moment pour donner des recommandations. La carte reconstruite de Baidu n’est pas seulement une navigation, mais aussi notre guide de voyage. Plus vous êtes intelligent, plus vous êtes intelligent, plus vous vous comprenez.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Partager
Commentaire
0/400
Aucun commentaire
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)