Le grand modèle réinterprète "China Speed". Depuis que Baidu a lancé le premier produit de type GPT en Chine en mars de cette année, en seulement trois mois, 79 grands modèles avec une échelle de paramètres de plus d'un milliard ont été produits en Chine.
Le « China Artificial Intelligence Large-scale Model Map Research Report » fournit également une autre perspective d'observation : le nombre total de modèles à grande échelle à usage général publiés par les États-Unis et la Chine a représenté 80 % des versions mondiales. Il est clair que les entreprises technologiques en Chine et aux États-Unis deviennent les principaux moteurs de cette révolution générative de l'IA qui balaie le monde.
Le camp commun d'Open AI et de Microsoft a créé un certain nombre de scénarios d'atterrissage d'applications de niveau de référence dans les domaines de l'éducation, de la banque d'investissement et du travail de bureau, tels que l'Office Family Bucket, qui est connu comme le roi des bombes, l'IA formation de la plateforme d'apprentissage des langues Duolingo, et de Morgan Stanley Les centaines de milliers de pages de base de connaissances, et les dernières solutions pour la plateforme de services de paiement Stripe pour lutter contre la fraude. Ces boîtiers d'atterrissage couvrent à la fois le côté B et le côté C. En revanche, la bataille pour la vitesse de lancement des modèles domestiques à grande échelle vient de se terminer et les applications commerciales à grande échelle sont toujours en cours.
Cette section de la route est extrêmement difficile, mais cruciale. Robin Li, PDG de Baidu, a souligné lors d'une récente réunion que "le point clé de la nouvelle stratégie de concurrence internationale n'est pas le nombre de grands modèles dont dispose un pays, mais le nombre d'applications d'IA natives sur vos grands modèles, et combien ces applications ont amélioré la production. l'efficacité."
Selon des informations publiques, Wenxinyiyan, qui est à l'avant-garde, a lancé 11 modèles industriels à grande échelle, couvrant plusieurs domaines B tels que l'automobile, l'énergie et l'électricité.
A cette époque, qui peut commencer le premier coup du grand modèle à l'application C est devenu un centre d'attention. Notez qu'il s'agit de "l'anneau" sur l'application commerciale, pas de "l'impression" au niveau PPT.
Source : "Rapport de recherche sur la carte grand modèle de l'intelligence artificielle en Chine"
Du point de vue des utilisateurs finaux C, "NoNoise" estime qu'il existe des opportunités dans les domaines de l'éducation et de la recherche : l'éducation va sans dire qu'il n'est pas difficile de voir à partir des ventes à chaud de matériel terminal tel que les machines d'apprentissage IA, il est pas difficile de voir que le groupe qui n'a qu'à payer pour les gros modèles , il faut être parent ; comme pour la recherche, le nouveau Bing avec GPT peut faire dire fièrement à la PDG de Microsoft Nadella que c'est Microsoft qui a fait « danser » Google, ce qui montre à quel point le grand modèle laisse place à l'imagination pour la recherche, et il s'agit du plus grand scénario d'application d'IA au monde.
Dans le même temps, Baidu, qui entrevoit cette perspective, travaille aussi sans relâche sur "l'alchimie" jour et nuit. Grâce au lancement intensif de produits d'IA générative tels que "AI Partner", Baidu espère accélérer la recherche dans une nouvelle ère et continuer à maintenir sa position de leader du marché.
Voici la question, recherchera-t-elle le premier coup d'application à grande échelle de grands modèles?
01 Plusieurs vérités derrière le champ de recherche
Avant de répondre à cette question, nous devons définir la nature de la relation entre la recherche et les grands modèles.
Après la naissance de ChatGPT, une voix croyait que Google, Baidu et d'autres géants de la recherche seraient renversés et que l'IA ouverte changerait la donne pour la recherche.
Le représentant le plus célèbre est le co-fondateur de Microsoft, Bill Gates. Il a prédit au début de l'année que les meilleures entreprises d'IA travailleront à l'avenir sur des assistants personnels d'IA et que les utilisateurs n'iront plus jamais sur les sites Web de recherche et sur Amazon. Bien que Gates ait eu des doutes sur les capacités techniques d'Open AI avant septembre 2019, il a également été critiqué par Musk pour sa "compréhension très limitée de l'IA".
Les géants de la recherche à l'intérieur ont clairement un point de vue différent. "Je pense que cela devrait renforcer la position de Baidu, car bon nombre des problèmes que ChatGPT doit résoudre sont les problèmes que la recherche doit résoudre, et leurs objectifs sont les mêmes." Dans une récente interview intitulée "New Wise Chief Time", Baidu Xiao Yang, vice-président et responsable de la plateforme de recherche, a fait son propre jugement. Depuis qu'il a rejoint Baidu en 2004, Xiao Yang a été témoin du développement de 20 ans de l'industrie de la recherche.
Du point de vue de l'évolution, le moteur de recherche est né pour résoudre le problème de l'efficacité de l'acquisition d'informations, offrant aux utilisateurs le chemin le plus court entre la question et la réponse. Auparavant, des tâches de récupération similaires étaient effectuées par des outils d'information tels que "Encyclopedia Britannica" et Internet Yellow Pages jusqu'à l'émergence d'algorithmes.
Les algorithmes permettent aux moteurs de recherche d'avoir naturellement des gènes d'IA, car le prérequis pour que les machines effectuent des tâches est de "comprendre" les besoins derrière le champ de recherche.
C'est juste qu'à différentes étapes, les méthodes d'appariement des informations sont différentes.
Prenons l'exemple de l'entrée de Xiao Yang dans l'industrie en 2004. À cette époque, les moteurs de recherche étaient encore à l'ère de la récupération de mots-clés : les utilisateurs devaient taper des mots-clés dans le champ de recherche, comme rechercher des livres dans une bibliothèque, puis trouver des correspondances précises. en changeant constamment les mots clés du contenu de la page Web.
À cette époque, le PM de Baidu Search organisait également des concours en interne, essayant de trouver des moyens de trouver plus rapidement des informations ciblées.
Plus tard, les besoins des utilisateurs sont devenus de plus en plus forts, de la recherche par mot-clé à la pose de questions, et la recherche a évolué vers une correspondance asymétrique, c'est-à-dire que lorsque les utilisateurs posent des questions, les moteurs de recherche donnent des réponses similaires à la consultation d'experts. Par exemple, si un utilisateur demande "Quel temps fera-t-il demain ?", la réponse peut être "Orage avec vents forts à court terme". Il n'y a aucun mot-clé qui recoupe la question dans cette réponse.
Ce mode de correspondance nécessite que les moteurs de recherche aient une "compréhension" plus approfondie à la fois de la question de l'utilisateur et du contenu de l'ensemble du réseau.
Cela explique probablement pourquoi en 2013, Baidu, Google et Microsoft ont tous participé à l'offre d'achat de la société du professeur Jeff Hinton, le "père du deep learning" coûte que coûte.
À cette époque, le professeur Hinton venait de faire une percée majeure dans la technologie des réseaux de neurones profonds, et le géant de la recherche a été le premier groupe d'entreprises à sentir le potentiel de la technologie - l'apprentissage en profondeur devrait améliorer l'efficacité de la recherche. Avec le recul, la recherche a également fourni le premier scénario d'atterrissage d'application pour l'apprentissage en profondeur. Baidu et Google ont été les premiers géants de la technologie à déployer l'apprentissage en profondeur, et Baidu Brain et Google Brain sont ensuite devenus les principales plateformes ouvertes d'IA.
Photo : Jeff Hinton
À partir de 2018 et 2019 environ, l'apprentissage en profondeur a inauguré un autre cycle de développement rapide, et la transformation sémantique des moteurs de recherche continue d'évoluer. Les grands modèles linguistiques des géants de la recherche tels que Google et Baidu deviennent de plus en plus gros, et les capacités des modèles deviennent de plus en plus fortes, et le prototype d'un moteur de recherche intelligent a pris forme. En prenant Baidu comme exemple, il a lancé Wenxin Large Model 1.0 en 2019 et a continué à itérer vers les versions 2.0 et 3.0 depuis lors.
C'est sur la base de ces accumulations qu'après la sortie de ChatGPT, Google et Baidu ont pu lancer bientôt Bard et Wenxinyiyan. Les produits modèles à grande échelle qui semblent se développer du jour au lendemain vers le monde extérieur sont en fait le produit d'années de pratiques commerciales du géant de la recherche.
Après avoir été privé de la vedette par ChatGPT, le PDG de Google, Sundar Pichai, a déclaré dans une interview : "En fait, nous avons des modèles d'IA depuis plus de dix ans."
Le fondateur, président et chef de la direction de Baidu, Li Yanhong, a également souligné à plusieurs reprises dans des discours publics que, quelle que soit l'entreprise, il est impossible de créer un si grand modèle linguistique (Wen Xin Yi Yan) en quelques mois. "L'apprentissage en profondeur et le traitement du langage naturel nécessitent des années de persévérance et d'accumulation, et il n'y a aucun moyen de l'accélérer."
02 Changements dans la recherche
Les moteurs de recherche se sont développés à ce jour et sont devenus le plus grand scénario d'application d'IA et le modèle commercial réussi au monde.
Du point de vue de l'évolution technologique, il semble difficile de conclure que la recherche a été subvertie par les grands modèles. Si la recherche au sens étroit n'est qu'un "champ de recherche", la recherche au sens large est un processus d'expression de l'utilisateur et de rétroaction de la machine, tandis que les champs de recherche et les boîtes de dialogue ne sont que différentes formes d'interaction homme-ordinateur.
C'est également la logique sous-jacente à la raison pour laquelle Xiao Yang a déclaré que GPT et les moteurs de recherche avaient les mêmes objectifs. Même un grand modèle placera le moteur de recherche principal dans une position plus favorable dans le paysage concurrentiel, car la recherche a un effet Matthew - les entreprises avec plus d'utilisateurs, de technologie, de données et de puissance de calcul auront de meilleurs effets sur les produits.
Il n'est pas déraisonnable que seuls quatre pays au monde, les États-Unis, la Chine, la Russie et la Corée du Sud, disposent de moteurs de recherche locaux. En tant qu'infrastructure Internet, il est difficile pour les retardataires de renverser le modèle. Bien sûr, l'UE ne croit toujours pas au mal.En 2022, elle a dépensé 58 millions de yuans pour essayer de construire son propre moteur de recherche ouvert pour remplacer Google.Il n'y a pas encore d'autres informations.
Le grand modèle de base a également des caractéristiques similaires, et ceux qui courent devant courront de plus en plus vite. "Baidu a la recherche d'une part, et un modèle à grande échelle ou une technologie d'IA générative de l'autre. C'est comme tenir l'épée Yitian et le sabre du dragon en même temps. La combinaison de deux épées produira une plus grande valeur." cet arrêt. , Xiao Yang a également admis que les meilleurs moteurs de recherche ne pouvaient pas être relâchés dans la concurrence à cause de cela, et devraient apporter des changements rapides à l'expérience utilisateur.
"En fait, c'est très simple. Si vous satisfaites l'utilisateur, l'utilisateur restera. Si vous faites sentir à l'utilisateur que vous pouvez le satisfaire, de nouveaux utilisateurs viendront. Si vous le rendez insatisfait, il partira."
Pour reprendre les mots de Li Yanhong : Ne freinez jamais l'expression des besoins des utilisateurs de quelque manière que ce soit.
La mise à niveau de l'expression de la demande des utilisateurs ne peut être satisfaite que par la mise à niveau de la technologie. Avant l'émergence de l'IA générative, la façon dont les utilisateurs expriment leurs besoins est devenue de plus en plus riche et diversifiée, avec des expressions plus familières et floues et une demande croissante de recherches d'informations sur les images et les vidéos.
À cet égard, les géants des moteurs de recherche ont renforcé les capacités intermodales sur la base de modèles de raisonnement sémantique, similaires au dernier GPT-4.
L'émergence de grands modèles linguistiques a également amené les moteurs de recherche à un stade plus intelligent - ils peuvent écouter et lire, et comprendre de plus en plus les utilisateurs. Les gens plaisantaient : Google peut vous donner 100 000 réponses, mais un bibliothécaire peut vous donner la réponse la plus précise. Aujourd'hui, les grands modèles permettent aux moteurs de recherche de résoudre davantage les problèmes et commencent à évoluer vers une expérience de génération de recherche généralisée.
De la dernière série de voies explorées par le leader de l'industrie Baidu, nous pouvons voir les débuts de cette tendance évolutive.
En "roulant" lui-même, Baidu a augmenté la proportion de "satisfaction extrême" pour rechercher des OKR internes invisibles.
La soi-disant satisfaction extrême consiste à voir si la première réponse donnée par le moteur de recherche peut résoudre votre problème après que l'utilisateur a posé une question.
La première réponse n'est pas seulement sous forme de texte, mais aussi sous forme de vidéo, et le moteur de recherche peut extraire le résumé clé d'une vidéo. Par exemple, lorsque les parents veulent trouver une bande dessinée d'art qui apprend aux enfants à dessiner, ils passent du temps à parcourir, filtrer, juger et résumer. Désormais, Baidu Search peut trier plusieurs réponses pour les utilisateurs et marquer le nombre de fois où chaque réponse est mentionnée.Chaque réponse contient également un contenu plus riche, ce qui économise considérablement l'énergie des parents.
Une autre exploration intéressante est la "réponse faisant autorité". Après l'émergence de ChatGPT, les gens ont été choqués et ont rapidement découvert qu'il parlerait également de bêtises de manière sérieuse. L'existence d'une "illusion" informatique remet en question l'authenticité de certains contenus. La nouvelle fonction de recherche Baidu peut répondre directement aux questions en citant des livres pour accroître la confiance.
Lorsque vous posez une certaine question, le moteur de recherche peut vous indiquer dans quel livre cette question a été écrite, suivie d'une lecture plus approfondie, ce qui équivaut au rôle d'un bibliothécaire à l'ère de l'IA.
Xiao Yang a révélé que la recherche Baidu avait prêté attention aux données de « satisfaction extrême » : il y a six mois, la proportion de « première satisfaction » n'était que de 40 % ; maintenant, elle a atteint 70 %. Et à en juger par les changements de données, les utilisateurs sont prêts à payer pour l'amélioration de l'expérience de recherche - depuis cette année, la recherche Baidu a ajouté plus de 50 millions de nouvelles questions et réponses chaque jour.
Dans le cadre du changement intergénérationnel de la recherche, le "partenaire IA" qui peut écouter et voir a également pris une place importante. Baidu a démontré pour la première fois sa capacité à tester en interne des "partenaires IA" lors de la Mobile Ecology Conference fin mai de cette année.
Dans l'affichage de démonstration sur site, il ne s'agit pas seulement d'une interface de dialogue de chatbot, mais aide également les utilisateurs à marquer les points clés des réponses, à fournir des sources faisant autorité, à résumer les résumés de documents et à prendre en charge l'appel de divers outils et services, ainsi que créer des images ou rédaction selon les intentions de l'utilisateur .
Il est entendu que ce "partenaire IA" est encore en test interne, et de nombreux besoins des utilisateurs ont surpris les ingénieurs. Il est prévu que les capacités du "partenaire IA" continueront d'évoluer à l'avenir.
Cependant, si l'avenir entrera dans l'ère des assistants personnels de l'IA prédite par Bill Gates, cela dépendra en fin de compte du degré d'intégration des moteurs de recherche et des grands modèles. Ce chemin est plein de défis, mais aussi pavé d'or par l'imagination.
03 NOUVELLE HISTOIRE
Lors d'un échange médiatique l'année dernière, Xiao Yang a un jour évoqué une question : pour quoi se battre lorsque la recherche est menée jusqu'au bout ?
Il est reconnu dans l'industrie que la recherche est l'une des activités les plus difficiles dans le domaine Internet. Il s'agit d'un simple champ de recherche, et il peut également s'agir d'un système très ouvert. Mais le marché n'a jamais manqué de challengers. Au cours des deux dernières années, Byte, Huawei, etc. ont activement déployé des activités connexes. À cette époque, ChatGPT n'avait pas encore apporté de changements perturbateurs.
La réponse de Xiao Yang à l'époque était qu'en fin de compte, il devait se battre pour sa compréhension des utilisateurs, son investissement dans la technologie et sa capacité à atteindre le nec plus ultra en matière de recherche. De nos jours, l'intelligence des grands modèles émerge, permettant à chacun de voir en même temps la direction ultime - chercher à générer de l'expérience, et même aider à la prise de décision.
Ces évolutions continuent à leur tour d'inspirer de nouveaux besoins des utilisateurs.
Le grand modèle donne également à Baidu Search une nouvelle histoire. Auparavant, Baidu n'était qu'un "point de départ" pour les besoins. Après avoir obtenu des informations, les utilisateurs se rendaient sur d'autres sites Web ou applications pour obtenir des scénarios de service, tels que le commerce électronique, la vie locale ou la création de contenu.
Afin d'améliorer la valeur du service, Baidu a successivement enrichi l'écologie du contenu de recherche grâce à la mise en page de petits programmes, Baijiahao et d'autres produits, dans l'espoir de permettre aux utilisateurs de résoudre les problèmes en un seul arrêt et de profiter de services en boucle fermée. En regardant l'industrie mondiale de la recherche, cette disposition stratégique écologique a une valeur de premier plan.
Cependant, avant l'émergence de modèles à grande échelle, il faudra plus de temps et de patience pour compléter la boucle fermée écologique idéale, car les produits-outils ont pour défis l'adhérence de l'utilisateur et la durée de séjour.
Le grand modèle accélère la formation d'une boucle fermée, qui traverse tout le processus de poser des questions, de trouver des réponses et de prendre des décisions, et le moteur de recherche gagne ainsi une plus grande imagination commerciale. C'est probablement la valeur commerciale des soi-disant "deux épées combinées".
Il est presque prévisible qu'après avoir intégré des applications plus innovantes de l'intelligence artificielle, les moteurs de recherche puissent créer un écosystème plus dynamique.
À en juger par « l'arsenal » et la « feuille de route » que Baidu et d'autres entreprises ont intensivement déployés cette année, les principaux acteurs de la recherche ne seront probablement pas renversés, mais continueront à promouvoir le changement technologique en tant qu'acteur majeur de l'innovation de rupture.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Lorsque le grand modèle tombe au sol, la recherche est le roi du rouleau en premier
Source originale : NoNoise
Le grand modèle réinterprète "China Speed". Depuis que Baidu a lancé le premier produit de type GPT en Chine en mars de cette année, en seulement trois mois, 79 grands modèles avec une échelle de paramètres de plus d'un milliard ont été produits en Chine.
Le « China Artificial Intelligence Large-scale Model Map Research Report » fournit également une autre perspective d'observation : le nombre total de modèles à grande échelle à usage général publiés par les États-Unis et la Chine a représenté 80 % des versions mondiales. Il est clair que les entreprises technologiques en Chine et aux États-Unis deviennent les principaux moteurs de cette révolution générative de l'IA qui balaie le monde.
Le camp commun d'Open AI et de Microsoft a créé un certain nombre de scénarios d'atterrissage d'applications de niveau de référence dans les domaines de l'éducation, de la banque d'investissement et du travail de bureau, tels que l'Office Family Bucket, qui est connu comme le roi des bombes, l'IA formation de la plateforme d'apprentissage des langues Duolingo, et de Morgan Stanley Les centaines de milliers de pages de base de connaissances, et les dernières solutions pour la plateforme de services de paiement Stripe pour lutter contre la fraude. Ces boîtiers d'atterrissage couvrent à la fois le côté B et le côté C. En revanche, la bataille pour la vitesse de lancement des modèles domestiques à grande échelle vient de se terminer et les applications commerciales à grande échelle sont toujours en cours.
Cette section de la route est extrêmement difficile, mais cruciale. Robin Li, PDG de Baidu, a souligné lors d'une récente réunion que "le point clé de la nouvelle stratégie de concurrence internationale n'est pas le nombre de grands modèles dont dispose un pays, mais le nombre d'applications d'IA natives sur vos grands modèles, et combien ces applications ont amélioré la production. l'efficacité."
Selon des informations publiques, Wenxinyiyan, qui est à l'avant-garde, a lancé 11 modèles industriels à grande échelle, couvrant plusieurs domaines B tels que l'automobile, l'énergie et l'électricité.
A cette époque, qui peut commencer le premier coup du grand modèle à l'application C est devenu un centre d'attention. Notez qu'il s'agit de "l'anneau" sur l'application commerciale, pas de "l'impression" au niveau PPT.
Du point de vue des utilisateurs finaux C, "NoNoise" estime qu'il existe des opportunités dans les domaines de l'éducation et de la recherche : l'éducation va sans dire qu'il n'est pas difficile de voir à partir des ventes à chaud de matériel terminal tel que les machines d'apprentissage IA, il est pas difficile de voir que le groupe qui n'a qu'à payer pour les gros modèles , il faut être parent ; comme pour la recherche, le nouveau Bing avec GPT peut faire dire fièrement à la PDG de Microsoft Nadella que c'est Microsoft qui a fait « danser » Google, ce qui montre à quel point le grand modèle laisse place à l'imagination pour la recherche, et il s'agit du plus grand scénario d'application d'IA au monde.
Dans le même temps, Baidu, qui entrevoit cette perspective, travaille aussi sans relâche sur "l'alchimie" jour et nuit. Grâce au lancement intensif de produits d'IA générative tels que "AI Partner", Baidu espère accélérer la recherche dans une nouvelle ère et continuer à maintenir sa position de leader du marché.
Voici la question, recherchera-t-elle le premier coup d'application à grande échelle de grands modèles?
01 Plusieurs vérités derrière le champ de recherche
Avant de répondre à cette question, nous devons définir la nature de la relation entre la recherche et les grands modèles.
Après la naissance de ChatGPT, une voix croyait que Google, Baidu et d'autres géants de la recherche seraient renversés et que l'IA ouverte changerait la donne pour la recherche.
Le représentant le plus célèbre est le co-fondateur de Microsoft, Bill Gates. Il a prédit au début de l'année que les meilleures entreprises d'IA travailleront à l'avenir sur des assistants personnels d'IA et que les utilisateurs n'iront plus jamais sur les sites Web de recherche et sur Amazon. Bien que Gates ait eu des doutes sur les capacités techniques d'Open AI avant septembre 2019, il a également été critiqué par Musk pour sa "compréhension très limitée de l'IA".
Les géants de la recherche à l'intérieur ont clairement un point de vue différent. "Je pense que cela devrait renforcer la position de Baidu, car bon nombre des problèmes que ChatGPT doit résoudre sont les problèmes que la recherche doit résoudre, et leurs objectifs sont les mêmes." Dans une récente interview intitulée "New Wise Chief Time", Baidu Xiao Yang, vice-président et responsable de la plateforme de recherche, a fait son propre jugement. Depuis qu'il a rejoint Baidu en 2004, Xiao Yang a été témoin du développement de 20 ans de l'industrie de la recherche.
Les algorithmes permettent aux moteurs de recherche d'avoir naturellement des gènes d'IA, car le prérequis pour que les machines effectuent des tâches est de "comprendre" les besoins derrière le champ de recherche.
C'est juste qu'à différentes étapes, les méthodes d'appariement des informations sont différentes.
Prenons l'exemple de l'entrée de Xiao Yang dans l'industrie en 2004. À cette époque, les moteurs de recherche étaient encore à l'ère de la récupération de mots-clés : les utilisateurs devaient taper des mots-clés dans le champ de recherche, comme rechercher des livres dans une bibliothèque, puis trouver des correspondances précises. en changeant constamment les mots clés du contenu de la page Web.
À cette époque, le PM de Baidu Search organisait également des concours en interne, essayant de trouver des moyens de trouver plus rapidement des informations ciblées.
Plus tard, les besoins des utilisateurs sont devenus de plus en plus forts, de la recherche par mot-clé à la pose de questions, et la recherche a évolué vers une correspondance asymétrique, c'est-à-dire que lorsque les utilisateurs posent des questions, les moteurs de recherche donnent des réponses similaires à la consultation d'experts. Par exemple, si un utilisateur demande "Quel temps fera-t-il demain ?", la réponse peut être "Orage avec vents forts à court terme". Il n'y a aucun mot-clé qui recoupe la question dans cette réponse.
Ce mode de correspondance nécessite que les moteurs de recherche aient une "compréhension" plus approfondie à la fois de la question de l'utilisateur et du contenu de l'ensemble du réseau.
Cela explique probablement pourquoi en 2013, Baidu, Google et Microsoft ont tous participé à l'offre d'achat de la société du professeur Jeff Hinton, le "père du deep learning" coûte que coûte.
À cette époque, le professeur Hinton venait de faire une percée majeure dans la technologie des réseaux de neurones profonds, et le géant de la recherche a été le premier groupe d'entreprises à sentir le potentiel de la technologie - l'apprentissage en profondeur devrait améliorer l'efficacité de la recherche. Avec le recul, la recherche a également fourni le premier scénario d'atterrissage d'application pour l'apprentissage en profondeur. Baidu et Google ont été les premiers géants de la technologie à déployer l'apprentissage en profondeur, et Baidu Brain et Google Brain sont ensuite devenus les principales plateformes ouvertes d'IA.
À partir de 2018 et 2019 environ, l'apprentissage en profondeur a inauguré un autre cycle de développement rapide, et la transformation sémantique des moteurs de recherche continue d'évoluer. Les grands modèles linguistiques des géants de la recherche tels que Google et Baidu deviennent de plus en plus gros, et les capacités des modèles deviennent de plus en plus fortes, et le prototype d'un moteur de recherche intelligent a pris forme. En prenant Baidu comme exemple, il a lancé Wenxin Large Model 1.0 en 2019 et a continué à itérer vers les versions 2.0 et 3.0 depuis lors.
C'est sur la base de ces accumulations qu'après la sortie de ChatGPT, Google et Baidu ont pu lancer bientôt Bard et Wenxinyiyan. Les produits modèles à grande échelle qui semblent se développer du jour au lendemain vers le monde extérieur sont en fait le produit d'années de pratiques commerciales du géant de la recherche.
Après avoir été privé de la vedette par ChatGPT, le PDG de Google, Sundar Pichai, a déclaré dans une interview : "En fait, nous avons des modèles d'IA depuis plus de dix ans."
Le fondateur, président et chef de la direction de Baidu, Li Yanhong, a également souligné à plusieurs reprises dans des discours publics que, quelle que soit l'entreprise, il est impossible de créer un si grand modèle linguistique (Wen Xin Yi Yan) en quelques mois. "L'apprentissage en profondeur et le traitement du langage naturel nécessitent des années de persévérance et d'accumulation, et il n'y a aucun moyen de l'accélérer."
02 Changements dans la recherche
Les moteurs de recherche se sont développés à ce jour et sont devenus le plus grand scénario d'application d'IA et le modèle commercial réussi au monde.
Du point de vue de l'évolution technologique, il semble difficile de conclure que la recherche a été subvertie par les grands modèles. Si la recherche au sens étroit n'est qu'un "champ de recherche", la recherche au sens large est un processus d'expression de l'utilisateur et de rétroaction de la machine, tandis que les champs de recherche et les boîtes de dialogue ne sont que différentes formes d'interaction homme-ordinateur.
C'est également la logique sous-jacente à la raison pour laquelle Xiao Yang a déclaré que GPT et les moteurs de recherche avaient les mêmes objectifs. Même un grand modèle placera le moteur de recherche principal dans une position plus favorable dans le paysage concurrentiel, car la recherche a un effet Matthew - les entreprises avec plus d'utilisateurs, de technologie, de données et de puissance de calcul auront de meilleurs effets sur les produits.
Il n'est pas déraisonnable que seuls quatre pays au monde, les États-Unis, la Chine, la Russie et la Corée du Sud, disposent de moteurs de recherche locaux. En tant qu'infrastructure Internet, il est difficile pour les retardataires de renverser le modèle. Bien sûr, l'UE ne croit toujours pas au mal.En 2022, elle a dépensé 58 millions de yuans pour essayer de construire son propre moteur de recherche ouvert pour remplacer Google.Il n'y a pas encore d'autres informations.
Le grand modèle de base a également des caractéristiques similaires, et ceux qui courent devant courront de plus en plus vite. "Baidu a la recherche d'une part, et un modèle à grande échelle ou une technologie d'IA générative de l'autre. C'est comme tenir l'épée Yitian et le sabre du dragon en même temps. La combinaison de deux épées produira une plus grande valeur." cet arrêt. , Xiao Yang a également admis que les meilleurs moteurs de recherche ne pouvaient pas être relâchés dans la concurrence à cause de cela, et devraient apporter des changements rapides à l'expérience utilisateur.
"En fait, c'est très simple. Si vous satisfaites l'utilisateur, l'utilisateur restera. Si vous faites sentir à l'utilisateur que vous pouvez le satisfaire, de nouveaux utilisateurs viendront. Si vous le rendez insatisfait, il partira."
Pour reprendre les mots de Li Yanhong : Ne freinez jamais l'expression des besoins des utilisateurs de quelque manière que ce soit.
La mise à niveau de l'expression de la demande des utilisateurs ne peut être satisfaite que par la mise à niveau de la technologie. Avant l'émergence de l'IA générative, la façon dont les utilisateurs expriment leurs besoins est devenue de plus en plus riche et diversifiée, avec des expressions plus familières et floues et une demande croissante de recherches d'informations sur les images et les vidéos.
À cet égard, les géants des moteurs de recherche ont renforcé les capacités intermodales sur la base de modèles de raisonnement sémantique, similaires au dernier GPT-4.
L'émergence de grands modèles linguistiques a également amené les moteurs de recherche à un stade plus intelligent - ils peuvent écouter et lire, et comprendre de plus en plus les utilisateurs. Les gens plaisantaient : Google peut vous donner 100 000 réponses, mais un bibliothécaire peut vous donner la réponse la plus précise. Aujourd'hui, les grands modèles permettent aux moteurs de recherche de résoudre davantage les problèmes et commencent à évoluer vers une expérience de génération de recherche généralisée.
De la dernière série de voies explorées par le leader de l'industrie Baidu, nous pouvons voir les débuts de cette tendance évolutive.
En "roulant" lui-même, Baidu a augmenté la proportion de "satisfaction extrême" pour rechercher des OKR internes invisibles.
La première réponse n'est pas seulement sous forme de texte, mais aussi sous forme de vidéo, et le moteur de recherche peut extraire le résumé clé d'une vidéo. Par exemple, lorsque les parents veulent trouver une bande dessinée d'art qui apprend aux enfants à dessiner, ils passent du temps à parcourir, filtrer, juger et résumer. Désormais, Baidu Search peut trier plusieurs réponses pour les utilisateurs et marquer le nombre de fois où chaque réponse est mentionnée.Chaque réponse contient également un contenu plus riche, ce qui économise considérablement l'énergie des parents.
Lorsque vous posez une certaine question, le moteur de recherche peut vous indiquer dans quel livre cette question a été écrite, suivie d'une lecture plus approfondie, ce qui équivaut au rôle d'un bibliothécaire à l'ère de l'IA.
Xiao Yang a révélé que la recherche Baidu avait prêté attention aux données de « satisfaction extrême » : il y a six mois, la proportion de « première satisfaction » n'était que de 40 % ; maintenant, elle a atteint 70 %. Et à en juger par les changements de données, les utilisateurs sont prêts à payer pour l'amélioration de l'expérience de recherche - depuis cette année, la recherche Baidu a ajouté plus de 50 millions de nouvelles questions et réponses chaque jour.
Dans le cadre du changement intergénérationnel de la recherche, le "partenaire IA" qui peut écouter et voir a également pris une place importante. Baidu a démontré pour la première fois sa capacité à tester en interne des "partenaires IA" lors de la Mobile Ecology Conference fin mai de cette année.
Dans l'affichage de démonstration sur site, il ne s'agit pas seulement d'une interface de dialogue de chatbot, mais aide également les utilisateurs à marquer les points clés des réponses, à fournir des sources faisant autorité, à résumer les résumés de documents et à prendre en charge l'appel de divers outils et services, ainsi que créer des images ou rédaction selon les intentions de l'utilisateur .
Il est entendu que ce "partenaire IA" est encore en test interne, et de nombreux besoins des utilisateurs ont surpris les ingénieurs. Il est prévu que les capacités du "partenaire IA" continueront d'évoluer à l'avenir.
Cependant, si l'avenir entrera dans l'ère des assistants personnels de l'IA prédite par Bill Gates, cela dépendra en fin de compte du degré d'intégration des moteurs de recherche et des grands modèles. Ce chemin est plein de défis, mais aussi pavé d'or par l'imagination.
03 NOUVELLE HISTOIRE
Lors d'un échange médiatique l'année dernière, Xiao Yang a un jour évoqué une question : pour quoi se battre lorsque la recherche est menée jusqu'au bout ?
Il est reconnu dans l'industrie que la recherche est l'une des activités les plus difficiles dans le domaine Internet. Il s'agit d'un simple champ de recherche, et il peut également s'agir d'un système très ouvert. Mais le marché n'a jamais manqué de challengers. Au cours des deux dernières années, Byte, Huawei, etc. ont activement déployé des activités connexes. À cette époque, ChatGPT n'avait pas encore apporté de changements perturbateurs.
La réponse de Xiao Yang à l'époque était qu'en fin de compte, il devait se battre pour sa compréhension des utilisateurs, son investissement dans la technologie et sa capacité à atteindre le nec plus ultra en matière de recherche. De nos jours, l'intelligence des grands modèles émerge, permettant à chacun de voir en même temps la direction ultime - chercher à générer de l'expérience, et même aider à la prise de décision.
Le grand modèle donne également à Baidu Search une nouvelle histoire. Auparavant, Baidu n'était qu'un "point de départ" pour les besoins. Après avoir obtenu des informations, les utilisateurs se rendaient sur d'autres sites Web ou applications pour obtenir des scénarios de service, tels que le commerce électronique, la vie locale ou la création de contenu.
Afin d'améliorer la valeur du service, Baidu a successivement enrichi l'écologie du contenu de recherche grâce à la mise en page de petits programmes, Baijiahao et d'autres produits, dans l'espoir de permettre aux utilisateurs de résoudre les problèmes en un seul arrêt et de profiter de services en boucle fermée. En regardant l'industrie mondiale de la recherche, cette disposition stratégique écologique a une valeur de premier plan.
Cependant, avant l'émergence de modèles à grande échelle, il faudra plus de temps et de patience pour compléter la boucle fermée écologique idéale, car les produits-outils ont pour défis l'adhérence de l'utilisateur et la durée de séjour.
Le grand modèle accélère la formation d'une boucle fermée, qui traverse tout le processus de poser des questions, de trouver des réponses et de prendre des décisions, et le moteur de recherche gagne ainsi une plus grande imagination commerciale. C'est probablement la valeur commerciale des soi-disant "deux épées combinées".
Il est presque prévisible qu'après avoir intégré des applications plus innovantes de l'intelligence artificielle, les moteurs de recherche puissent créer un écosystème plus dynamique.
À en juger par « l'arsenal » et la « feuille de route » que Baidu et d'autres entreprises ont intensivement déployés cette année, les principaux acteurs de la recherche ne seront probablement pas renversés, mais continueront à promouvoir le changement technologique en tant qu'acteur majeur de l'innovation de rupture.