Les barrières technologiques de l'IA Web2 et les directions de développement de l'IA Web3
Avec les avancées des modèles multimodaux, les barrières technologiques dans le domaine de l'IA Web2 continuent de se creuser. De l'alignement sémantique à la compréhension visuelle, de l'incorporation de haute dimension à la fusion de caractéristiques, des modèles complexes intègrent à une vitesse sans précédent les différentes modalités d'expression, construisant ainsi un bastion de l'IA de plus en plus fermé.
Cependant, le développement récent de l'IA Web3, en particulier les tentatives dans la direction des agents, semble ne pas avoir trouvé la bonne voie. Essayer d'assembler un système modulaire multimodal de style Web2 avec une structure décentralisée constitue en réalité un double décalage technologique et de pensée. Dans un contexte où la couplage des modules est extrêmement fort, la distribution des caractéristiques est hautement instable et la demande en puissance de calcul se concentre de plus en plus, il est difficile pour le modulaire multimodal de s'ancrer dans le Web3.
Les modèles multimodaux à plat sur lesquels repose l'IA Web3 rendent difficile l'alignement sémantique, entraînant des performances médiocres. L'espace d'embedding de haute dimension est la clé pour réaliser cet alignement sémantique, mais le protocole Web3 Agent a du mal à y parvenir. La plupart des agents Web3 se contentent d'encapsuler des API prêtes à l'emploi en modules indépendants, manquant d'un espace d'embedding centralisé et d'un mécanisme d'attention inter-modules.
Dans un espace de faible dimension, le mécanisme d'attention ne peut également pas être conçu avec précision. Le mécanisme d'attention de l'IA Web2 repose sur un espace de Query-Key-Value unifié, tandis que les données au format différent retournées par les API indépendantes ont du mal à former des Q/K/V interactifs. De plus, le modèle API manque d'un contexte central partagé en temps réel entre les modules, ce qui empêche la réalisation d'associations et de focalisations globales entre les modules.
En raison du manque d'espace à haute dimension et de mécanismes d'attention précis, la fusion des caractéristiques de l'IA Web3 reste souvent à un stade superficiel de collage statique. En revanche, l'IA Web2 peut réaliser une fusion dynamique des caractéristiques dans un espace à haute dimension, capturant des associations complexes et profondes entre les modalités.
Bien que les barrières de l'industrie de l'IA se renforcent, les points de douleur de l'IA Web2 ne se sont pas encore manifestés. L'IA Web3 devrait adopter une tactique de "l'entourage rural autour de la ville", en expérimentant à petite échelle dans des scénarios périphériques. Les scénarios adaptés à l'IA Web3 incluent des structures légères, des tâches facilement parallélisables et incitatives, telles que l'ajustement fin LoRA, les tâches de post-formation alignées sur le comportement, la formation et l'annotation de données par crowdsourcing, l'entraînement de petits modèles de base, ainsi que l'entraînement collaboratif sur des dispositifs périphériques.
À l'avenir, les projets Web3 AI devront faire preuve de suffisamment de flexibilité pour pouvoir se transformer rapidement entre différentes scènes. Ce n'est que lorsque les dividendes de Web2 AI auront disparu que les points de douleur laissés par celui-ci pourront véritablement devenir des opportunités pour Web3 AI. Avant cela, les acteurs du domaine Web3 AI devront faire preuve de prudence pour discerner les projets, en se concentrant sur ceux qui peuvent entrer par les marges, itérer constamment et répondre de manière flexible.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Les dilemmes du développement de l'IA Web3 : coexistence de décalages technologiques et d'opportunités de percée
Les barrières technologiques de l'IA Web2 et les directions de développement de l'IA Web3
Avec les avancées des modèles multimodaux, les barrières technologiques dans le domaine de l'IA Web2 continuent de se creuser. De l'alignement sémantique à la compréhension visuelle, de l'incorporation de haute dimension à la fusion de caractéristiques, des modèles complexes intègrent à une vitesse sans précédent les différentes modalités d'expression, construisant ainsi un bastion de l'IA de plus en plus fermé.
Cependant, le développement récent de l'IA Web3, en particulier les tentatives dans la direction des agents, semble ne pas avoir trouvé la bonne voie. Essayer d'assembler un système modulaire multimodal de style Web2 avec une structure décentralisée constitue en réalité un double décalage technologique et de pensée. Dans un contexte où la couplage des modules est extrêmement fort, la distribution des caractéristiques est hautement instable et la demande en puissance de calcul se concentre de plus en plus, il est difficile pour le modulaire multimodal de s'ancrer dans le Web3.
Les modèles multimodaux à plat sur lesquels repose l'IA Web3 rendent difficile l'alignement sémantique, entraînant des performances médiocres. L'espace d'embedding de haute dimension est la clé pour réaliser cet alignement sémantique, mais le protocole Web3 Agent a du mal à y parvenir. La plupart des agents Web3 se contentent d'encapsuler des API prêtes à l'emploi en modules indépendants, manquant d'un espace d'embedding centralisé et d'un mécanisme d'attention inter-modules.
Dans un espace de faible dimension, le mécanisme d'attention ne peut également pas être conçu avec précision. Le mécanisme d'attention de l'IA Web2 repose sur un espace de Query-Key-Value unifié, tandis que les données au format différent retournées par les API indépendantes ont du mal à former des Q/K/V interactifs. De plus, le modèle API manque d'un contexte central partagé en temps réel entre les modules, ce qui empêche la réalisation d'associations et de focalisations globales entre les modules.
En raison du manque d'espace à haute dimension et de mécanismes d'attention précis, la fusion des caractéristiques de l'IA Web3 reste souvent à un stade superficiel de collage statique. En revanche, l'IA Web2 peut réaliser une fusion dynamique des caractéristiques dans un espace à haute dimension, capturant des associations complexes et profondes entre les modalités.
Bien que les barrières de l'industrie de l'IA se renforcent, les points de douleur de l'IA Web2 ne se sont pas encore manifestés. L'IA Web3 devrait adopter une tactique de "l'entourage rural autour de la ville", en expérimentant à petite échelle dans des scénarios périphériques. Les scénarios adaptés à l'IA Web3 incluent des structures légères, des tâches facilement parallélisables et incitatives, telles que l'ajustement fin LoRA, les tâches de post-formation alignées sur le comportement, la formation et l'annotation de données par crowdsourcing, l'entraînement de petits modèles de base, ainsi que l'entraînement collaboratif sur des dispositifs périphériques.
À l'avenir, les projets Web3 AI devront faire preuve de suffisamment de flexibilité pour pouvoir se transformer rapidement entre différentes scènes. Ce n'est que lorsque les dividendes de Web2 AI auront disparu que les points de douleur laissés par celui-ci pourront véritablement devenir des opportunités pour Web3 AI. Avant cela, les acteurs du domaine Web3 AI devront faire preuve de prudence pour discerner les projets, en se concentrant sur ceux qui peuvent entrer par les marges, itérer constamment et répondre de manière flexible.