Barreiras tecnológicas da IA Web2 e direções de desenvolvimento da IA Web3
Com o avanço dos modelos multimodais, as barreiras tecnológicas no campo da IA Web2 estão se aprofundando continuamente. Desde o alinhamento semântico até a compreensão visual, desde a incorporação de alta dimensão até a fusão de características, modelos complexos estão integrando as várias formas de expressão de maneira sem precedentes, construindo uma fortaleza de IA cada vez mais fechada.
No entanto, o desenvolvimento recente da Web3 AI, especialmente as tentativas na direção de Agentes, parece não ter encontrado a direção correta. Tentar montar um sistema modular multimodal ao estilo Web2 com uma estrutura descentralizada é, na verdade, uma dupla desconexão técnica e de pensamento. Hoje, com uma forte acoplabilidade de módulos, uma distribuição de características altamente instável e uma crescente concentração de demanda de poder computacional, é difícil para a modularidade multimodal se estabelecer na Web3.
A Web3 AI é baseada em um modelo multimodal plano, dificultando a realização de alinhamento semântico, o que leva a um desempenho insatisfatório. O espaço de incorporação de alta dimensão é a chave para alcançar o alinhamento semântico, mas o protocolo Web3 Agent tem dificuldade em realizar isso. A maioria dos Web3 Agents apenas encapsula APIs prontas em módulos independentes, carecendo de um espaço de incorporação central unificado e de um mecanismo de atenção entre módulos.
No espaço de baixa dimensão, o mecanismo de atenção também não pode ser projetado de forma precisa. O mecanismo de atenção da IA do Web2 depende de um espaço unificado de Query-Key-Value, enquanto os dados em diferentes formatos retornados por APIs independentes dificultam a formação de Q/K/V interativos. Além disso, no modo API, falta um contexto central compartilhado em tempo real entre os módulos, impossibilitando a realização de associações e focos globais entre módulos.
Devido à falta de espaço de alta dimensão e de mecanismos de atenção precisos, a fusão de características da IA Web3 muitas vezes permanece na fase superficial de montagem estática. Em contraste, a IA Web2 consegue realizar fusão dinâmica de características em espaço de alta dimensão, capturando associações complexas e profundas entre diferentes modos.
Apesar de as barreiras na indústria de IA estarem a aumentar, os pontos problemáticos da IA Web2 ainda não se manifestaram. A IA Web3 deve adotar a tática de " cercar as cidades a partir do campo", testando em pequena escala em cenários de borda. Cenários adequados para a IA Web3 incluem estruturas leves, tarefas facilmente paralelizadas e incentiváveis, como ajuste fino de LoRA, tarefas de pós-treinamento de alinhamento de comportamento, treinamento e rotulagem de dados crowdsourced, treinamento de pequenos modelos básicos, bem como treinamento colaborativo em dispositivos de borda.
No futuro, os projetos de Web3 AI precisam ter flexibilidade suficiente para poderem mudar rapidamente entre diferentes cenários. Só quando os benefícios da Web2 AI desaparecerem quase por completo, as dores que ela deixou para trás poderão se tornar verdadeiras oportunidades para a Web3 AI. Antes disso, os participantes no campo da Web3 AI precisam discernir cuidadosamente os projetos, focando naqueles que conseguem entrar pela margem, iterar continuamente e responder de forma flexível.
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
Dilemas no desenvolvimento da Web3 AI: coexistência de desajustes tecnológicos e oportunidades de avanço
Barreiras tecnológicas da IA Web2 e direções de desenvolvimento da IA Web3
Com o avanço dos modelos multimodais, as barreiras tecnológicas no campo da IA Web2 estão se aprofundando continuamente. Desde o alinhamento semântico até a compreensão visual, desde a incorporação de alta dimensão até a fusão de características, modelos complexos estão integrando as várias formas de expressão de maneira sem precedentes, construindo uma fortaleza de IA cada vez mais fechada.
No entanto, o desenvolvimento recente da Web3 AI, especialmente as tentativas na direção de Agentes, parece não ter encontrado a direção correta. Tentar montar um sistema modular multimodal ao estilo Web2 com uma estrutura descentralizada é, na verdade, uma dupla desconexão técnica e de pensamento. Hoje, com uma forte acoplabilidade de módulos, uma distribuição de características altamente instável e uma crescente concentração de demanda de poder computacional, é difícil para a modularidade multimodal se estabelecer na Web3.
A Web3 AI é baseada em um modelo multimodal plano, dificultando a realização de alinhamento semântico, o que leva a um desempenho insatisfatório. O espaço de incorporação de alta dimensão é a chave para alcançar o alinhamento semântico, mas o protocolo Web3 Agent tem dificuldade em realizar isso. A maioria dos Web3 Agents apenas encapsula APIs prontas em módulos independentes, carecendo de um espaço de incorporação central unificado e de um mecanismo de atenção entre módulos.
No espaço de baixa dimensão, o mecanismo de atenção também não pode ser projetado de forma precisa. O mecanismo de atenção da IA do Web2 depende de um espaço unificado de Query-Key-Value, enquanto os dados em diferentes formatos retornados por APIs independentes dificultam a formação de Q/K/V interativos. Além disso, no modo API, falta um contexto central compartilhado em tempo real entre os módulos, impossibilitando a realização de associações e focos globais entre módulos.
Devido à falta de espaço de alta dimensão e de mecanismos de atenção precisos, a fusão de características da IA Web3 muitas vezes permanece na fase superficial de montagem estática. Em contraste, a IA Web2 consegue realizar fusão dinâmica de características em espaço de alta dimensão, capturando associações complexas e profundas entre diferentes modos.
Apesar de as barreiras na indústria de IA estarem a aumentar, os pontos problemáticos da IA Web2 ainda não se manifestaram. A IA Web3 deve adotar a tática de " cercar as cidades a partir do campo", testando em pequena escala em cenários de borda. Cenários adequados para a IA Web3 incluem estruturas leves, tarefas facilmente paralelizadas e incentiváveis, como ajuste fino de LoRA, tarefas de pós-treinamento de alinhamento de comportamento, treinamento e rotulagem de dados crowdsourced, treinamento de pequenos modelos básicos, bem como treinamento colaborativo em dispositivos de borda.
No futuro, os projetos de Web3 AI precisam ter flexibilidade suficiente para poderem mudar rapidamente entre diferentes cenários. Só quando os benefícios da Web2 AI desaparecerem quase por completo, as dores que ela deixou para trás poderão se tornar verdadeiras oportunidades para a Web3 AI. Antes disso, os participantes no campo da Web3 AI precisam discernir cuidadosamente os projetos, focando naqueles que conseguem entrar pela margem, iterar continuamente e responder de forma flexível.