Rào cản công nghệ của Web2 AI và hướng phát triển của Web3 AI
Với sự tiến bộ của các mô hình đa phương thức, rào cản công nghệ trong lĩnh vực AI Web2 đang ngày càng sâu sắc. Từ sự đồng bộ ngữ nghĩa đến hiểu biết thị giác, từ nhúng chiều cao đến tích hợp đặc trưng, các mô hình phức tạp đang kết hợp các cách diễn đạt của các phương thức khác nhau với tốc độ chưa từng có, xây dựng một đỉnh cao AI ngày càng khép kín.
Tuy nhiên, sự phát triển gần đây của Web3 AI, đặc biệt là trong hướng Agent, dường như chưa tìm được đúng hướng. Việc cố gắng lắp ráp một hệ thống mô-đun đa phương thức theo kiểu Web2 bằng cấu trúc phi tập trung thực chất là một sự sai lệch kép về công nghệ và tư duy. Trong bối cảnh mà tính kết hợp của các mô-đun cực kỳ mạnh mẽ, phân bố đặc trưng không ổn định cao và nhu cầu tính toán ngày càng tập trung, việc áp dụng mô-đun đa phương thức trong Web3 rất khó khăn.
Web3 AI dựa trên mô hình đa phương thức phẳng, khó đạt được sự căn chỉnh ngữ nghĩa, dẫn đến hiệu suất kém. Không gian nhúng độ cao là chìa khóa để đạt được sự căn chỉnh ngữ nghĩa, nhưng giao thức Web3 Agent khó có thể đạt được điều này. Phần lớn Web3 Agent chỉ đóng gói các API có sẵn thành các mô-đun độc lập, thiếu không gian nhúng trung tâm thống nhất và cơ chế chú ý xuyên mô-đun.
Trong không gian chiều thấp, cơ chế chú ý cũng không thể được thiết kế một cách tinh vi. Cơ chế chú ý của AI Web2 dựa vào không gian Query-Key-Value đồng nhất, trong khi dữ liệu định dạng khác nhau được trả về từ API độc lập khó có thể hình thành Q/K/V có thể tương tác. Hơn nữa, trong mô hình API, thiếu ngữ cảnh trung tâm chia sẻ theo thời gian thực giữa các mô-đun, không thể đạt được sự liên kết và tập trung toàn cầu giữa các mô-đun.
Do thiếu không gian độ cao và cơ chế chú ý tinh vi, việc kết hợp đặc trưng của Web3 AI thường dừng lại ở giai đoạn ghép tĩnh nông. Ngược lại, Web2 AI có thể thực hiện việc kết hợp đặc trưng động trong không gian độ cao, nắm bắt các mối quan hệ chéo mô hình sâu sắc và phức tạp.
Mặc dù rào cản trong ngành AI đang ngày càng sâu sắc, nhưng hiện tại các điểm đau của AI Web2 vẫn chưa xuất hiện. AI Web3 nên áp dụng chiến thuật "nông thôn bao vây thành phố", thử nghiệm quy mô nhỏ ở các tình huống biên. Các tình huống phù hợp với AI Web3 bao gồm cấu trúc nhẹ, nhiệm vụ dễ song song và có thể khuyến khích, như tinh chỉnh LoRA, nhiệm vụ huấn luyện sau căn chỉnh hành vi, huấn luyện và chú thích dữ liệu crowdsourcing, huấn luyện mô hình cơ sở nhỏ, và huấn luyện hợp tác trên thiết bị biên.
Trong tương lai, các dự án Web3 AI cần có đủ tính linh hoạt để có thể chuyển đổi nhanh chóng giữa các kịch bản khác nhau. Chỉ khi lợi ích của Web2 AI gần như biến mất, những điểm đau mà nó để lại mới có thể trở thành cơ hội thực sự cho Web3 AI. Trước đó, những người tham gia trong lĩnh vực Web3 AI cần phải thận trọng trong việc phân biệt các dự án, chú ý đến những giao thức có thể tiếp cận từ biên giới, liên tục lặp lại và ứng phó linh hoạt.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Khó khăn trong phát triển Web3 AI: Công nghệ sai lệch và cơ hội đột phá đồng thời tồn tại
Rào cản công nghệ của Web2 AI và hướng phát triển của Web3 AI
Với sự tiến bộ của các mô hình đa phương thức, rào cản công nghệ trong lĩnh vực AI Web2 đang ngày càng sâu sắc. Từ sự đồng bộ ngữ nghĩa đến hiểu biết thị giác, từ nhúng chiều cao đến tích hợp đặc trưng, các mô hình phức tạp đang kết hợp các cách diễn đạt của các phương thức khác nhau với tốc độ chưa từng có, xây dựng một đỉnh cao AI ngày càng khép kín.
Tuy nhiên, sự phát triển gần đây của Web3 AI, đặc biệt là trong hướng Agent, dường như chưa tìm được đúng hướng. Việc cố gắng lắp ráp một hệ thống mô-đun đa phương thức theo kiểu Web2 bằng cấu trúc phi tập trung thực chất là một sự sai lệch kép về công nghệ và tư duy. Trong bối cảnh mà tính kết hợp của các mô-đun cực kỳ mạnh mẽ, phân bố đặc trưng không ổn định cao và nhu cầu tính toán ngày càng tập trung, việc áp dụng mô-đun đa phương thức trong Web3 rất khó khăn.
Web3 AI dựa trên mô hình đa phương thức phẳng, khó đạt được sự căn chỉnh ngữ nghĩa, dẫn đến hiệu suất kém. Không gian nhúng độ cao là chìa khóa để đạt được sự căn chỉnh ngữ nghĩa, nhưng giao thức Web3 Agent khó có thể đạt được điều này. Phần lớn Web3 Agent chỉ đóng gói các API có sẵn thành các mô-đun độc lập, thiếu không gian nhúng trung tâm thống nhất và cơ chế chú ý xuyên mô-đun.
Trong không gian chiều thấp, cơ chế chú ý cũng không thể được thiết kế một cách tinh vi. Cơ chế chú ý của AI Web2 dựa vào không gian Query-Key-Value đồng nhất, trong khi dữ liệu định dạng khác nhau được trả về từ API độc lập khó có thể hình thành Q/K/V có thể tương tác. Hơn nữa, trong mô hình API, thiếu ngữ cảnh trung tâm chia sẻ theo thời gian thực giữa các mô-đun, không thể đạt được sự liên kết và tập trung toàn cầu giữa các mô-đun.
Do thiếu không gian độ cao và cơ chế chú ý tinh vi, việc kết hợp đặc trưng của Web3 AI thường dừng lại ở giai đoạn ghép tĩnh nông. Ngược lại, Web2 AI có thể thực hiện việc kết hợp đặc trưng động trong không gian độ cao, nắm bắt các mối quan hệ chéo mô hình sâu sắc và phức tạp.
Mặc dù rào cản trong ngành AI đang ngày càng sâu sắc, nhưng hiện tại các điểm đau của AI Web2 vẫn chưa xuất hiện. AI Web3 nên áp dụng chiến thuật "nông thôn bao vây thành phố", thử nghiệm quy mô nhỏ ở các tình huống biên. Các tình huống phù hợp với AI Web3 bao gồm cấu trúc nhẹ, nhiệm vụ dễ song song và có thể khuyến khích, như tinh chỉnh LoRA, nhiệm vụ huấn luyện sau căn chỉnh hành vi, huấn luyện và chú thích dữ liệu crowdsourcing, huấn luyện mô hình cơ sở nhỏ, và huấn luyện hợp tác trên thiết bị biên.
Trong tương lai, các dự án Web3 AI cần có đủ tính linh hoạt để có thể chuyển đổi nhanh chóng giữa các kịch bản khác nhau. Chỉ khi lợi ích của Web2 AI gần như biến mất, những điểm đau mà nó để lại mới có thể trở thành cơ hội thực sự cho Web3 AI. Trước đó, những người tham gia trong lĩnh vực Web3 AI cần phải thận trọng trong việc phân biệt các dự án, chú ý đến những giao thức có thể tiếp cận từ biên giới, liên tục lặp lại và ứng phó linh hoạt.