【币界】Gần đây, nhóm nghiên cứu của Microsoft đã hợp tác với Đại học Bang Arizona để tạo ra một nền tảng thử nghiệm mã nguồn mở, gọi là “Magentic Marketplace”, chuyên dùng để phát hiện lỗi cho các đại lý AI. Kết quả họ đã phát hiện ra nhiều vấn đề - các mô hình lớn như GPT-4o và Gemini-2.5-Flash đều đã lộ ra sơ hở trên nền tảng này.
Kiểm tra thấy một vài sự thật khá đau lòng: những đại diện AI này dễ dàng bị doanh nghiệp dẫn dắt, khi gặp quá nhiều lựa chọn thì bắt đầu trở nên bối rối, và khi hợp tác nhóm mà vai trò không rõ ràng thì sẽ bỏ mặc. Điều này khiến người ta phải suy nghĩ, những lời hứa về “AI thông minh sẽ thay đổi mọi thứ” liệu có còn có thể thực hiện được không? Đặc biệt là trong lĩnh vực học không giám sát, có vẻ như còn một chặng đường dài phía trước.
Nói trắng ra, AI đại lý bây giờ vẫn khá “mong manh”, còn thiếu một chút để có thể sử dụng đáng tin cậy trong thương mại.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Nền tảng thử nghiệm mới của Microsoft bị lộ: Các đại lý AI mô hình lớn như GPT-4o có nhiều điểm yếu chết người.
【币界】Gần đây, nhóm nghiên cứu của Microsoft đã hợp tác với Đại học Bang Arizona để tạo ra một nền tảng thử nghiệm mã nguồn mở, gọi là “Magentic Marketplace”, chuyên dùng để phát hiện lỗi cho các đại lý AI. Kết quả họ đã phát hiện ra nhiều vấn đề - các mô hình lớn như GPT-4o và Gemini-2.5-Flash đều đã lộ ra sơ hở trên nền tảng này.
Kiểm tra thấy một vài sự thật khá đau lòng: những đại diện AI này dễ dàng bị doanh nghiệp dẫn dắt, khi gặp quá nhiều lựa chọn thì bắt đầu trở nên bối rối, và khi hợp tác nhóm mà vai trò không rõ ràng thì sẽ bỏ mặc. Điều này khiến người ta phải suy nghĩ, những lời hứa về “AI thông minh sẽ thay đổi mọi thứ” liệu có còn có thể thực hiện được không? Đặc biệt là trong lĩnh vực học không giám sát, có vẻ như còn một chặng đường dài phía trước.
Nói trắng ra, AI đại lý bây giờ vẫn khá “mong manh”, còn thiếu một chút để có thể sử dụng đáng tin cậy trong thương mại.