Microsoft'un yeni test platformu ortaya çıktı: GPT-4o ve diğer büyük model AI ajanlarının bir dizi ölümcül zayıflığı var.

2025-11-05 17:20:25

Abstract generation in progress

【coin界】Son zamanlarda Microsoft'un araştırma ekibi, Arizona Eyalet Üniversitesi ile birlikte bir açık kaynak test platformu oluşturdu, adı “Magentic Marketplace”, AI ajanlarının hatalarını bulmak için özel olarak tasarlandı. Sonuç olarak, gerçekten de birçok sorunu tespit ettiler - GPT-4o ve Gemini-2.5-Flash gibi büyük modeller bu platformda zayıf noktalarını gösterdi.

Testlerin ardından birkaç acı gerçeği keşfettim: Bu AI ajanları kolayca işletmeler tarafından yönlendirilmekte, çok fazla seçenekle karşılaştıklarında kafaları karışmakta ve ekip çalışması sırasında roller belirsizleştiğinde doğrudan boş vermekte. Bu, insanı düşündürüyor; “akıllı ajan AI her şeyi değiştirecek” vaadi gerçekten yerine getirilebilir mi? Özellikle denetimsiz öğrenme konusunda, görünüşe göre daha kat edecek çok yol var.

Kısacası, AI ajansı şu anda oldukça “kırılgan” ve gerçekten güvenilir ticari kullanıma henüz yeterince hazır değil.

View Original

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

6 Likes