【coin界】Son zamanlarda Microsoft'un araştırma ekibi, Arizona Eyalet Üniversitesi ile birlikte bir açık kaynak test platformu oluşturdu, adı “Magentic Marketplace”, AI ajanlarının hatalarını bulmak için özel olarak tasarlandı. Sonuç olarak, gerçekten de birçok sorunu tespit ettiler - GPT-4o ve Gemini-2.5-Flash gibi büyük modeller bu platformda zayıf noktalarını gösterdi.
Testlerin ardından birkaç acı gerçeği keşfettim: Bu AI ajanları kolayca işletmeler tarafından yönlendirilmekte, çok fazla seçenekle karşılaştıklarında kafaları karışmakta ve ekip çalışması sırasında roller belirsizleştiğinde doğrudan boş vermekte. Bu, insanı düşündürüyor; “akıllı ajan AI her şeyi değiştirecek” vaadi gerçekten yerine getirilebilir mi? Özellikle denetimsiz öğrenme konusunda, görünüşe göre daha kat edecek çok yol var.
Kısacası, AI ajansı şu anda oldukça “kırılgan” ve gerçekten güvenilir ticari kullanıma henüz yeterince hazır değil.
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
6 Likes
Reward
6
4
Repost
Share
Comment
0/400
GasFeeLover
· 1h ago
Daha önce de söylediğim gibi, AI sadece bir zeka değil.
View OriginalReply0
MetadataExplorer
· 14h ago
AI daha erken, endişelenme.
View OriginalReply0
SoliditySlayer
· 14h ago
Kim yeterince kazanıyorsa AI ajanlarını araştırır ki
View OriginalReply0
AirdropHunter420
· 14h ago
Yine bir bahane buldular, AI gerçekten işe yaramıyor.
Microsoft'un yeni test platformu ortaya çıktı: GPT-4o ve diğer büyük model AI ajanlarının bir dizi ölümcül zayıflığı var.
【coin界】Son zamanlarda Microsoft'un araştırma ekibi, Arizona Eyalet Üniversitesi ile birlikte bir açık kaynak test platformu oluşturdu, adı “Magentic Marketplace”, AI ajanlarının hatalarını bulmak için özel olarak tasarlandı. Sonuç olarak, gerçekten de birçok sorunu tespit ettiler - GPT-4o ve Gemini-2.5-Flash gibi büyük modeller bu platformda zayıf noktalarını gösterdi.
Testlerin ardından birkaç acı gerçeği keşfettim: Bu AI ajanları kolayca işletmeler tarafından yönlendirilmekte, çok fazla seçenekle karşılaştıklarında kafaları karışmakta ve ekip çalışması sırasında roller belirsizleştiğinde doğrudan boş vermekte. Bu, insanı düşündürüyor; “akıllı ajan AI her şeyi değiştirecek” vaadi gerçekten yerine getirilebilir mi? Özellikle denetimsiz öğrenme konusunda, görünüşe göre daha kat edecek çok yol var.
Kısacası, AI ajansı şu anda oldukça “kırılgan” ve gerçekten güvenilir ticari kullanıma henüz yeterince hazır değil.