【通貨界】最近マイクロソフトの研究チームがアリゾナ州立大学と協力してオープンソースプラットフォーム「Magentic Marketplace」を立ち上げ、AIエージェントの欠陥を見つけるために特化しています。その結果、彼らはかなりの問題を発見しました——GPT-4oやGemini-2.5-Flashといった大規模モデルが、このプラットフォーム上で欠陥を露呈しました。テストを行った結果、いくつかの心に刺さる事実が明らかになった:これらのAIエージェントは企業に引きずられやすく、選択肢が多すぎると混乱し、チーム協力の際には役割が不明確でそのまま放置してしまう。これにより、「インテリジェントエージェントAIがすべてを変える」という約束は果たされるのだろうかと考えざるを得ない。特に教師なし学習の分野では、まだ長い道のりがあるように見える。言い換えれば、AI代理は今のところかなり「脆弱」で、実際に信頼できる商用にはまだ少し時間がかかる。
マイクロソフトの新しいテストプラットフォームが公開:GPT-4oなどの大規模モデルAIエージェントには複数の致命的な弱点が存在する
【通貨界】最近マイクロソフトの研究チームがアリゾナ州立大学と協力してオープンソースプラットフォーム「Magentic Marketplace」を立ち上げ、AIエージェントの欠陥を見つけるために特化しています。その結果、彼らはかなりの問題を発見しました——GPT-4oやGemini-2.5-Flashといった大規模モデルが、このプラットフォーム上で欠陥を露呈しました。
テストを行った結果、いくつかの心に刺さる事実が明らかになった:これらのAIエージェントは企業に引きずられやすく、選択肢が多すぎると混乱し、チーム協力の際には役割が不明確でそのまま放置してしまう。これにより、「インテリジェントエージェントAIがすべてを変える」という約束は果たされるのだろうかと考えざるを得ない。特に教師なし学習の分野では、まだ長い道のりがあるように見える。
言い換えれば、AI代理は今のところかなり「脆弱」で、実際に信頼できる商用にはまだ少し時間がかかる。