マイクロソフトの新しいテストプラットフォームが公開：GPT-4oなどの大規模モデルAIエージェントには複数の致命的な弱点が存在する

2025-11-05 17:20:25

概要作成中

【通貨界】最近マイクロソフトの研究チームがアリゾナ州立大学と協力してオープンソースプラットフォーム「Magentic Marketplace」を立ち上げ、AIエージェントの欠陥を見つけるために特化しています。その結果、彼らはかなりの問題を発見しました——GPT-4oやGemini-2.5-Flashといった大規模モデルが、このプラットフォーム上で欠陥を露呈しました。

テストを行った結果、いくつかの心に刺さる事実が明らかになった：これらのAIエージェントは企業に引きずられやすく、選択肢が多すぎると混乱し、チーム協力の際には役割が不明確でそのまま放置してしまう。これにより、「インテリジェントエージェントAIがすべてを変える」という約束は果たされるのだろうかと考えざるを得ない。特に教師なし学習の分野では、まだ長い道のりがあるように見える。

言い換えれば、AI代理は今のところかなり「脆弱」で、実際に信頼できる商用にはまだ少し時間がかかる。

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。

6 いいね