マイクロソフトの新しいテストプラットフォームが公開:GPT-4oなどの大規模モデルAIエージェントには複数の致命的な弱点が存在する

robot
概要作成中

【通貨界】最近マイクロソフトの研究チームがアリゾナ州立大学と協力してオープンソースプラットフォーム「Magentic Marketplace」を立ち上げ、AIエージェントの欠陥を見つけるために特化しています。その結果、彼らはかなりの問題を発見しました——GPT-4oやGemini-2.5-Flashといった大規模モデルが、このプラットフォーム上で欠陥を露呈しました。

テストを行った結果、いくつかの心に刺さる事実が明らかになった:これらのAIエージェントは企業に引きずられやすく、選択肢が多すぎると混乱し、チーム協力の際には役割が不明確でそのまま放置してしまう。これにより、「インテリジェントエージェントAIがすべてを変える」という約束は果たされるのだろうかと考えざるを得ない。特に教師なし学習の分野では、まだ長い道のりがあるように見える。

言い換えれば、AI代理は今のところかなり「脆弱」で、実際に信頼できる商用にはまだ少し時間がかかる。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • 3
  • リポスト
  • 共有
コメント
0/400
MetadataExplorervip
· 10時間前
AIはまだ早いので心配しないでください
原文表示返信0
SoliditySlayervip
· 10時間前
誰が十分に稼いでいるのに、AI代理について研究するのだろうか
原文表示返信0
AirdropHunter420vip
· 11時間前
また見つけられた、AIは本当にダメだ
原文表示返信0
  • 人気の Gate Funもっと見る
  • 時価総額:$4.1K保有者数:1
    0.00%
  • 時価総額:$4.1K保有者数:1
    0.00%
  • 時価総額:$4.1K保有者数:1
    0.00%
  • 時価総額:$4.1K保有者数:1
    0.00%
  • 時価総額:$4.1K保有者数:1
    0.00%
  • ピン
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)