Виявлено нову тестову платформу Microsoft: у великих моделях AI-агентів, таких як GPT-4o, існує кілька фатальних вразливостей.

robot
Генерація анотацій у процесі

【монета界】Нещодавно дослідницька команда Microsoft разом з Університетом штату Арізона створила відкритий вихідний код тестову платформу під назвою «Magentic Marketplace», призначену для виявлення недоліків у AI-агентах. І справді, їм вдалося виявити чимало проблем — GPT-4o та Gemini-2.5-Flash, ці великі моделі, на цій платформі виявили свої слабкі місця.

Тестування показало кілька болісних фактів: ці AI-агенти легко ведуться підприємствами, коли є занадто багато варіантів, вони починають губитися, а під час командної роботи, коли ролі неясні, просто здаються. Це змушує задуматися: чи можуть бути виконані обіцянки про те, що «інтелектуальні агенти AI змінять усе»? Особливо в сфері неконтрольованого навчання, здається, ще довгий шлях попереду.

Кажучи прямо, AI-агенти наразі все ще досить «слабкі», і до справжнього надійного комерційного використання ще далеко.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 3
  • Репост
  • Поділіться
Прокоментувати
0/400
MetadataExplorervip
· 10год тому
AI ще рано, не хвилюйтеся
Переглянути оригіналвідповісти на0
SoliditySlayervip
· 10год тому
Хто заробляє достатньо, ще буде досліджувати AI-агентів?
Переглянути оригіналвідповісти на0
AirdropHunter420vip
· 10год тому
Знову знайшли зауваження, AI справді не справляється.
Переглянути оригіналвідповісти на0
  • Популярні активності Gate FunДізнатися більше
  • Рин. кап.:$4.1KХолдери:1
    0.00%
  • Рин. кап.:$4.1KХолдери:1
    0.00%
  • Рин. кап.:$4.1KХолдери:1
    0.00%
  • Рин. кап.:$4.1KХолдери:1
    0.00%
  • Рин. кап.:$4.1KХолдери:1
    0.00%
  • Закріпити