Виявлено нову тестову платформу Microsoft: у великих моделях AI-агентів, таких як GPT-4o, існує кілька фатальних вразливостей.

2025-11-05 17:20:25

Генерація анотацій у процесі

【монета界】Нещодавно дослідницька команда Microsoft разом з Університетом штату Арізона створила відкритий вихідний код тестову платформу під назвою «Magentic Marketplace», призначену для виявлення недоліків у AI-агентах. І справді, їм вдалося виявити чимало проблем — GPT-4o та Gemini-2.5-Flash, ці великі моделі, на цій платформі виявили свої слабкі місця.

Тестування показало кілька болісних фактів: ці AI-агенти легко ведуться підприємствами, коли є занадто багато варіантів, вони починають губитися, а під час командної роботи, коли ролі неясні, просто здаються. Це змушує задуматися: чи можуть бути виконані обіцянки про те, що «інтелектуальні агенти AI змінять усе»? Особливо в сфері неконтрольованого навчання, здається, ще довгий шлях попереду.

Кажучи прямо, AI-агенти наразі все ще досить «слабкі», і до справжнього надійного комерційного використання ще далеко.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.

6 лайків