【монета界】Нещодавно дослідницька команда Microsoft разом з Університетом штату Арізона створила відкритий вихідний код тестову платформу під назвою «Magentic Marketplace», призначену для виявлення недоліків у AI-агентах. І справді, їм вдалося виявити чимало проблем — GPT-4o та Gemini-2.5-Flash, ці великі моделі, на цій платформі виявили свої слабкі місця.
Тестування показало кілька болісних фактів: ці AI-агенти легко ведуться підприємствами, коли є занадто багато варіантів, вони починають губитися, а під час командної роботи, коли ролі неясні, просто здаються. Це змушує задуматися: чи можуть бути виконані обіцянки про те, що «інтелектуальні агенти AI змінять усе»? Особливо в сфері неконтрольованого навчання, здається, ще довгий шлях попереду.
Кажучи прямо, AI-агенти наразі все ще досить «слабкі», і до справжнього надійного комерційного використання ще далеко.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
6 лайків
Нагородити
6
3
Репост
Поділіться
Прокоментувати
0/400
MetadataExplorer
· 10год тому
AI ще рано, не хвилюйтеся
Переглянути оригіналвідповісти на0
SoliditySlayer
· 10год тому
Хто заробляє достатньо, ще буде досліджувати AI-агентів?
Переглянути оригіналвідповісти на0
AirdropHunter420
· 10год тому
Знову знайшли зауваження, AI справді не справляється.
Виявлено нову тестову платформу Microsoft: у великих моделях AI-агентів, таких як GPT-4o, існує кілька фатальних вразливостей.
【монета界】Нещодавно дослідницька команда Microsoft разом з Університетом штату Арізона створила відкритий вихідний код тестову платформу під назвою «Magentic Marketplace», призначену для виявлення недоліків у AI-агентах. І справді, їм вдалося виявити чимало проблем — GPT-4o та Gemini-2.5-Flash, ці великі моделі, на цій платформі виявили свої слабкі місця.
Тестування показало кілька болісних фактів: ці AI-агенти легко ведуться підприємствами, коли є занадто багато варіантів, вони починають губитися, а під час командної роботи, коли ролі неясні, просто здаються. Це змушує задуматися: чи можуть бути виконані обіцянки про те, що «інтелектуальні агенти AI змінять усе»? Особливо в сфері неконтрольованого навчання, здається, ще довгий шлях попереду.
Кажучи прямо, AI-агенти наразі все ще досить «слабкі», і до справжнього надійного комерційного використання ще далеко.