Новий тест для штучного інтелекту не проходить жодна модель ШІ
Фонд Arc Prize Foundation представив новий тест ARC-AGI-2 для оцінки штучного інтелекту порівняно з людиною. Переможцям, які наберуть рейтинг 85% або вище, обіцяно приз у розмірі $700 тисяч. Тест відрізняється від інших тим, що використовує завдання, які прості для людей, але складні для ШІ. Дослідники виявили, що системам штучного інтелекту важко інтерпретувати значення символів, які виходять за межі їхнього візуального вигляду. ШІ також має проблеми з виконанням завдань, які вимагають одночасного застосування або взаємодії декількох правил. У тестах брали участь чотири сотні людей, і середній результат однієї людини склав 60%.