Штучний інтелект стає "дурнішим"? Microsoft знайшла слабкість у ChatGPT та Gemini
Чат-боти на базі штучного інтелекту втрачають надійність та частіше припускаються помилок під час тривалих розмов.
Про це повідомляє РБК-Україна з посиланням на результати спільного дослідження Microsoft Research та Salesforce, опубліковані Windows Central.
Читайте також: Чи забере ШІ вашу роботу? В мережі завірусився сайт-прогноз для всіх професій
Деталі дослідженняУ межах роботи дослідники проаналізували понад 200 000 діалогів із найсучаснішими моделями, серед яких GPT-4, Gemini, Claude та DeepSeek.
З’ясувалося, що під час виконання однієї команди моделі демонструють успішність у 90%, проте в багатоходових діалогах цей показник падає до 65%.
Хоча загальна придатність моделей до роботи знижується лише на 15%, їхня ненадійність зростає на 112%. Навіть моделі з додатковими токенами для "мислення", такі як o3 та DeepSeek R1, не змогли уникнути цих проблем.
Причини збоїв ШІДослідники виділили кілька ключових факторів, що впливають на якість відповідей.
Передчасна генерація - чат-боти намагаються надати рішення ще до того, як користувач завершить пояснення завдання.
Ефект "фундаменту" - ШІ використовує свою першу відповідь як основу для наступних, навіть якщо початкова інформація була помилковою.
Роздуття відповідей - у тривалих розмовах текст стає на 20–300% довшим, що провокує більше припущень та галюцинацій, які потім сприймаються моделлю як постійний контекст.
Мілітаризація штучного інтелектуНагадаємо, використання технологій штучного інтелекту стає все більш значущим фактором у глобальній політиці та безпеці.
Нещодавно РБК-Україна писало, що Пентагон вимагає від розробників створювати ШІ без "моральних обмежень", аби не програти у технологічних перегонах.
Водночас протистояння між світовими лідерами загострюється - США та Китай ведуть запеклу технологічну війну за домінування у сфері розробки нейромереж. При цьому обидві країни відмовилися підписати міжнародну декларацію щодо відповідального використання ШІ у військовій сфері.
Окрему увагу привертає практичне застосування технологій, зокрема у збройних конфліктах. Зокрема, Пентагон активно вивчає досвід України щодо використання дронів з підтримкою штучного інтелекту на полі бою.