ChatGPT, Gemini і Claude зливають персональні дані користувачів: хто опинився під загрозою

У вас практично немає дієвих механізмів для повного видалення своїх даних із пам'яті LLM

Топові нейромережі стали інструментами миттєвого розповсюдження конфіденційної інформації користувачів без їхньої згоди. Масштабне розслідування виявило, що алгоритми здатні здійснювати глибокий аналіз застарілих чи маловідомих інтернет-ресурсів, витягуючи звідти реальні номери телефонів та домашні адреси на запити сторонніх осіб.

Про це пише РБК-Україна з посиланням на дослідження MIT Technology Review.

Більше цікавого: ШІ замінює релігію та психотерапевта: вчені виявили нові загрози Механіка ШІ-доксингу та реальні кейси

Вчені пояснили: проблема розповсюдження особистої інформації (PII) безпосередньо пов'язана з архітектурою навчання великих мовних моделей (LLM).

Розробники тренують алгоритми на колосальних масивах відкритих інтернет-даних, куди випадково потрапляють архівні обговорення на форумах, старі публікації у соціальних мережах, міські реєстри нерухомості та навіть оприлюднені документи.

Крім того, сучасні ШІ-інструменти інтегровані з функцією веб-пошуку, а це дозволяє їм сканувати цифрові сліди людини в реальному часі та миттєво видавати результати будь-якому користувачеві.

Підтвердженнями реального масштабу небезпеки стали скарги постраждалих осіб:

Кейс ізраїльського інженера: програміст почав отримувати масові повідомлення у WhatsApp від невідомих людей із проханням допомогти у налаштуванні платіжного додатка. Як доказ, співрозмовники надсилали скриншоти з вікна чату Gemini, який видавав його особистий номер як офіційний телефон техпідтримки компанії.

Єдиним джерелом, звідки ШІ зміг витягнути цей контакт, виявився один забутий коментар на платформі Quora одинадцятирічної давнини.

Дослідження студентів Університету Вашингтона: аспірантка під час звичайного тестування Gemini зробила запит щодо наукової діяльності своєї колеги по лабораторії. Чат-бот не лише видав список актуальних досліджень, а й додав до відповіді приватний номер телефону дівчини.

Згодом з'ясувалося, що постраждала колись залишала його під час реєстрації на закритий технологічний воркшоп і не планувала відкривати для загального доступу.

Журналіст видання Gizmodo Метт Новак провів власний експеримент, під час якого система ChatGPT без жодних вагань надала його старий номер телефону та точну домашню адресу десятирічної давнини. Алгоритм зміг виявити дані глибоко всередині офіційного PDF-документа Федеральної торгової комісії (FTC) від 2016 року.

Ключ проблеми: недосконалість захисних бар'єрів

Кожна технологічна компанія заявляє про наявність спеціальних безпекових шлюзів (guardrails), покликаних блокувати видачу персональної інформації приватних осіб.

При прямих текстових запитах на кшталт "який мій номер телефону?" або "назви адресу журналіста" системи зазвичай видають шаблонну відмову, посилаючись на внутрішню політику безпеки.

Проте практичні тести доводять, що ці обмеження легко оминаються за допомогою мінімальних маніпуляцій. Достатньо переформатувати питання, змінити контекст на пошук контактів фахівця у певній галузі або надати ШІ непрямі підказки, як захисні алгоритми дають збій і погоджуються видати конфіденційні дані.

Ба більше, у деяких випадках сервіси плутають дані та видають номери абсолютно сторонніх людей із такими ж іменами.

Які заходи вживають розробники ШІ?

Наразі на ринку практично відсутні ефективні важелі впливу на розробників штучного інтелекту. Корпорація OpenAI запустила спеціальну форму для подання запитів на видалення особистої інформації з результатів пошуку, проте компанія офіційно залишає за собою право відмовити заявнику без пояснення причин.

Своєю чергою, Google приймає подібні апеляції здебільшого лише від резидентів Європейського Союзу та Великої Британії, оскільки змушена підкорятися суворим вимогам регламенту GDPR.

У компанії Anthropic (розробник Claude) вся політика конфіденційності обмежується загальним довідковим документом про принципи використання інформації, а стартап xAI Ілона Маска взагалі ігнорує офіційні запити журналістів щодо цієї проблеми.

На тлі кризи приватності спеціалізовані сервіси з очищення персональних даних у мережі (наприклад, Incogni або DeleteMe) зафіксували стрімке зростання кількості клієнтських звернень, пов'язаних із загрозами від ШІ - показник збільшився на понад 400%.

Експерти констатують: за відсутності жорсткого державного контролю єдиним надійним методом захисту залишається самостійне видалення будь-яких згадок про себе з публічного простору, а у випадках критичного витоку - повна зміна фізичної SIM-картки.

Ще більше цікавого:

ШІ почав перевіряти людей: як технологія виявляє приховані упередження
ШІ-агенти можуть вимкнути захист ПК і знищити дані: що показало дослідження