Ф'ючерси
Сотні безстрокових контрактів
TradFi
Золото
Одна платформа для світових активів
Опціони
Hot
Торгівля ванільними опціонами європейського зразка
Єдиний рахунок
Максимізуйте ефективність вашого капіталу
Демо торгівля
Вступ до ф'ючерсної торгівлі
Підготуйтеся до ф’ючерсної торгівлі
Ф'ючерсні події
Заробляйте, беручи участь в подіях
Демо торгівля
Використовуйте віртуальні кошти для безризикової торгівлі
Запуск
CandyDrop
Збирайте цукерки, щоб заробити аірдропи
Launchpool
Швидкий стейкінг, заробляйте нові токени
HODLer Airdrop
Утримуйте GT і отримуйте масові аірдропи безкоштовно
Launchpad
Будьте першими в наступному великому проекту токенів
Alpha Поінти
Ончейн-торгівля та аірдропи
Ф'ючерсні бали
Заробляйте фʼючерсні бали та отримуйте аірдроп-винагороди
Інвестиції
Simple Earn
Заробляйте відсотки за допомогою неактивних токенів
Автоінвестування
Автоматичне інвестування на регулярній основі
Подвійні інвестиції
Прибуток від волатильності ринку
Soft Staking
Earn rewards with flexible staking
Криптопозика
0 Fees
Заставте одну криптовалюту, щоб позичити іншу
Центр кредитування
Єдиний центр кредитування
Центр багатства VIP
Преміальні плани зростання капіталу
Управління приватним капіталом
Розподіл преміальних активів
Квантовий фонд
Квантові стратегії найвищого рівня
Стейкінг
Стейкайте криптовалюту, щоб заробляти на продуктах PoS
Розумне кредитне плече
New
Кредитне плече без ліквідації
Випуск GUSD
Мінтинг GUSD для прибутку RWA
«Ін'єкція промпта» стала головною небезпекою для ІІ-браузерів - ForkLog: криптовалюти, ІІ, сингулярність, майбутнє
Компанія OpenAI розповіла про уразливість ІІ-браузерів та заходи щодо зміцнення безпеки власного рішення — Atlas.
Фірма визнала, що атаки типу «ін'єкція промпта», які маніпулюють агентами, змушуючи їх виконувати шкідливі інструкції, є ризиком. І він не зникне найближчим часом.
Вона зазначила, що «режим агента» в Atlas «збільшує площу загрози».
Окрім стартапу Сема Альтмана, на проблему звернули увагу й інші експерти. На початку грудня Національний центр кібербезпеки Великої Британії попередив, що атаки з інтеграцією шкідливого промпту «ніколи не зникнуть». Уряд порадив кіберспеціалістам не намагатися зупинити проблему, а знижувати ризик і наслідки.
Заходи боротьби
Ін'єкція промпта — спосіб маніпулювання ШІ, коли в його вхідні дані спеціально додають текст, який змушує ігнорувати вихідні інструкції.
OpenAI повідомила про застосування проактивного циклу швидкого реагування, який показує обнадійливі результати в пошуку нових стратегій атак до їх появи «в реальних умовах».
Anthropic та Google висловлюють схожі думки. Конкуренти пропонують застосовувати багаторівневий захист і постійно проводити стрес-тести.
OpenAI використовує «автоматизованого зловмисника на базі LLM» — ІІ-бота, який навчається грати роль хакера, що шукає способи проникнення в агента зі злонаміреними промптами.
Штучний шахрай здатний протестувати експлуатацію вразливості в симуляторі, який покаже дії атакованої нейронної мережі. Потім бот вивчить реакцію, скоригує дії і здійснить другу спробу, потім третю і так далі.
Треті особи не мають доступу до інформації про внутрішнє мислення цільового ІІ. Теоретично, «віртуальний хакер» повинен знаходити вразливості швидше, ніж реальний зловмисник.
Після оновлення безпеки «режим агента» зміг виявити спробу раптової ін'єкції промпта та помітити її для юзера.
OpenAI підкреслила, що, хоча від подібного виду атаки важко захиститися надійним чином, вона спирається на масштабні тестування та швидкі цикли виправлень.
Рекомендації для користувачів
Головний дослідник з безпеки в компанії Wiz Рамі Маккарті підкреслив, що навчання з підкріпленням — один із основних способів безперервно адаптуватися до поведінки зловмисників, але це лише частина картини.
Ці дві рекомендації OpenAI надала користувачам для зниження ризику. Стартап також запропонував давати агентам конкретні інструкції, а не надавати доступ до пошти і просити «вчиняти будь-які необхідні дії».
Маккарті зазначив, що на сьогодні браузери з вбудованими ІІ-агентами не приносять достатньої користі, щоб виправдати профіль ризику.
Нагадаємо, в листопаді експерти Microsoft представили середу для тестування ІІ-агентів і виявили вразливості, властиві сучасним цифровим помічникам.