🤖 Внедрение ИИ

ИИ и персональные данные: 152-ФЗ и безопасность

Для работы ИИ с персональными данными в РФ нужно выполнить три условия: обезличить данные, выбрать правовую основу обработки и хранить трафик в РФ. Разбираем 152-ФЗ, on-premise модели и сценарии без риска утечек.

Денис Закаев, ИИ-архитектор, IDEA
Денис Закаев
ИИ-архитектор, IDEA
📅 25 июня 202610 мин👁
🤖
Короткий ответ

Для работы ИИ с персональными данными в РФ выполните три условия: используйте модель, которая физически обрабатывает данные на территории России (YandexGPT, GigaChat, on-premise), обезличивайте данные перед подачей в модель и оформите правовую основу обработки в политике конфиденциальности. Это базовый комплаенс по 152-ФЗ.

Почему это важно

ИИ-модель по своей природе работает с текстом, который часто содержит персональные данные: имена, телефоны, история клиентов. Если отправить такие данные в зарубежную облачную модель — это трансграничная передача ПД, нарушение 152-ФЗ и риск штрафа от 15 до 75 тыс. ₽ за первое нарушение, до 1 млн ₽ — за повторное.

Реальный риск не только штраф, но и потеря доверия клиентов и репутации. Один инцидент с утечкой стоит дороже, чем полное переархитектирование.

Что говорит 152-ФЗ

Федеральный закон № 152-ФЗ «О персональных данных» требует:

  • правового основания для обработки (согласие, договор, законная цель);
  • хранения данных на территории РФ (для определённых категорий);
  • обезличивания, когда это возможно;
  • защиты от несанкционированного доступа;
  • уведомления Роскомнадзора об обработке.

К ИИ применяются те же правила, что и к любой другой обработке ПД. Закон не делает исключений для машинного обучения.

Два уровня риска

УровеньЧто попадаетТребования
ВысокийФИО + паспорт, медицинские, биометрияХранение в РФ, согласие, уведомление РКН
СреднийФИО + телефон/emailСогласие, политика, обезличивание
НизкийОбезличенные данныеНе считаются ПД

Большинство бизнес-задач ИИ работают со средним уровнем — то есть достаточно согласия и обезличивания.

Способы защитить данные

1. Обезличивание перед моделью

Самый надёжный приём — заменить идентификаторы до того, как данные попадут в модель:

ЧтоЗамена
ФИО«Клиент», «Пользователь»
ТелефонХэш или маска +7 (***) ***-**-12
EmailХэш
АдресДо уровня города
Паспорт, СНИЛСНе передавать вовсе

Обезличенные данные перестают быть ПД — их можно смело отправлять куда угодно. Это снимает 90% юридических рисков.

2. On-premise модель

Модель разворачивается на ваших серверах или серверах российского провайдера. Данные не покидают периметр. Подходит для чувствительных задач: медицинские документы, юр. договоры, финансовые данные.

Российские on-premise варианты — YandexGPT Enterprise, модели на базе Llama и Qwen, развёрнутые в вашем контуре. Подробнее — в статье про выбор LLM.

3. Российские облачные модели

YandexGPT и GigaChat (Сбер) физически обрабатывают данные в РФ. Это снижает риск трансграничной передачи, но не отменяет согласия и политики. Удобно для задач, где обезличивание невозможно или дорого.

4. Маскирование через pre-processing

Pipeline до модели вырезает sensitive поля регулярками или отдельной моделью. Текст с масками идёт в основную модель, а восстанавливается уже на стороне вашего приложения.

Чек-лист комплаенса для ИИ-проекта

  • Политика конфиденциальности с упоминанием автоматизированной обработки.
  • Согласие пользователя на обработку ПД ИИ-системой (чекбокс в форме).
  • Обезличивание данных перед отправкой в облачную модель.
  • Договор с провайдером модели с обязанностью хранить данные в РФ.
  • Логи доступа к данным и аудит.
  • Назначенный ответственный за обработку ПД.

Частые ошибки

  • Отправка сырых переписок в ChatGPT «для теста». Это уже нарушение, даже без коммерческого использования.
  • Хранение истории ИИ-диалогов с ПД без политики. Любая запись в лог = обработка ПД.
  • Передача данных подрядчику без договора. Доверенная обработка должна быть оформлена письменно.
  • Игнорирование прав субъекта. Пользователь может запросить удаление своих данных из логов и базы ИИ. Процедура должна быть.

Что не является нарушением

  • Обработка обезличенных данных — не ПД.
  • Использование on-premise модели без передачи наружу.
  • Обработка публично доступных данных (ИНН компаний, не граждан).
  • Анонимизированная статистика и агрегаты.

Эти сценарии можно реализовывать без согласия и уведомлений — но безопаснее всё равно описать их в политике. Подробности про безопасную архитектуру — в материале «База знаний для ИИ», где разбираем, как хранить корпоративные данные без риска утечки.

Частые вопросы

Можно ли отправлять персональные данные в ChatGPT?
Юридически — нет, если данные российских граждан. ChatGPT обрабатывает данные за рубежом, что нарушает 152-ФЗ. Для РФ используйте YandexGPT, GigaChat или on-premise модели.
Что считается персональными данными?
Любая информация, по которой можно прямо или косвенно идентифицировать человека: ФИО, телефон, email, паспорт, IP, cookie. Даже имя + телефон — уже ПД.
Нужна ли отдельная политика конфиденциальности для ИИ?
Да, если ИИ обрабатывает ПД пользователей. В политике указывается, какие данные, для чего и где обрабатываются, кто имеет доступ.
Что такое обезличивание и помогает ли оно?
Замена идентификаторов: ФИО → «клиент», телефон → хэш. Обезличенные данные перестают быть ПД по 152-ФЗ, и их можно использовать свободнее.
Оцените материал:
0

Остались вопросы? Поможем

Эксперты IDEA ответят по теме материала или подскажут по вашему проекту. Свяжемся в течение дня, без навязывания.

Комментарии · 0