Для работы ИИ с персональными данными в РФ выполните три условия: используйте модель, которая физически обрабатывает данные на территории России (YandexGPT, GigaChat, on-premise), обезличивайте данные перед подачей в модель и оформите правовую основу обработки в политике конфиденциальности. Это базовый комплаенс по 152-ФЗ.
Почему это важно
ИИ-модель по своей природе работает с текстом, который часто содержит персональные данные: имена, телефоны, история клиентов. Если отправить такие данные в зарубежную облачную модель — это трансграничная передача ПД, нарушение 152-ФЗ и риск штрафа от 15 до 75 тыс. ₽ за первое нарушение, до 1 млн ₽ — за повторное.
Реальный риск не только штраф, но и потеря доверия клиентов и репутации. Один инцидент с утечкой стоит дороже, чем полное переархитектирование.
Что говорит 152-ФЗ
Федеральный закон № 152-ФЗ «О персональных данных» требует:
- правового основания для обработки (согласие, договор, законная цель);
- хранения данных на территории РФ (для определённых категорий);
- обезличивания, когда это возможно;
- защиты от несанкционированного доступа;
- уведомления Роскомнадзора об обработке.
К ИИ применяются те же правила, что и к любой другой обработке ПД. Закон не делает исключений для машинного обучения.
Два уровня риска
| Уровень | Что попадает | Требования |
|---|---|---|
| Высокий | ФИО + паспорт, медицинские, биометрия | Хранение в РФ, согласие, уведомление РКН |
| Средний | ФИО + телефон/email | Согласие, политика, обезличивание |
| Низкий | Обезличенные данные | Не считаются ПД |
Большинство бизнес-задач ИИ работают со средним уровнем — то есть достаточно согласия и обезличивания.
Способы защитить данные
1. Обезличивание перед моделью
Самый надёжный приём — заменить идентификаторы до того, как данные попадут в модель:
| Что | Замена |
|---|---|
| ФИО | «Клиент», «Пользователь» |
| Телефон | Хэш или маска +7 (***) ***-**-12 |
| Хэш | |
| Адрес | До уровня города |
| Паспорт, СНИЛС | Не передавать вовсе |
Обезличенные данные перестают быть ПД — их можно смело отправлять куда угодно. Это снимает 90% юридических рисков.
2. On-premise модель
Модель разворачивается на ваших серверах или серверах российского провайдера. Данные не покидают периметр. Подходит для чувствительных задач: медицинские документы, юр. договоры, финансовые данные.
Российские on-premise варианты — YandexGPT Enterprise, модели на базе Llama и Qwen, развёрнутые в вашем контуре. Подробнее — в статье про выбор LLM.
3. Российские облачные модели
YandexGPT и GigaChat (Сбер) физически обрабатывают данные в РФ. Это снижает риск трансграничной передачи, но не отменяет согласия и политики. Удобно для задач, где обезличивание невозможно или дорого.
4. Маскирование через pre-processing
Pipeline до модели вырезает sensitive поля регулярками или отдельной моделью. Текст с масками идёт в основную модель, а восстанавливается уже на стороне вашего приложения.
Чек-лист комплаенса для ИИ-проекта
- Политика конфиденциальности с упоминанием автоматизированной обработки.
- Согласие пользователя на обработку ПД ИИ-системой (чекбокс в форме).
- Обезличивание данных перед отправкой в облачную модель.
- Договор с провайдером модели с обязанностью хранить данные в РФ.
- Логи доступа к данным и аудит.
- Назначенный ответственный за обработку ПД.
Частые ошибки
- Отправка сырых переписок в ChatGPT «для теста». Это уже нарушение, даже без коммерческого использования.
- Хранение истории ИИ-диалогов с ПД без политики. Любая запись в лог = обработка ПД.
- Передача данных подрядчику без договора. Доверенная обработка должна быть оформлена письменно.
- Игнорирование прав субъекта. Пользователь может запросить удаление своих данных из логов и базы ИИ. Процедура должна быть.
Что не является нарушением
- Обработка обезличенных данных — не ПД.
- Использование on-premise модели без передачи наружу.
- Обработка публично доступных данных (ИНН компаний, не граждан).
- Анонимизированная статистика и агрегаты.
Эти сценарии можно реализовывать без согласия и уведомлений — но безопаснее всё равно описать их в политике. Подробности про безопасную архитектуру — в материале «База знаний для ИИ», где разбираем, как хранить корпоративные данные без риска утечки.

Комментарии · 0