Новости

РКН собирается развернуть мониторинг запрещённой информации при помощи ИИ

10.04.2024
Travis_Macrif

Роскомнадзор планирует вести реестр запрещённой информации с применением искусственного интеллекта. Технологию развернут на базе системы, которая анализирует и классифицирует тексты в интернете. Через два года регулятор намерен использовать ИИ для ведения реестра операторов персональных данных.

Из новой версии паспорта программы цифровой трансформации РКН следует, что ведомство с 2024 году будет формировать и вести реестр заблокированных в РФ сайтов с применением ИИ. Эту информацию содержат описания работ, связанных с единой информационной системой РКН (ЕИС) и информационной системой мониторинга интернет-ресурсов (ИС МИР). До 2023 года реестр запрещённых сайтов вели без ИИ.

ИС МИР предназначена для обнаружения текстов с запрещённой информацией, их классификации по характеру и поиска перепечаток.

В 2023 году подведомственный РКН ФГУП «Главный радиочастотный центр» опубликовал тендер на интеграцию ИС МИР с другими системами, включая ИС «Окулус», которую используют для поиска изображений и символов.

Согласно документу, в 2023 году РКН выявлял незаконный контент в интернете через три часа после публикации. В текущем году этот показатель планируют снизить до двух часов, а в 2026 году — до одного часа. Также до 2026 года регулятор намерен снизить число ошибок при выявлении признаков нарушений в СМИ до 10% против 20% в прошлом году.

Применение ИИ, а не заданных алгоритмов обработки текстов поможет сократить объём человеческих ресурсов для обслуживания системы, заявил менеджер продуктов Innostage Евгений Сурков. Он добавил, что это требует обучения ИИ-модели на выборке материалов верифицированной и контролируемой оператором системы. По словам Суркова, модель сможет работать с минимальным участием человека.

Нейросеть поможет находить сложные контекстуальные связи между текстовыми фрагментами, находить скрытые закономерности и ассоциации, отметил менеджер продукта Just AI Алексей Борщов. Эксперт указывает, что технологию можно применять для структурирования баз данных.

«Даже через два года доля выявляемого запрещённого контента, который потребует дополнительной модерации человеком, вряд ли будет ниже 60%», — прогнозирует глава департамента расследований T.Hunter Игорь Бедеров.

Он заявил о сложности оценки скорости работы системы. В 2022 году блокировка отдельных ресурсов с запрещённой информацией занимала до 50 суток.

Аналитик профильного Telegram-канала abloud62 Алексей Бойко предупреждает, что применение ИИ для наполнения реестров операторов данных на первых этапах  чревато выдачей ложных обнаружений.

Источник: https://habr.com/ru/news/806625/