Данная статья посвящена трансформации подходов к безопасности данных в условиях развития искусственного интеллекта и больших языковых моделей. Автор отмечает, что традиционная парадигма, основанная на конфиденциальности, целостности и доступности, уже недостаточна. Вместо этого предлагается расширенное понимание безопасности, включающее такие аспекты, как достоверность, реальность, адекватность и даже вредоносность данных. Отдельное внимание уделяется безопасности источников данных, где ключевым становится вопрос контролируемости. Комплексный анализ данных и их источников важен для построения более надежных и адаптивных информационных систем.
Олег Босенко
Независимый эксперт
Привычное всем понимание безопасности данных сразу обращает нас к защите ИТ-инфраструктуры, антивирусным программам, системам и средствам защиты от атак, средствам контроля, поведенческого анализа и еще многому, интересному для специалистов. Сложившийся за десятилетия триумвират "конфиденциальность, целостность, доступность" привычен и понятен как специалистам информационной безопасности, так и большему числу работников информационной сферы.
Но появление больших языковых моделей, внедрение решений с заявленным искусственным интеллектом, усиленное стремление к достижению AGI реально формирует запрос на модернизацию подхода к безопасности. Речь идет о новом, расширенном взгляде на безопасность данных и источников данных.
Что такое данные?
Данные – это основа информации. Именно они лежат в основе формирования наших оценок и решений. Чем шире внедряются информационные решения, тем острее стоит вопрос не только их защищенности, но и иных аспектов – реальности, достоверности и других немаловажных характеристик. В комплексном рассмотрении этих аспектов и кроется подход к новому пониманию безопасности данных и безопасности источников данных.
Проектирование и внедрение информационных решений на основе такого подхода позволят существенно усилить безопасность информационных процессов, сформировать по-настоящему безопасную информационную среду, минимизировать риски внедрения технологий искусственного интеллекта как в экономике, так и в обществе.
Характеристики безопасности данных и безопасности источников данных
Какие составляющие применительно к данным или источникам данных характеризуют их безопасность? Постараемся ответить на этот вопрос.
Безопасность данных
Начнем с безопасности данных. Обратите внимание на рис. 1. Первое, что приходит в голову, – защищенность. Защищенность в контексте информационной безопасности, то есть защита от внешних атак, несанкционированного воздействия и т.д. и т.п. Собственно говоря, привычный набор – конфиденциальность, целостность, доступность и раскрывается в защищенности.
Защищенность крайне важна, но этим не исчерпывается безопасность в современном мире.
Второй важный аспект безопасности данных – адекватность данных, то есть полнота представления информации в требуемом направлении информационного процесса. Проще говоря, нехватка данных существенно снижает безопасность всего решения, поскольку влияет на конечную цель информационного процесса – формирование управленческого, финансового, производственного решения или предоставление услуги, сервиса.
Третий аспект безопасности данных – это достоверность. Истинное, а не ложное представление информации. В настоящее время риск недостоверности сильно вырос в связи с распространением галлюцинаций языковых моделей. И главная опасность здесь заключается в отсутствии у пользователя информации, на каких ресурсах обучалась та или иная модель.
Четвертый важный аспект безопасности данных – их реальность. В отличие от достоверности реальность данных заключается в их соответствии информационному процессу по времени, а также в отсутствии возможности сторонней модификации данных.
И пятый аспект безопасности данных – их вредоносность, как бы странно это ни звучало. Но это есть, хотя об этом и не очень принято говорить в сообществе. Данные сами по себе могут нести деструктив как в информационном, так и в психологическом плане.
Безопасность источников данных
Перейдем к безопасности источников данных (рис. 2). Почти тот же набор характеристик, за небольшим исключением: нет достоверности, но появилась контролируемость. Но главное – различается содержательное наполнение аспектов.
Защищенность источников данных – первый и наиболее привычный из аспектов. Он включает в себя набор информационной безопасности во всей динамике ее развития.
А вот второй аспект – адекватность имеет несколько отличное от предыдущей трактовки наполнение. В контексте источников данных адекватность – это соответствие набора источников данных обеспечиваемому информационному процессу.
Реальность источников данных, третий аспект, в контексте безопасности один из основных. Его смысл в обеспечении необходимого для информационного процесса потока данных в реальном времени, в соответствии с сиюминутной информационной картиной.
Новый четвертый аспект – контролируемость дает ответ на вопрос, насколько контролируем с точки зрения безопасности источник данных. Особенно это актуально при предоставлении или приобретении облачных услуг у внешних провайдеров. Не секрет, что облачные сервисы недружественных государств присутствуют на отечественном рынке, и, соответственно, их контролируемость со знаком "минус" при применении резко снижает безопасность всего информационного процесса.
И наконец, пятый аспект – вредоносность. И здесь на первый план для анализа выходят три составляющие. Одна из них – не создан ли источник данных для распространения недостоверной, проще говоря, ложной информации. Другая составляющая – не подвержен ли источник данных галлюцинациям, искажениям данных. И в заключение – не является ли источник данных местом распространения вредоносного программного обеспечения.
Несколько слов о том, куда исчезла достоверность при рассмотрении источников данных. Те моменты, которые относятся к достоверности при рассмотрении источников данных, должны анализироваться при оценке реальности и контролируемости источников данных. Реально существующий, а не фантомный источник данных достоверен самим фактом своего существования. Простым языком – он есть и его не надо выдумывать. А вот его наполнение данными требует анализа достоверности.
Приведу также небольшое пояснение, почему контролируемость применяется не к анализу данных, а только к их источникам. Данные существуют только на источнике данных (ЦОД, сервер, ноутбук, контроллер и т.д.). Именно источник является объектом контроля. Поэтому контролируемость – характеристика источника данных.
Корректировка подхода к планированию информационных процессов и построению информационных систем на основе безопасности данных
Основное изменение в подходе к планированию информационных процессов на основе безопасности данных – комплексный анализ по всем составляющим характеристик данных: защищенности, адекватности, достоверности, реальности, вредоносности. Переходя к источникам данных, к указанному перечню добавляется анализ контролируемости источников данных. Комплексный анализ позволяет получить целостную картину и реализовать новый, непривычный для нашего рынка взгляд на безопасность: учесть при формировании решения по безопасности доверие к источникам данных, реальность самих данных, их защищенность от мошенничества и иных негативных модификаций, проанализировать риски размещения на ресурсах различной степени контролируемости.
При этом комплексное рассмотрение вышеуказанных характеристик позволяет гибко адаптировать решение под потребности и возможности организаций и компаний. Безопасность информационного процесса получает не просто расширенное толкование, но и новый уровень реализации. Выход на этот уровень позволит снизить затраты за счет заложенного в решения высокого доверия к данным и источникам данных. В качестве прикладного эффекта – снизить, а при правильном анализе исключить возможность штрафных санкций за неправомерное использование данных.
Заключение
Развитие информационных технологий, расширяющееся внедрение нейросетей, решений на базе искусственного интеллекта требует серьезного внимания к данным, которые имеются и создаются в таких информационных решениях. Обратив внимание на новое толкование безопасности данных, приняв за основу, что безопасность – это не только защищенность, можно выстраивать именно безопасные решения, которые позволят двигать развитие в позитивном направлении.
Иллюстрации предоставлены автором.
Иллюстрация к новости сгенерирована нейросетью Kandinsky