Гол как сокол. Кому доступна информация о нас?

Дмитрий Сидорин. © / Фото: предоставлено пресс-службой Сидорин Лаб

По поводу расчеловечивания нашей жизни и «цифрового концлагеря» уже высказались многие, в том числе известные личности. Но в основном это люди, профессионально не имеющие отношения к «цифре». А что по этому поводу думают те, кто создаёт цифровую сферу нынешнего мира?

   
   

Дмитрий Сидорин, основатель «Сидорин Лаб», «Reputation Lab», «Reputation House» и образовательного центра «ЛИМУР», — один из них. Уже 10 лет он занимается управлением репутацией и, анализируя сетевое пространство, видит, как изменилась за это время цифровая оболочка нашей жизни.

Глобальная клиентская база

Марина Набатникова, АиФ.ru: Дмитрий, если раньше часто употребляли выражение «цифровой след» (человека или компании), то сейчас уже, видимо, впору говорить не о следе, а о цифровом близнеце. На ваш взгляд, большинство из нас реально оценивают объём информации о себе, которая хранится где-то в облаках?

Дмитрий Сидорин: Думаю, нет. Но нужно понимать: интернет — это глобальная клиентская база. Огромное количество данных о нас, прямых и косвенных, сохраняется в дата-центрах Майкрософт, Google, Facebook, Amazon. 

Сейчас «цифровой след» используется в маркетинге и рекламе, и к этому мы привыкли. А если цель использования данных будет иной? Единственное, что может нас всех успокоить, — данные эти всё же разрознены и слабо структурированы. 

Но вот проект единого реестра граждан России или сообщения о рейтинге граждан Китая — это уже явления, по поводу которых, на мой взгляд, стоит серьёзно насторожиться. Кто будет иметь доступ к этим данным? Какие решения будут приниматься на их основе? Решения будет принимать человек или искусственный интеллект — то есть алгоритм, созданный айтишником? 

— Во время режима ограничений были случаи, когда человек сидел дома на карантине, а ему приходил штраф за нарушение режима. Потом выяснилось, что какая-то камера чьё-то лицо опознала как его, и сказать, что камера ошиблась, никто не может. В основу системы заложено: если искусственный интеллект определяет, что это ты, с вероятностью 50%, то ты априори виновен. То есть какой-то айтишник написал какой-то алгоритм — и он теперь становится судьёй...    
   

— Это вопрос нетривиальный, потому что по законам нашей страны решение в отношении человека должен выносить человек. И когда мы получаем штрафы с камер видеонаблюдения за нарушение ПДД, то там стоит подпись какого-то сотрудника службы. Скорее всего, он в глаза не видел эту фотографию — всё сгенерировалось автоматически, но между тем нельзя сказать, что тебя признал виновным искусственный интеллект. 

Всё же где-то уже начинает принимать решение алгоритм — программа. С одной стороны, программу нельзя уличить в коррупции или предвзятости, но с другой — не понятно, кто несёт ответственность за неё. В лучшем случае так и будут говорить: «Ничего страшного — программа ошиблась. Оспорьте в суде».

Интеллект управляет нами

— Количество накопленных данных о каждом из нас — одна сторона медали. Но есть и вторая — управление нашими действиями...

— Есть алгоритм Яндекс Навигатор. Кажется, он улучшает нам жизнь. Но ты передаёшь ему часть своих данных, показывая, как ты движешься. Он тебе в ответ показывает, как движутся другие. Ты сдался ему, а он принёс пользу тебе. 

Однако в кулуарах ходят слухи, что, если в одной комнате включить Яндекс Навигатор на двух телефонах и построить маршрут в одну и ту же точку, он может направить туда разными путями. На самом деле навигатор диктует тебе, как ты должен ехать. То есть он начинает управлять нами. 

В образовании сейчас задумались: а не сделать ли какие-то такие автоматизированные траектории, когда в некую базу данных стекается вся информация о том, как ребёнок учился? А потом система ему говорит: «МГУ не для тебя. Иди-ка ты в ПТУ». И вроде как эта программа пользу принесла, чтобы ты зря не тратил время. А вдруг не пользу? Вдруг это как Яндекс Навигатор? 

То же самое касается реестра граждан: вроде полезно — будем ловить преступников. Но кто будет наблюдать за этим колоссальным массивом данных? Кому их передавать? И насколько это безопасно — собрать в один котёл и данные камер, и биометрию, и транзакции по картам, и твои посты в соцсетях — всё-всё-всё? Рано или поздно эти данные куда-то утекут. 

По-моему, не так страшно, что кто-то — Facebook или Amazon — следит за нами. Страшно, когда все эти данные соберутся в одних руках. И без интернета собирались данные о нас. Но хранились они в разных инстанциях, и не было риска, что ты весь будешь голым перед кем-то.

Ладно, пусть меня анализируют. А если мою дочку? Если данные о ней попадут к похитителям, педофилам? Поэтому я бы очень хотел знать, кто смотрит, в какую школу ходит мой ребёнок, в каких магазинах бывает, на какой площадке спортом занимается. 

Искусственный интеллект ведь не живёт сам по себе. Кто-то же за ним стоит. Хочется знать, кто это, и хочется быть уверенным в безопасности.

Фото: предоставлено пресс-службой Сидорин Лаб

Пока в зародыше

— Какой процент собранной о нас информации уже обрабатывается и используется? Где и кем чаще всего?

— Если говорить о пересечении разных типов данных из разных источников и их централизованной обработке, то это только зарождающийся процесс. Сейчас многие страны занимаются строительством ситуационных центров для этих нужд, что требует колоссальных мощностей. На мой взгляд, как обработка данных, так и их использование находятся пока в зачаточном состоянии. 

Даже в рекламных инструментах социальных сетей можно увидеть колоссальное число опций выделения определённых сегментов аудитории, но при этом в большинстве случаев используется лишь 10% этих возможностей.

— Что касается людей, то какая именно информация анализируется? Создаются коллективные портреты (потребителей, избирателей и пр.) или индивидуальные?

— Подвергнуться анализу может очень многое. Мы сталкивались с технологиями в Азии, которые распознают личность не только по лицу человека, но и по рисунку вен на руке. Анализироваться может каждый лайк, время пребывания онлайн, поведение близких и друзей. Но это не значит, что каждый из нас подвергается детальному рассмотрению. Чаще действительно выделяются обезличенные сегменты аудитории, а информация используется в целях маркетинга. При этом не исключается возможность того, что из базы данных можно достать отдельно взятого пользователя и рассмотреть его под лупой.

«Зачистка» в Сети

— В определённых кругах востребована услуга «зачистки» информации в интернете. Её действительно можно «вычистить» всю или только на общедоступном уровне?

— Мы знаем это не понаслышке. Это наш бизнес. Мы получаем тысячи таких заявок ежегодно, хотя 10 лет назад у нас было всего два клиента. Но это не такой простой вопрос. Интернет — довольно сложная экосистема уже сейчас.

Чтобы ответить на этот вопрос, нужно разобраться детальнее. Вы хотите удалить видеоролик из YouTube или пост из Facebook? Вы хотите удалить сайт в доменной зоне RU или COM? Вы хотите удалить весь сайт или одну страницу? Вы хотите именно удалить или сделать недоступным из определённой страны? Вы хотите удалить или сделать так, чтобы информацию нельзя было найти в Google? 

Вот скажите мне, Россия запретила Linkedin. Но он же вроде есть? А детская порнография или продажа оружия — её удали из интернета? 

Вроде и законы приняты, и в интернете есть право на забвение, и все согласны удалить это зло. Но что-то не выходит. Государство сказало Яндексу: «Не могу их победить. Но ты — поисковик, зеркало интернета. Пойди нам навстречу и перестань показывать их в результатах поиска». Не получается у Яндекса справиться с этой задачей на 100%, потому что он огромный, а люди перезаливают контент каждую минуту. Сегодня что-то удалили — завтра это появилось. Все шифруются аккуратно, меняют буквы местами, слова в названии. И нет гарантии, что я прямо сейчас открою Яндекс и не найду порнографию.

— То есть удалить информацию невозможно?

— Кое-что удалить можно. И за услуги по управлению репутацией платят серьёзные деньги. Но это не разовый, а ежедневный и даже ежеминутный процесс, поскольку удалённая информация может вылезать снова и снова.

То есть нет никакой гарантии, что то, что ты удалил сегодня, не появится завтра на другом или нескольких сайтах. Более того, возможно, это уже скопировано на три десятка сайтов, просто ты об этом ещё не знаешь. 

Даже если информация подпадает под 128 статью УК РФ «Клевета» и суд соглашается, что это клевета. Но виновным признаёт... кого? Автора контента? Владельца хостинга? Владельца домена? Можно ли их найти? Они вообще россияне? Очень часто ответчика нет. Сайт может быть физически расположен не здесь, и его доменная зона может не подчиняться нашей юрисдикции. 

— Легко ли отличить заказной негатив в Сети от того, который вылился в сеть естественным образом? 

— Отличить можно в 90% случаев. Помогает это сделать машинное обучение и искусственный интеллект. Если машине показать ход распространения фейковой новости на примере тысячи таких инцидентов и ход распространения естественных инфоповодов, она с высокой точностью, обучившись, будет выделять из общего потока информационную атаку. Для обученной нейросети это задача нескольких минут, но чтобы обучить машину, вам могут потребоваться дни и недели.

Каждый лайк фиксируется

— Об анализе соцсетей говорится очень много, но создаётся впечатление, что больше говорится. Насколько весома эта сфера сейчас? И какая именно информация оттуда собирается?

— Очень весома. Появились целые рынки по управлению репутацией и информационной защите. В их основе мониторинг информации в соцсетях, онлайн-СМИ. Сканируются и распознаются даже аудиопотоки радио, телевидения, YouTube и TikTok. Определяется тематика и тональность текста, собираются данные по определённым геометкам и ключевым словам. Анализируются комментарии в Instagram и YouTube. Каждый лайк фиксируется и сохраняется на долгие годы, даже если вы удалите свой аккаунт. 

В мире тысячи систем мониторинга соцсетей. У нас в России их сильно меньше: Brand Analytics, IQbuzz, Youscan, Медиалогия. Есть и государственная система — «Катюша». По некоторым оценкам, объём этого рынка только в России составляет несколько десятков миллиардов рублей. Наша выручка в год на этом — более 300 млн руб. Это не очень мало с учётом того, что сегмент нишевый.

Компания № 1 в мире, Reputation.com, в ближайшее время готовится выйти на IPO по оценке, близкой к 1 млрд долл.

— Кто пользуется результатами такого мониторинга — бизнес, госструктуры?

— Заказчик № 1 — бизнес. Например, крупный банк или ритейлер хочет знать, за что его ругают его клиенты. То есть очень благая задача — стать лучше, получать обратную связь. 

Зубные пасты, детские коляски — это всё бизнесы, о которых говорят. Мамаши обсуждают детское питание, папаши обсуждают машины. И всё это интересно сканировать компаниям, чтобы понимать, правильно ли они развиваются. И оперативно реагировать на негатив. 

У федеральных госструктур есть «Катюша». Губернаторам тоже поставлена задача следить за публикациями в интернете. Но они устанавливают кто что может. Медиалогию, например. А кто-то руками открывает ВКонтекте, Твитер, Инстаграм...

— В последнее время хорошо заметны информационные волны, которые «включаются» по щелчку, а через некоторое время так же, по щелчку, «выключаются». То есть соцсети  давно уже не социальные (равно: свободные общественные), а контролируемые каналы распространения информации. Есть ли там сегодня возможность спонтанного «расшаривания» какой-то новости?

— Действительно, инфоповоды распространяются волнобразно. Но не все волны спланированы и обдуманно созданы. Некоторые развиваются спонтанно. Сегодня интернет человекоцентричен. Люди первично знакомятся с информацией через ленту своих друзей. Это случилось как-то мгновенно — когда блогеры вдруг стали суперважны. YouTube, Instagram, Stories — всё стало покупаться, продаваться. У блогеров появились миллионы подписчиков, а самих блогеров стало очень много. Они трудно управляемы. Поэтому государство или какое-либо лицо, обладающее властью или деньгами, перестали быть уверенными, что не может что-то пойти не так. 

Боты рулят

— Иногда информационные волны становятся сюрпризом и проблемой не только для крупных компаний, но и целых государств. Волну в одном государстве могут запустить из другого государства, пользуясь единой медиасредой. Желание управлять этими волнами приводит к разговорам о создании альтернативного интернета в каждой стране. 

— Это возможно?

— Возможно, хотя и непросто. Интернет — это экосистема, которая состоит из нескольких уровней.

Первый — спутники, через которые проходит связь. Это спутники МТС, Билайна или China Mobile? Или это Илон Маск запустил свои спутники и раздаёт всем бесплатный вай-фай? Не такая это простая история — Илон Маск. Он не «народный герой», дарящий подарки. Просто Штаты получат контроль над потоком данных по всему миру.

Над спутниками, над провайдерами — следующий уровень: протокол. Как данные упакованы, как они зашифрованы? Кстати, в этом была проблема Telegram: вроде данные видны, но что там — никто не знает, потому что не может расшифровать. Где-то есть ключ. Но у кого он?

Далее, над протоколами, — устройства связи. У нас iPhone или Sumsung? Или YotaPhone?

Над гаджетами — выше уровнем — располагается операционная система. И опять-таки, это iOS, Android, или в России наконец будет своя операционная система и мы обяжем предустанавливать её на импортные гаджеты? 

Над операционной системой — куча мобильных приложений. Кто-то поставит Яндекс Карты, кто-то — Google Maps. У кого-то — Uber, у кого-то Яндекс Такси. Все эти приложения творят, что хотят, несмотря на пользовательские соглашения.

Ну, и на самой вершине этого айсберга — ВКонтакте, Facedook, Amazon, Ozon. Это суперсайты, которые знают о нас слишком много.

Вот такая огромная экосистема — интернет. И на каждом уровне нужно обеспечить независимость, контроль. Мы запускаем спутники, мы совершали попытки сделать свой телефон и протоколы данных стараемся отобрать у тех, кто нам их не даёт. 

Между тем роуминг за границей вам может обеспечивать абсолютно недружественный оператор. То есть, как только мы покинули страну и что-то отправили даже через Яндекс Почту, это прошло через спутники некоего оператора связи. И что они там с этими данными делали, мы не знаем. 

— Идёт борьба за контроль над цифровым пространством: государства — со своей стороны, корпорации — со своей. Каковы, на ваш взгляд, перспективы?

— На мой взгляд, корпорации в этой истории самые безобидные. Они хотят нам показывать рекламу и продавать товары и услуги. А вот кто и что на самом деле хочет делать с нашими данными в МФЦ ли, в налоговой ли, в кабинете министров ли или где-то в другом государстве — неизвестно. 

Да и манипуляции корпораций, подсовывающих нам свои товары, куда безобиднее, чем манипуляции идеологические. Нашумевшая история с компанией Cambridge Analytica показала нам возможности таких манипуляций. Выбираются нужные группы, им скармливаются нужные инфоповоды, и людей в группах провоцируют начать об этом говорить. Это такое косвенное, но колоссальное воздействие. У людей создаётся иллюзия, что они это сами увидели, сами полюбили и сами в это поверили.

— Для такой обработки, конечно, используются боты. Можно ли отличить их посты от тех, что пишут реальные люди?

— Иногда боты, то есть технологии искусственного интеллекта, которыми снабжены аккаунты, настолько тонкие, что определить, кто есть кто, невозможно. Эта программа заходит случайным образом, не в одно и то же время, думает, допускает ошибки, дружит, лайкает, меняет географию, геометки, всячески подражает живому человеку. В Instagram, говорят, более 30% ботов, и сам он не рад этому. Но отделить ботов от реальных людей не может.

— Если нас не прельщает перспектива жить в «цифровом концлагере», то что мы должны делать? Активно высказывать своё недовольство в соцсетях? Устраивать оффлайн-активности по этому поводу? Или просто ждать — куда повернётся?

— Думаю, соцсети в этом нам помогут. Государство сейчас вынуждено ориентироваться на человекоцентричный интернет, на то, что думают массы. Поэтому мы можем не позволить принимать очень жёсткие жёстки, до абсурда, решения. То есть сам интернет может стать инструментом воздействия на государство.