В 2011 году консалтинговая фирма McKinsey предрекла цифровой бум — массовое использование аналитики, углубление потребительского опыта, улучшение здравоохранения, страхования. И сумасшедший рост выручки тех компаний, кто первым в своём сегменте решится на использование технологий больших данных.

В 2016 году банки знают о нас больше, чем супруги. Они знают, что мы покупаем и где бываем. Откуда? Из миллиардов транзакций, совершаемых ежесекундно. Они предлагают программы лояльности, чтобы знать ещё больше.

Никакая база данных розничной сети магазинов не сравнится с платёжной информацией банка. Человек ушёл в другое место, но расплачивается той же картой. Банки шлют электронные письма и предлагают купить книгу на любимом сайте или авиабилеты в период наших отпусков — об этом они тоже узнают, когда мы оплачиваем перелет и рассчитываемся вне мест, где обычно тратим деньги.

Самые умные идут дальше. Они предлагают индивидуальную программу лояльности для каждого клиента, которую формируют на основе его личных предпочтений. Ещё немного и, кажется, они будут знать, о чём мы думаем.

Самые хитрые зарабатывают больше. Они заманивают клиентов индивидуальными акциями в магазины-партнеры и берут за это деньги. Ещё немного и, кажется, мы получим из банка SMS «закончилась зубная паста, заскочи в ближайший супермаркет — цена сегодня ниже на 10%".

Хотя, о чём я. Это будет сообщение в WhatsApp с номера вашей жены. Про неё они тоже все знают.

Некоторые банки предлагают одеть фитнес-браслет Jawbone UP и с каждым взмахом руки перечислять на специальный счёт определенную сумму. Чем больше двигаетесь, тем больше откладываете на депозит. Только не забудьте снять браслет перед утренним марафоном, чтобы не остаться к обеду без денег на карте.

Продвинутые страховые компании — Oscar и John Hancock — тоже предлагают клиентам носить фитнес-браслеты. Так они оценивают риски для здоровья на основе данных о пройденном расстоянии, интенсивности и виде нагрузок. Страховщикам это выгодно — когда человек проходит хотя бы 8 тысяч шагов в день, он чувствует себя лучше, реже болеет и, если повезёт, проживёт дольше. Страховая компания выплатит меньше компенсаций и больше заработает.

Big Data — это здорово. Масса информации, которую мы создаём каждый день, совершая покупки, общаясь в социальных сетях, просматривая страницы сайтов и просто гуляя по парку, позволяет узнать, что именно мы хотим сейчас или будем хотеть потом. Эта масса информации ведёт нас за руку в потребительский рай.

Big Data — это великая сила. Как у любой великой силы, у неё есть и тёмная сторона. Давайте взглянем на 3 грани светлого будущего больших данных и узнаем, что скрывается на изнанке.

Мы будем получать только нужное и интересное

Представьте: вы совершаете еженедельную вылазку в супермаркет и не мучаетесь, составляя накануне список покупок. Личный цифровой помощник — Siri или Cortana — анализирует данные о ваших предшествующих походах в магазин и составляет «потребительскую корзину». А затем ведёт по залу, подсвечивая нужные товары в режиме дополненной реальности на полках и витринах. Фантастика? Даже не кажется таковой — эти технические решения доступны уже сегодня, осталось только смешать их в один коктейль.

Маркетинговое агентство OgilvyOne подготовило чудный видеоролик «A Day In Big Data» о том, как новые технологии работы с информацией изменят повседневный быт людей в ближайшем будущем. Нам будут предлагать еду, которую мы хотим, одежду, которая точно понравится, маршруты для прогулок, где будет интересно.

Звучит многообещающе для потребителей. Ещё лучше звучит для экономики, которая на них держится.

Но что делать, если вы не хотите, чтобы о вас знали так много? Или покупая шоколадный маффин в кафе вы автоматически соглашаетесь на «обработку персональных данных и их передачу третьим лицам, в том числе в рекламных целях, на бессрочной основе»?

Важно иметь право и возможность ограничивать поток данных о себе. Это ответственность каждого из нас за то, что сообщил миру.

Мы будем лучше понимать, что и почему происходит

Наличие множества источников информации о событиях и объектах позволяет изучить их с разных сторон. Больше данных — больше шансов построить истинную картину происходящего и понять связь между причинами и следствиями.

Переработав массив информации о продажах в продуктовом магазине, мы поймём, когда приходит больше покупателей и какие овощи разбирают в первую очередь. Узнаем зависимость спроса от времени суток и дня недели. Правильно спланируем поставки товаров на склад и выгрузку на полки в торговом зале.

В интернете кочует миф о руководителях сети супермаркетов Wal-Mart, которые анализировали покупки в своих магазинах. Они соединили данные о держателях карт лояльности (возраст, семейное положение и профессия покупателей) и отчёты кассовых аппаратов (что и когда было продано). Wal-Mart узнал очевидные вещи — тот, кто покупает джин, берет и тоник с лимоном в придачу. Но кое-что оказалось странным: в пятницу вечером молодые мужчины покупали подгузники и… пиво. Когда Wal-Mart переставил пиво ближе к подгузникам, продажи и тех и других взлетели.

Это действительно миф, о его происхождении публике Даниэль Пауэр (Daniel Power) рассказывал тут. Оригинальная история случилась в 1992 году, когда не только о больших данных никто не слышал, но даже о датамайнинге говорили шёпотом. Но этот миф наглядно показывает, как большие данные позволяют совершать удивительные открытия о связи между явлениями. Если бы мифическое руководство Wal-Mart дополнительно использовало сведения о маршрутах передвижения автомобилей своих клиентов (тайком купив её у Tesla) или о геолокационных отметках покупателей на фотографиях шашлыков в Instagram, они бы узнали, что молодые родители брали пиво с собой, когда выезжали с детьми на пикник. Мифический датамайнинг позволил такую закономерность установить, а пиво — продать. Реальный работает точно так же.

При анализе данных важно использовать надежные источники и задавать правильные вопросы. Иначе неизбежен уход в сторону от верного решения из-за опоры на массив нерелевантных данных, неважно насколько большой. Пока информации мало, мы тщательно подходим к её изучению — она просто лучше укладывается в нашем ограниченном сознании. А когда данных станет больше? Будем ли мы достаточно скептичны или под давлением неперевариваемых объёмов информации превратимся в оракулов, гадающих на алтаре программных комплексов?

Важно продолжать сомневаться. Это ответственность тех, кто информацию обрабатывает.

Нас будут лучше охранять

В 2008 году пожарная служба Лондона применила аналитический комплекс, чтобы построить карту вероятности возникновения возгораний и провести профилактические мероприятия, которые путём обычного последовательного обхода всех домов заняли бы 50 лет. Использовалась информация об уровне жизни, образовании и доходах 7,5 миллиона человек в 3,2 миллионах домохозяйств на площади в 1,5 тыс. квадратных километров, о протяжённости и покрытии дорог, уровне преступности и качестве инфраструктуры. Гигантские объёмы с одной стороны, впечатляющий результат с другой.

Представим, что наступило завтра и пожары прогнозируются в реальном времени. Расчёт может выехать только в одно место из двух: в первом вероятность пожара равна 90%, во втором ­— 75%. Пожарные едут по команде системы на самый опасный объект и предотвращают возгорание. Но беда случается и по другому адресу. До эпохи сверхумных машин можно было развести руками — мы не боги, все не предусмотреть. Но что если в пожаре, который технически не был самым опасным, погибли люди? Кто отвечает за решение, спасать людей или нет?

В 2011 году полиция Лос-Анджелеса (L.A.P.D) первой в США применила на практике разработки Калифорнийского университета по прогнозированию мест и вероятности совершения преступлений. Аналитической системе «скормили» полицейские отчёты о 13 миллионах правонарушений за 80 лет. Полиция стала отправлять патрули туда, где с наибольшей вероятностью могли произойти убийства и грабежи. Точность построения карты опасных участков составляла 150×150 метров.

Сегодня система PredPol применяется в полицейских департаментах Лос-Анджелеса, Атланты и Санта-Круза.

Завтра такие программы научатся использовать всю массу информации о гражданах и будут знать заранее не только, где произойдёт преступление, но и кто его совершит. Оставят ли человеку, пусть даже без двух минут преступнику, шанс одуматься в последний момент? Или как в фантастическом фильме «Особое мнение», полиция будет укладывать людей лицом в пол за минуты и часы до самого преступления. Значит ли точный прогноз поведения человека больше, чем его свобода воли?

Важно не нанести вреда новыми знаниями. Это ответственность тех, кому они достанутся.

Станем ли мы уязвимее?

В 2012 году отец школьницы узнал о беременности дочери, увидев скидочные купоны на детскую одежду и кроватку в своём почтовом ящике. Маркетинговая фирма Target переработала данные о покупках людей и разослала листовки тем, кто приобрел набор витаминных и минеральных добавок, фолиевую кислоту и перестал брать противозачаточные таблетки. Хотела ли девушка, чтобы её отец узнал о скором рождении внука, заглянув в почтовый ящик? Хотим ли мы, чтобы о наших интимных переживаниях знал любой продавец магазина?

Представим, что данные о маршрутах передвижения, уровне доходов и образе жизни людей попали к умным преступникам. Они смогут организовать похищение нужного им человека, так как будут знать о нём все: где работает, с кем встречается, чего боится. Уже сейчас уголовники применяют азы социальной инженерии — звонят и представляются другими людьми. Им верят, потому что они произносят знакомые имена и говорят о вещах, которые не могут быть известны посторонним. Сегодня это ещё требует от них усилий и они могут «проколоться» на деталях, которые не смогли выведать.

Что будет, когда преступники смогут узнать о вас всё, в один момент, из одного источника? В результате хакерских атак будет «утекать» так много информации, что станет возможным создание цифровой копии личности.

В британском сериале «Чёрное зеркало» рассказывалась выдуманная история девушки, решившейся на создание копии сознания своего погибшего мужа. Для этого использовали массив информации обо всей его активности в фейсбуке. Вначале с ней разговаривал чат-бот, затем синтезированный голос в телефоне, а в финале — андроид, тёплый на ощупь и выглядевший точь-в-точь как её муж. Что если в будущем кто-то без вашего согласия получит доступ к вашим данным и сделает такого андроида — копию вас, неотличимую от оригинала? Что будет, если эта копия совершит преступление или подпишет при свидетелях дарственную на все ваше имущество, отдав его чужим людям? Как доказать, что это были не вы?

Big Data — не угроза. Big Data — это вызов

Накрывающая нас информационная волна требует сосредоточиться прежде всего на безопасности. Нужно залить крепкий фундамент, а потом уже класть стены, чтобы они не разъехались вместе с почвой. Каждый из нас должен понимать, чем стоит делиться в сети, а чем нет, особенно дети. Каждый бит персональной информации должен быть защищен средствами шифрования, которые не сможет преодолеть школьник после уроков. Будем честны — когда за дело берутся профессионалы, не спасает даже лучшая защита, но от хулиганских выходок мы должны быть защищены. Профессиональных взломщиков нужно сажать тюрьму или заставлять работать на благо общества, а небрежных «операторов персональных данных», выбрасывающих анкеты клиентов в мусорный ящик, привлекать к ответственности.

Опасны ли большие данные? Да, опасны настолько, насколько опасна сама информация не в тех руках. Опасны настолько, насколько опасен бестолковый примат с гранатой. Big Data — это ответственность, которая больше самих данных. Всё будет хорошо, если не давать гранату обезьянам.

ОСТАВЬТЕ ОТВЕТ