Из статьи The Guradian «Predicting Crime: LAPD style» (наш перевод — «Предсказание преступлений — реальность») мы с вами узнали о программном комплексе PredPol, разработанном с участием университета Калифорнии. Он позволяет предсказывать место и время совершения преступления и с 2014 года применяется полицией Лос-Анджелеса. Сегодня мы познакомимся с ним поближе, а также узнаем, есть ли у него конкуренты.

PredPol — Первый мститель

PredPol — это аналитический инструмент, распространяемый по технологии SaaS, который позволяет с некоторой вероятностью определить, где и когда случится неблагоприятное событие: кража, ограбление, наркопреступление, дорожно-транспортное происшествие или всплеск криминальной активности банд.

Увы, на сайте PredPol можно найти всё что угодно: показатель возврата инвестиций (ROI), экономии муниципального бюджета и проценты снижения преступности в городах, где он применялся — только не данные о точности прогнозов системы. В какой степени снижение преступности обусловлено именно PredPol, производитель предпочитает не рассказывать даже в секретных презентациях.

Если верить официальному сайту, PredPol использует лишь три переменные: вид, время и место неблагоприятного события. Данные о личности преступников не обрабатываются.

Используя отчёты о преступлениях за годы и десятилетия, алгоритм определяет районы, где вероятность совершения правонарушений является наибольшей. Он отмечает такие участки на карте города небольшими красными квадратами, которые в реальном мире обозначают квадрат размерами 150 на 150 метров. Если отправить в этот опасный район полицейского, он может обнаружить, как кто-то взламывает замок машины, залезает в форточку квартиры или избивает прохожего из корыстных побуждений. Ключевое слово — «может»: система не гарантирует, что полицейский найдет преступника.

Как заявляют сами создатели PredPol на официальном сайте, их решение — это не способ: — втыкания цифровых флажков в карту; - определения личности преступника; - классификации отдельных людей или групп в зависимости от криминальной активности; - заменить интуицию и опыт ветеранов полицейской службы.

PredPol — это аналитический инструмент, который подсказывает сотрудникам полиции, на что имеет смысл обратить внимание и тем самым «подтягивает» общий уровень подразделения правоохранительного органа.

Например, показывает «горячие точки» на карте:

2016-07-30_PredPol_more_2Основной экран PredPol. Фото: Big Data’s Coming To Your Town — Donnie Fowler and Zach Friend @ TEDxSantaCruz

Обобщенные данные о криминальной активности:

Аналитический модуль PredPol Radar. Фото: www.predpol.com

Как отработала патрульная машина, где и сколько стояла, куда ездила:

Модуль оценки работы патрулей. Фото: www.predpol.com

Стоимость лицензирования PredPol отличается от города к городу. Для столицы штата Южная Каролина — Колумбии (134 тыс. чел. в 2015 г.) — она составила $37,5 тыс. в год, для Алхамбры в Калифорнии (85 тыс. чел. в 2014 г.) — $22 тыс. в год.

Формально алгоритм определения вероятности совершения преступления является коммерческой тайной и публично не обсуждается. Вместе с тем компания PredPol основана антропологом Джефри Брэнтигэмом (P. Jeffrey Brantingham) из Калифорнийского университета (UCLA) и математиком Джорджем Молером (George Mohler) из университета Санта Клары, а среди ученых из лучших побуждений и для развития науки принято хвастаться своими достижениями и размещать их в журналах. Результаты исследований, которые легли в основу системы PredPol можно обнаружить на их университетских страницах: здесь и тут.

Если верить публикациям в интернете, корни PredPol следует искать в материалах работ, проведенных по заказу Армии США. Ученые создавали модели прогнозирования количества жертв боевых действий и поведения террористов в Ираке и Афганистане. Это похоже на правду: сайт информационного центра министерства обороны США (DTIC) содержит запись о проекте «Применение пространственно-временной нелинейной фильтрации в целях информационной поддержки и борьбы с проявлениями терроризма», озаглавленного в лучших традициях государственного аппарата (чтобы никто ничего не понял и не поднимал лишний шум). Среди авторов проекта присутствует А. Бертоцци (A. Bertozzi), вместе с которым Джефри Брэтингэм с 2008 года занимался построением статистических моделей криминальной активности.

PredPol применяется в полицейских подразделениях американских штатов Калифорния, Флорида, Мэрилэнд, Вашингтон, Пенсильвания и Алабама. За пределами США эта система использовалась в английском городе Кент и уругвайской столице Монтевидео.

У PredPol есть и противники, которые считают его эффективность недоказанной, стоимость не обоснованной, а сам феномен PredPol скорее примером хорошей работы маркетологов, чем результатом серьезных усилий на ниве правоохранения. На противоположном берегу стоит лагерь людей, которые считают PredPol образцом, достойны всяческого подражания. Первая среди них — Motorola.

Клон Predpol от Motorola Solutions

Аналогичное облачное решение предлагает компания Motorola Solutions (не путать с Motorola Mobility, доставшейся Lenovo в 2011 году). Называется оно CommandCentral Predictive и тоже распространяется по модели SaaS.

2016-07-30_PredPol_more_5Основной экран CommandCentral Predictive. Фото: www.motorolasolutions.com

PredPol и CommandCentral Predictive похожи друг на друга даже больше, чем первый Warcraft на Dune II:

  • размеры предсказываемого участка будущего преступления одинаковы — 150 на 150 метров (500×500 футов);
  • при клике на выделенный район можно ознакомиться с историей правонарушений, которые в нем происходили;
  • система подсказывает время совершения преступления и его тип;
  • можно переходить от обзора по карте к виду улицы с помощью Google Street View;
  • у CommandCentral Predictive есть ретроспективно-аналитический напарник CommandCentral Analytics (аналогично Radar для PredPol).

2016-07-30_PredPol_more_6Просмотр улиц в CommandCentral Predictive. Фото: www.motorolasolutions.com

Чтобы объяснить будущим покупателям, почему CommandCentral Predictive — это нечто лучше, чем изучение красивых панелей со стрелочками, температурными картами и диаграммами с данными о произошедших преступлениях, которую предлагают остальные разработчики аналитических программ, Motorola Solutions выпустила брошюру «Is My Crime Analytics Software Predictive?». Из нее мы узнаём в чем разница между системами прогнозирования преступлений в реальном времени — PredPol, CommandCentral Predictive — и теми, кто очень хочет таковыми казаться. В двух словах: правильные системы не только делают правильный мед обобщают имеющиеся данные и визуализируют их на «дэшбордах», но и подсказывают, где именно произойдет преступление, в какой промежуток времени, почему компьютер пришел к такому выводу и постоянно обновляют свои прогнозы с учетом новой информации.

Среди тех, кто недотягивает, оказались гиганты — Hitachi и Microsoft.

Хитрый ход Hitachi

Hitachi — производитель электроники, бытовой техники и медицинского оборудования — предлагает свой модуль прогнозирования криминальной активности в составе комплекса для работы «умного города» (Smart City) Hitachi Visualization Suite (HVS). Он называется Predictive Crime Analytics (PCA) и с виду довольно красив:

2016-07-30_PredPol_more_7Экран PCA. Фото: Fast Company

Код PCA базируется на разработках Дэррина Липскомба (Darrin Lipscomb) и Марка Джулса (Mark Jules), основателей компаний «Avrio» и «Pantascene», которые занимались вопросами безопасности. В 2014 году их купила Hitachi Data System Corporation (дочка японской Hitachi, Ltd.) и убедила разработчиков сосредоточиться на использовании технологий машинного обучения вместо оперирования заранее определенными факторами. По мнению Hitachi, это позволяет PCA использовать огромное количество источников информации и выявлять неочевидные схемы поведения людей. По сведениям Fast Company внутри PCA «крутится» R — открытый статистический пакет.

PCA использует данные о криминальной активности, погоде, дорожном движении и маршрутах общественного транспорта, видеозаписи с камер наблюдения и даже сообщения в социальных сетях. По заверениям разработчиков, их система анализирует твиты с учетом местного сленга, чтобы лучше понимать что происходит в том или ином городе. Если кто-то напишет в твиттер «купи насос в максдональдсе», PCA заподозрит неладное, исследует историю употребления этого выражения в городе и может прийти к выводу о том, что «насос» — это что-то про метамфетамин.

Результаты работы PCA изображаются на карте города цветными блоками — чем темнее оттенок, тем больше опасность по шкале от 0 до 100. Минимальный размер блока — 200 на 200 метров, что немного больше блоков PredPol и CommandCentral Predictive.

2016-07-30_PredPol_more_8Экран PCA. Фото: Fast Company

В отличие от PredPol и CommandCentral Predictive создатели PCA не стесняются заявлять, что дают в руки полиции инструмент выявления личности вероятного преступника. В интервью Fast Company Липскомб утверждал, что это лучше применяемого полицией Нью-Йорка «лобового» метода профилактических обысков подозрительных граждан (stop-and-frisk scheme). Возможно, уверенность Липскомба поубавится после первых случаев задержания на основании решений PCA граждан афро-американской или мексиканской наружности — именно за это критикуют в прессе нью-йоркский подход «остановить-и-обыскать».

Случаи применения PCA в литературе не описаны, на сайте Hitachi Data Systems не представлены. Удалось только установить, что HVS, в составе которой работает PCA, применяется в американских штатах Техас (Остин) и Калифорния (Морено-Валли). HVS — облачная платформа, которая использует данные, получаемые от службы спасения 911, считывателей автомобильных номеров, датчиков выстрелов, камер наблюдения, и визуализирует их на карте.

Несмотря на слова «Predictive» и «Crime», описание PCA говорит нам, что этот модуль не является системой предсказания преступлений в духе PredPol и CommandCentral Predictive — с указанием хотя бы приблизительных места и времени. Это шикарная система аналитики для кабинетных работников, но, пожалуй, не подспорье для оперативных сотрудников на улицах.

Лагерь Microsoft

Нечто похожее предлагает Microsoft: её разработка Domain Awareness System применяется в Нью-Йорке. DWA имеет доступ к более чем трём тысячам камер наблюдения, всем полицейским отчётам, записям звонков в спасательную службу, базе автомобилей и даже датчикам радиации. Как и Hitachi Visualization Suite, DWA снабжает полицию города полезной информацией о подозрительной активности, обобщает и визуализирует данные, но не решается сделать вывод о том, где и когда произойдет следующее преступление.

DWA разработан по заказу полиции Нью-Йорка (NYPD), поэтому доступной информации о системе немного и та ограничена пресс-релизами и публикациями в прессе. Сайт администрации Нью-Йорка объясняет, как именно DWA помогает полиции:

  1. Следователи получают мгновенный доступ к информации с видеокамер, наблюдают за арестом подозреваемых, отслеживают связанные с ними звонки в службу спасения 911 и похожие преступления в том же районе.
  2. Полицейские визуализируют историю нарушений на карте, выявляют преступные схемы и связанные между собой события, а также видят, где находилась машина подозреваемого вчера, недели и месяцы назад.
  3. Руководители получают данные из базы преступлений, чтобы правильно распределять имеющиеся силы в зависимости от криминальной активности в том или ином районе.
  4. Если на вокзале обнаружена подозрительная сумка, полицейские отмотают время видеопотока вспять и увидят воочию, кто ее бросил.

В пресс-релизе на сайте нет ни слова о стоимости лицензирования DWA, зато теперь мы знаем, что полиция Нью-Йорка получает 30 процентов выручки от продажи системы органам правопорядка в других городах.

Рынок автоматизированного правоохранения представляется настолько «вкусным», что в него пытаются втиснуться даже те, кто не готов заниматься разработкой собственных решений, но способен стоять на плечах гигантов. Компания Third Eye Consulting Services с марта 2016 года предлагает попробовать в действии комплекс Safera, который представляет собой коктейль из технологий Microsoft: Azure Stream Analytics, Azure Machine Learning и компонентов PowerBI (PowerQ&A, PowerView, PowerMap). В отличие от PredPol или Microsoft, которые разрабатывали свои продукты в тесном сотрудничестве с полицией и использовали ведомственные источники, Third Eye Consulting Services поступили проще: взяли открытые данные, публикуемые администрацией Чикаго, информацию из бюро переписи населения США и сведения о погоде и дорожном движении, и построили красивые диаграммы и графики. Судя по отсутствию публикаций об успешном внедрении Safera, система еще не применялась в боевых условиях.

Думаю, вы заметили, что все перечисленные программные решения имеют гражданство США (штаб квартира Hitachi Data Systems тоже находится там). Американцы — молодцы без оговорок и умеют себя продавать. Но оказалось, что правоохранителям по другую сторону океана тоже есть чем похвастаться.

Герои Старого Света

В Германии c 2011 года работает система предсказания ограблений Precobs за авторством Institut für musterbasierte Prognosetechnik. Её механизм базируется на теории повторения или «заразности» преступлений — если кто-то вломился в дом, весьма вероятно, что это повторится или случится поблизости.

На основе данных о преступлениях за прошедшие десять лет Precobs предсказывает ограбления на участках диаметром 500 метров за сутки до его совершения. Немецкая разработка применялась в швейцарских кантонах Базель-Ланд, Цюрих и Аргау и немецких городах Мюнхен и Нюрнберг: точность предсказания составила 85%. После роста числа арестов количество ограблений снизилось на треть.

2016-07-30_PredPol_more_9Ноутбук с запущенным Precobs. Фото: Wolfram Kastl, Arno Burgi, Matthias Balk, Kay Nietfeld.

На востоке аналогов PredPol или Precobs нет. Но азиаты активно размышляют, как применить имеющийся массив информации о гражданах для обеспечения правопорядка.

Если верить Bloomberg производитель локационного оборудования и электронных компонентов для военных нужд Китая — China Electronics Technology Group (CETG) — создаёт систему предотвращения террористических актов, которая по описанию больше похожа на механизм тотального контроля личности.

Безымянная система CETG якобы способна анализировать информацию о банковских счетах, выполняемой работе, хобби, видах и частоте потребления товаров и услуг, а также сопоставлять ее с данными камер наблюдения. Весь этот массив сведений будет использоваться для поиска необычных для человека действий: если бедняк из деревни получает на банковский счет крупную сумму или гражданин без родни за границей начинает звонить в США, Англию и Уругвай.

2016-07-30_PredPol_more_10Иллюстрация: Jay Daniel Wright for Bloomberg Businessweek

Существует ли такая разработка в реальной жизни или нет — сказать трудно, поскольку все обнаруженные мной источники цитируют американского поставщика финансовой информации Bloomberg. А США, говорят, недолюбливает Китай за экономическую мощь и активное развитие проекта Нового шелкового пути, потому и не упускает возможности пожурить Поднебесную за нарушение прав человека и отсутствие демократических свобод.

В ноябре 2015 года на стыке Европы и Азии — в России — пресса зашумела новостью о создании Следственным комитетом системы анализа публикаций в СМИ и лентах популярных интернет-сервисов: «ВКонтакте», «Одноклассники», «Мой мир», Facebook, Twitter, LiveJournal, Liveinternet, YouTube, Instagram и Foursquare. Не избежала соблазна «поджелтить» заголовок даже серьезное экономическое издание РБК. Реальность оказалась прозаичнее: речь в государственном контракте шла не о разработке системы, а об «услуге доступа», которая оказывалась Следственному комитету еще с 2012 года компанией «Интегрум» — разработчиком одноименного комплекса для анализа СМИ и социальных сетей. Об этом (а также о бесплатной версии «Интегрума») общественности поведала BBC.

Вместо послесловия

У аналитических программ, которые мы сегодня разбирали, немало противников. Хамид Хан (Hamid Khan), глава организации «Заставим полицию Лос-Анджелеса перестать шпионить» (Stop LAPD Spying Coalition) полагает, что работа систем предсказания преступлений переворачивает принцип правосудия «человек не виновен, пока не доказано обратное» с ног на голову — «любой виновен, пока не доказал, что это не так».

Думаю, Хамид неправ, обвиняя инструменты, а не руки, который их держат: гильотиной тоже можно рубить не головы, а кабель или, скажем, колбасу. Компьютерные системы лишь автоматизируют методики, наработанные за десятилетия работы правоохранительных органов, и механизируют внезапные откровения после часовых медитаций на стену с фотографиями, картой и красными флажками — как это принято изображать в американских детективных фильмах. Только человек для обработки больших массивов информации задействует подсознание — непонятный черный ящик, а в случае с автоматизированными решения вроде PredPol, Precobs или пусть даже PCA — тоже ящик, но в него уже можно заглянуть и настроить: что-то подтянуть, а что-то ослабить.

ОСТАВЬТЕ ОТВЕТ