Блог о технологиях: "Большие данные" наступают

Блог о технологиях: "Большие данные" наступают
10.07.2015 | 13:24

Недавно в Петербурге прошёл Международный экономический форум. Там со сцены прозвучала фраза: "Даже сидящие на первых рядах могут не знать, что такое "большие данные"..."

Сказано это было вскользь, но по реакции аудитории было видно, что замечание в целом верное. Между тем "большие данные" уже изменили и продолжают менять многие области экономики, и не только ее.

"Большие данные" - это комплекс методов, позволяющий из необъятных массивов информации (например, данных о платежах банковской картой или данные, которые собирает ваш фитнес-браслет) выделять информацию, понятную и полезную обычному человеку или бизнесу.

Как "Фейсбук" или "Гугл" узнают, какую рекламу показать и какие услуги предложить лично нам? Это только самый простой пример того, как обработка наших информационных следов в интернете помогает компаниям помогать нам, а заодно и зарабатывать.

Концепция эта не новая (впервые выражение было употреблено в 2008 году), однако, именно сейчас "большие данные" - большие, как никогда.

Производительность компьютеров непрерывно растёт, а из всей той цифровой информации, которая существует на сегодняшний день, примерно 90% было загружено людьми за последние два года.

В таком мире анализ данных становится критически важным для работы большинства компаний и организаций. То, что было долго и дорого десять лет назад и звучало, как интересная идея, которая никогда не окупит себя, становится реальной практикой, приносящей реальную прибыль или пользу.

Давайте поговорим сегодня о тех областях жизни, где данных действительно много, и о том, как математика и алгоритмы эти сферы меняют.

Банки и сотовые операторы

На Экономическом форуме тема "больших данных" была затронута в разговоре банкиров давайте с банков и начнем. Анализ данных в финансах применяется давно и успешно. И применений у него масса.

К примеру, биржи. Конечно, уже почти не осталось тех героических людей, которые внимательно смотрят на графики, а потом, как в фильме "Хороший год", орут "Покупай!" в телефонную трубку. Алгоритм торгует быстрее, он не подвержен стрессам, не отличается рассеянностью и, в общем, по всем параметрам выглядит перспективнее.

Вторая история, связанная с "большими данными" и банками - это разработка всякого рода персональных решений, советов конкретному человеку. Мы придумываем use-case, случай или ситуацию, в которой человеку может потребоваться та или иная услуга, а потом создаём алгоритм, который автоматически будет искать потребителя, у которого реально возникла такая ситуация, и предлагать ему наш продукт.

С точки зрения потребителя это улучшение сервиса. Скажем, банк RBS (Royal Bank of Scotland) планирует вложить 100 млн фунтов в анализ "больших данных", чтобы поправить свою репутацию. Они хотят, чтобы клиенты чувствовали заботу как в 1970-е, когда офисы банка были маленькими, и люди ходили к одним и тем же клеркам, которых знали в лицо.

Данные о платежах (например, с телефона), обладающие геопривязкой, могут позволить оптимизировать ваш маршрут, сократить время на покупки, лучше спланировать поездку в магазин. А данные об оплате банковской картой, чисто теоретически, могут позволить алгоритму напомнить вам, что надо купить молоко и яблоки, а ещё заправиться. Способов напоминания может быть масса от мобильного уведомления до вопроса, заданного вам вашим автомобильным навигатором.

Ещё одна большая индустрия, которая - по крайней мере частично - с "большими данным" знакома. Данные о звонках позволяютсотовым операторампланировать строительство офисов и базовых станций, а также разрабатывать персональные услуги для каждого абонента.

Больницы и поликлиники

Компании IBM на основании автоматического мониторинга сердцебиения младенцевудалось создать алгоритм, автоматически диагностирующий распространение внутрибольничных инфекций. Такая диагностика позволяет обнаружить инфекцию в среднем на 24 часа раньше, чем это удавалось делать раньше силами персонала.

Примеры, подобные этому, позволяют говорить о реформах в здравоохранении на самых разных уровнях.

Алгоритм сможет понимать, когда, сколько и что вы едите, как расходуете калории, хорошо ли спите. Вкупе с данными медицинской диагностики все эти факторы могут значительно повысить точность постановки диагноза, а главное - существенно увеличивают шанс поставить диагноз как можно раньше. Более того, многие проблемы можно попытаться скорректировать через оптимизацию поведения и привычек ещё до того, как возникнет потребность в обращении к врачу.

Врачи с помощью анализа данных смогут предсказывать, кто из пациентов может нуждаться в госпитализации в ближайшие месяцы и как это предотвратить. А больницы смогут эффективнее оценивать работу конкретных врачей.

Транспорт

Информация о загруженности дорог, собираемая такими сервисами, как "Пробки", уже сейчас частично улучшает ситуацию на этих самых дорогах.

При наличии объездного пути часть водителей может выбрать его, что снижает нагрузку на том участке, на котором уже образовалась пробка.

Следующий шаг, конечно, это корректировка потоков транспорта с учётом общей ситуации в городе."Умные" светофоры,учитывающие пассажиропоток на перекрёстке и потоки автомобилей, "знающие" о ситуациях на соседних перекрёстках. "Умные" автомобили и, в частности, автомобили без водителей, обменивающиеся информацией друг с другом и за счёт нее оптимизирующие движение в потоке. Такие автомобили уже разрабатываются несколькими автоконцернами.

Наконец, "умный" общественный транспорт, понимающий объёмы пассажиропотока в разные моменты времени в разных частях города и адаптирующий к этой ситуации свои маршруты.

А вот историяоб оптимизации парковокв Нью-Йорке (рассказ на английском, но там есть русские субтитры).

Реклама и маркетинг

Большие данные пришли в эту индустрию из интернета, и понятно, что останутся они тут надолго. Персональная реклама работает лучше. Технологии позволяют нацеливаться уже даже не на группу людей, а на конкретного потребителя, предлагая наиболее интересные ему услуги и продукты.

Любые данные о поведении клиента могут быть использованы для повышения эффективности рекламы. И если оптимизация пассажиропотоков или улучшение здоровья - это то, что воспринимается нами в целом как благо, то вот реклама, как правило, вызывает раздражение. Может, это не так уж и хорошо, что "большие данные" приходят в эту область?

Вообще, прогресс можно рассматривать с разных сторон. К примеру, широко известно, что он уничтожает рабочие места. Где нынче кучеры или телеграфистки? Но как-то меньше принято обращать внимание на то, что этот же самый прогресс создаёт другие рабочие места в других областях.

Так и с рекламой. С одной стороны, реклама раздражает, это правда, с другой - если из раздражающего плаката, предлагающего что-то совершенно нам ненужное, она превратится в точный и верный совет, позволяющий получить именно то, что мы хотим, на приятных для нас условиях, может, это будет не так уж плохо? Сделать рекламу именно такой могут только большие данные и алгоритмы, чётко понимающие предпочтения потребителя.

Список индустрий можно продолжать: приборостроение, подбор персонала или выплавка металлов (это сложные процессы, требующие глубокого контроля качества на разных этапах, а контроль этот предполагает быструю обработку большого количества экспериментальных данных). Главное то, что приход больших данных в каждую из индустрий качественно улучшает предлагаемые товары и услуги.