Большая Аналитика для Больших Данных

04.06.2012
SAS анонсирует полный спектр высокопроизводительных инструментов для бизнес-аналитики – SAS High Performance Analytics

Компания SAS Россия/СНГ, лидер в области решений и услуг в сфере бизнес-аналитики, объявляет о выводе на рынок полной линейки аналитических инструментов – технологий и продуктов – нового поколения: SAS High Performance Analytics. Они позволяют решать бизнес-задачи принципиально другого уровня сложности, давая возможность обрабатывать и анализировать большие объемы данных, с гораздо большей точностью и в десятки раз быстрее. Использование Большой Аналитики открывает для бизнеса не виданные ранее возможности.<br />
Об этом объявил на пресс-конференции 30 мая в Москве Валерий Панкратов, генеральный директор SAS Россия/СНГ. <br />
Что дает анализ Больших Данных?<br />
«Решая задачи, связанные с анализом и визуализацией Больших Данных, компании получают весомые конкурентные преимущества в виде доступности обоснованных результатов аналитических исследований, проведенных на громадных объемах структурированных и неструктурированных данных, причем в условиях жестких ограничений по времени. Такой подход меняет саму парадигму ведения бизнеса, позволяя руководителям применять не доступные ранее методы и возможности для управления компанией, - заявил Валерий Панкратов. - Умение оперативно анализировать Большие Данные предоставляет уникальные возможности для управления рисками и предотвращения индивидуального и группового мошенничества (вплоть до остановки подозрительных транзакций в режиме реального времени) в банках и страховых компаниях, для анализа больших потоков данных абонентов в телекоме, для сложных аналитических задач в энергетике, госсекторе и т.д. Список можно продолжать. По всей видимости, именно банковский сектор и телеком могут быть отраслями, где новые решения наиболее востребованы, экономически обоснованы и где сконцентрированы профессиональные кадры, способные использовать возможности нового ПО».<br />
Сегодня многие крупные организации накопили терабайты структурированной и неструктурированной информации. Это данные о миллионах клиентов и их действиях, об операционной деятельности самих организаций… По данным McKinsey Global Institute, объем этих данных стремительно нарастает, процессы их обработки и анализа занимают все больше времени, поэтому и получать из них полезные для бизнеса знания становится все сложнее. До сих пор углубленный анализ Больших Данных был либо слишком дорог, либо очень сложен, и занимал недели и месяцы, но появление нового класса аналитических инструментов сделало эту задачу возможной и доступной для целого ряда предприятий, которые уделяют серьезное внимание использованию аналитики для принятия оперативных и взвешенных решений.<br />
Экономисты исследовательского центра Cebr (Великобритания) подсчитали, что развитие технологий Больших Данных в ближайшие пять лет может принести экономике страны 216 млрд фунтов стерлингов и создать около 58 тыс. рабочих мест. Применение аналитики нового поколения для исследований и разработок может помочь созданию новых товаров и услуг и даже новых рынков, что к 2017 году даст экономике Великобритании 24,1 млрд фунтов стерлингов, считают в Cebr. Улучшение выявления случаев мошенничества позволит сэкономить порядка 2 млрд фунтов средств госбюджета, а повышение эффективности управления производительностью принесет еще 3,6 млрд фунтов.<br />
Уже сегодня организации, применяющие на практике разработки High Performance Analytics, добились впечатляющих результатов. Одна из лидирующих мировых компаний смогла сократить время на решение задач оптимизации маркетинговых кампаний для 25-ти млн клиентов и 1000 различных продуктовых и сервисных предложений с 5-ти с половиной часов до менее чем 6-ти минут. Теперь стало возможным проводить моделирование различных сценариев и принимать решения, такие, как изменение бюджета или других параметров (например, количества операторов в колл-центре), которые могут существенно увеличить доход компании, полученный от целевого маркетинга.<br />
Другой пример анализа Больших Данных: крупнейший в Европе по размеру рыночной капитализации банк HSBC, внедрив систему SAS по противодействию кредитному мошенничеству, повысил эффективность службы по выявлению случаев мошенничества в 3 раза, а точность его выявления – в 10 раз. При этом в первые же 2 недели эксплуатации 7 специалистов службы безопасности HSBC выявили новые криминальные группы и схемы с общим потенциальным ущербом более 10 млн долларов.<br />
Что касается России, то говорить о многочисленных внедрениях пока не приходится. Однако уже есть первые компании, использующие эти технологии. Например, в одном из Тор-5 банков России для анализа поведения клиентов и управления кредитными рисками применяются специальные средства для анализа Больших Данных.<br />
Своим видением ресурсоемких задач поделился Сергей Анохин, Вице-президент, заместитель директора финансового департамента Банка ВТБ24. Он считает, что в современной конкурентной среде помимо традиционных факторов успеха в банковской сфере, таких как стабильность, качественное обслуживание и привлекательная продуктовая линейка, все более важными становятся эффективность, скорость и гибкость изменений. «Степень развития и использования этих факторов зависит от того, насколько комплексно вы видите рынок, своих клиентов и свои внутренние процессы, действия и результаты, насколько быстро и раньше конкурентов вы выявляете изменения, перспективы или угрозы рынка, а также как быстро осуществляете необходимые изменения действий банка и работы с клиентами. А для этого важно не просто обладать всем спектром необходимой информации в хранилище или аналитических системах, а иметь возможность быстро ею воспользоваться для получения ответов на сложные вопросы, требующие обработки огромных массивов данных», - заявил Сергей Анохин.<br />
SAS High Performance Analytics – аналитика нового поколения<br />
Для решения бизнес-задач аналитическими методами организации нужно пройти определенный набор шагов, требующих вовлечения разных специалистов – бизнес-менеджеров, бизнес-аналитиков, аналитиков-математиков и ИТ-специалистов. Перед каждым из участников аналитического процесса стоят свои задачи, поэтому они предъявляют разные требования к функциональности средств бизнес-аналитики.<br />
«У компании SAS есть специализированное программное обеспечение для каждого типа пользователей и для каждого типа задач в бизнес-аналитике - рассказал Андрей Свирщевский, руководитель направлений Аналитики и Гарантирования доходов SAS Россия/СНГ. - Эта линейка технологий, состоящая из трех частей, а также основанных на них продуктов и решений, получила название SAS High Performance Analytics. Наша компания развивает ее уже несколько лет. Все три технологии SAS по работе с Большими Данными представляют собой разные способы их распределенной обработки».<br />
Первая из них - SAS Grid Computing – предназначена для управления распределенными вычислениями в среде SAS при работе как на одном сервере, так и на большом количестве серверов. Это некий аналог «облачных» технологий. <br />
Вторая технология, разработанная около года назад, воплощена в продуктах класса in database: в этом случае распределенная обработка достигается путем переноса вычислений внутрь хранилища данных, то есть с аналитического сервера SAS - на сервер внешней базы данных. Этот метод применим для различной функциональности, но дает самый существенный выигрыш в ситуации, когда аналитические модели разрабатываются на инструментах SAS, а корпоративное хранилище данных реализовано на СУБД другого вендора. Поскольку новые данные появляются именно в хранилище, то применение аналитических моделей оптимально выполнять, не извлекая данные большого объема из хранилища. Продукты серии SAS Scoring Accelerator переводят аналитические модели на язык партнерских СУБД и переносят их внутрь этих СУБД для регламентного применения. Например, сначала специалисты банка средствами углубленной аналитики выявляют факторы, определяющие вероятность невозврата кредита, а потом внутри хранилища данных проводится регулярная переоценка уровня кредитного доверия по всем клиентам банка.<br />
«Сегодня мы представляем новые продукты и решения, созданные по технологии in memory - распределенные вычисления в оперативной памяти блейд-серверов, - объявил Андрей Свирщевский, проводя демонстрацию их работы в режиме реального времени. - Область технологий in-memory развивается в SAS по следующим направлениям: визуализация данных, аналитика в различных ее областях (вплоть до анализа закономерностей в тексте) и прикладные аналитические решения для конкретных бизнес задач. Мы представляем рынку два продукта, работающих по технологии in-memory: это средство визуализации данных SAS Visual Analytics и средство построения аналитических моделей SAS High Performance Analytics. На основе этой технологии также создан ряд прикладных решений».<br />
Продукт SAS High Performance Analytics позволяет алгоритмам основных существующих направлений аналитики выполняться на десятках и сотнях миллионов записей с фантастической производительностью. Если раньше на анализ закономерностей и построение аналитических моделей требовались часы или даже дни, то теперь эти операции проходят за секунды и минуты. Например, банки, разрабатывая модели принятия решений о выдаче кредитов на основе регрессионного анализа, реально могут получить ускорение в 100 раз.<br />
Преимущества для бизнеса и прикладные решения<br />
Что на деле дает способность работать с Большими Данными за минуты вместо часов? Во-первых, точность аналитических моделей. Раньше аналитики часто были вынуждены для построения моделей брать подвыборки данных, теперь они могут проводить анализ на всей генеральной совокупности. В некоторых случаях можно перейти на более детальный уровень анализа, например, не по клиентам, а по их транзакциям. Также важно, что теперь аналитик может запустить анализ большее число раз и тем самым лучше подобрать оптимальные настройки. Немаловажно и увеличение скорости получения результатов анализа – это существенно, например, для оперативной реакции на произошедшие изменения.<br />
Как это работает на практике, проверил один из крупных банков в Америке. За счет сокращения среднего времени работы аналитической процедуры с 5-ти часов до 3-х минут появилась возможность применять больше видов алгоритмов в более сложной конфигурации. В результате точность моделей возросла с 1.6 до 2.5. Это означает, например, что на маркетинговое предложение откликнулось бы в полтора раза больше клиентов (отношение 2.5/1.6), чем если бы предложение рассылалось клиентам, выбранным менее производительной аналитической моделью, и в 2.5 раза больше клиентов, чем если бы они выбирались случайным образом. Условно говоря, не 100 человек из 1000 и даже не 160, а 250. В масштабах крупного банка дополнительная прибыль может составить внушительную сумму.<br />
На основе технологии in-memory компанией SAS уже создан ряд прикладных решений:<br />
•    SAS High Performance Risks - для высокопроизводительного расчета уровня риска портфеля на рынках капитала;<br />
•    SAS High Performance Markdown Optimization - для расчета оптимальной стоимости и скидок для розничной торговли;<br />
•    SAS High Performance Marketing Optimization - для определения оптимального предложения каждому клиенту.<br />
SAS Visual Analytics<br />
Этот новый продукт сочетает в себе высокопроизводительные средства анализа и удобный графический интерфейс визуализации данных. Он позволяет бизнес-пользователям и аналитикам самостоятельно анализировать большие объемы данных и получать точные, наглядные и удобные для интерпретации отчеты. Эти отчеты можно публиковать в интернете, а благодаря приложениям для мобильных устройств, с ними можно работать, например, и на iPad. Это означает, что на встречах, в командировках или же при удаленной работе у менеджеров, маркетологов, исследователей и других пользователей, которым нужны аналитические данные и выводы, сохраняется доступ к нужной информации. Они могут ею пользоваться и принимать на ее основе оперативные и взвешенные решения.<br />
«Анализ занимает всего несколько секунд, максимум несколько минут, что дает бизнесу значительные преимущества и фору по времени перед конкурентами, - объяснил, проводя «живую» демонстрацию продукта Алексей Мещеряков, руководитель направления платформенных решений компании SAS Россия/СНГ. - Поскольку пользователи работают с данными напрямую, самостоятельно, не делая для этого никаких запросов в ИТ-службу, то меняется весь бизнес-процесс проведения анализа и принятия решений. Он становится более простым и эффективным. В свою очередь, ИТ-специалисты освобождаются от рутинных операций по обработке пользовательских запросов на предоставление доступа к информации и создание новых представлений данных и разовых отчетов. Поэтому компания может направить высвободившиеся ресурсы на решение других важных задач».<br />
ЗАКЛЮЧЕНИЕ<br />
Тема Больших Данных сегодня активно обсуждается во всем мире, разрабатываются инструменты для работы с ними. Но есть важные отличия продуктов и решений SAS среди других. Только компания SAS смогла добиться, чтобы продвинутая аналитика стала работать в оперативной памяти сервера, включая все необходимые средства для решения задач углубленного анализа данных (Data Mining). Кроме того, сегодня только SAS обладает полным спектром технологий для решения задач бизнес-аналитики на основе Больших Данных: это хранение данных, их обработка, визуализация данных, продвинутая аналитика, а также прикладные решения для бизнеса.<br />