Splunk: деликатный инструмент для развития бизнеса

Вопрос подготовки данных, чтобы результат был максимально эффективным, — отдельная задача, предусматривающая анализ данных еще до загрузки в систему

В нынешних условиях искусство управления данными приобретает если не сакральный смысл, то, вне всяких сомнений, высочайший приоритет. Однако размеры данных и риски, связанные с ними, предполагают применение самых современных и эффективных инструментов управления. О том, как эта задача решается в компании «Мегафон», рассказывает Дмитрий Никитенко, руководитель по системам анализа и обработки данных.

Дмитрий, какие задачи, стоящие перед компанией, мотивировали вас на поиск и выбор инструмента управления данными?

Я полностью согласен с тем, что актуальную информацию и данные все чаще называют нефтью цифровой экономики и применяя современные подходы к анализу и обработке данных можно извлекать дополнительную пользу для бизнеса.

В компании «МегаФон» генерируются огромные потоки данных – множество ИТ-систем в реальном времени формируют массивы разнообразных сведений. К примеру, содержат информацию об успешности и качестве предоставления услуги на конкретном участке обработки клиентского запроса, фиксируя возможные ошибки по каждому действию клиента. Эта информация раньше использовалась в основном ИТ-специалистами, например, для устранения технических проблем, но при этом бизнесу интересно знать, сколько клиентов не смогло подключить услугу из-за невыполненного условия заложенного в услугу, на каком шаге часть клиентов прекратила процесс подключения и узнать это нужно еще до того, как будут подведены финансовые итоги по этой услуге.

Поэтому в 2014 году, были запущены пилотные проекты мониторинга клиентских услуг и качества в сегментах обслуживания, контактного центра и инфраструктуры.

При выборе инструмента мы остановились на системе Splunk – которая соответствовала всем нашим требованиям для развертывания платформы централизованной обработки и оперативного анализа машинных данных и обладает богатым штатным функционалом для выполнения сложных задач в том числе по машинному обучению и геоаналитике.

То есть службе ИТ требовалось решение для автоматизации внутренних функций, чтобы быть прозрачной не только для себя, но и для бизнеса?

Не совсем так. У нас есть классический мониторинг ИТ, успешно решающий свои задачи, но для бизнес-подразделений компании технический мониторинг мало полезен. Мы подумали, а что, если его применять не только для ИТ сервисов, но и для коммерческих продуктов и сервисов предоставляемых сервисов клиентам, а также для мониторинга жизненного цикла самих продуктов. И когда стали погружаться в эту проблематику, выяснилось, что мониторинг продуктов — это сложная, многоуровневая задача с контролем множества узлов, обеспечивающих логику работы продукта. Стало понятно, что если мы не будем анализировать все ключевые точки и узлы, то не поймем какое конкретно событие повлияла на работу сервиса. А самое главное — как это сказывается на бизнесе и сколько он из-за этого события теряет в деньгах, а что нужно сделать, чтобы избежать повторения подобных событий. Таким образом, на этапе внедрения мы уже задумывались о том, как оцифровать результаты работы, чтобы оценить и проанализировать, что было до и после наступления определенного события.

Не могли бы вы пояснить это на примере?

Когда в 2015 году мы запустили проект, то увидели, что по услуге «Обещанный платеж» процент отказов в подключении колеблется на уровне 50–60%. Это очень много. Однако технических отказов в этих процентах, когда действительно не работали какие-то узлы или соединения, было не более 1%. В общем-то, этим можно и пренебречь. Но все остальное относилось к логическим ограничениям. В результате получалось, что бизнес-логика услуги настроена так, что клиенты хотели, но не могли ее воспользоваться, из-за условий использования. Начали разбираться. Выяснилось, что примерно две трети из указанных 50–60% относятся к случаям, когда клиенты желают взять услугу повторно, но условиями акции это запрещено. После внесения изменений было позволено брать услугу повторно, что увеличило показатели по выручке.

Но Splunk это очень тонкий и деликатный инструмент, с которым нужно уметь обращаться, чтобы не допустить неприятных сюрпризов. Как вы оцениваете эту проблему?

У нас сформирована федеральная команда для выполнения сложных проектов мониторинга и развитию и поддержки платформы мониторинга доступности услуг. К тому же Splunk очень хорошо документирован и имеет большое сommunity в том числе и русскоязычное, которое помогает нам минимизировать риски при эксплуатации платформы.

Разумеется, мы понимаем, что в «МегаФоне» очень много услуг и данных, и вопреки нашим желаниям, чтобы охватить вниманием весь круг задач, нам, как говорится, не всегда хватает рук. Поэтому в нашу стратегию заложена возможность вовлекать в сотрудничество узких специалистов, компетентных в своих областях, которым мы предоставляем платформу для работы с данными, помогаем на старте и со временем они начинают работать самостоятельно. Например, такие направления как качество роуминга, системы самообслуживания, качество сервисов инфраструктуры и другие уже работают и контролируется через Splunk самостоятельно применяя свои алгоритмы.

Очевидно, что все данные нельзя просто взять и загрузить в Splunk. Их нужно специальным образом подготовить. Как этот эпизод выглядит в проекте внедрения и освоения Splunk?

Вопрос подготовки данных, чтобы результат был максимально эффективным, — отдельная задача, предусматривающая анализ данных еще до загрузки в систему. Мы детально погружаемся во все процессы и архитектуры всех систем, причастных к той или иной услуге. Это позволяет нам снимать состояние информации об услуге именно в ключевых точках и узлах. Вовлечение коллег начинается в первую очередь именно с вопросов о том, что их беспокоит с точки зрения мониторинга информации. В итоге приходит понимание, как функционируют те или иные узлы и какие последствия ждут в случае их неработоспособности. Это очень скрупулезное занятие, но без него, вы абсолютно правы, нельзя ожидать от Splunk достойного результата.

Как выглядят ожидания от взаимодействия с функционалом Splunk именно вашего подразделения?

Я уже говорил, что мы стараемся понимать и контролировать все, что происходит на каждом этапе взаимодействия клиента с предлагаемыми сервисами. Понимать именно здесь и сейчас. Безусловно, мы можем потом посмотреть эту информацию в финансовых отчетах, увидеть какие-то тренды. Однако это будет «посмертный» анализ, когда мы уже никак не сможем повлиять на ситуацию. Что с того, что мы увидели потерю Х млн рублей? Мы не хотим этих убытков, а потому наши ожидания связаны с Splunk именно как с инструментом, который позволит нам именно здесь и сейчас видеть возможности для повышения уровня доступности и прозрачности услуг.

С этой точки зрения пример роуминга очень понятен. А какие услуги вы собираетесь мониторить в ближайшее время?

На старте мы комплексно ставили на мониторинг все каналы самообслуживания, так как они влияли на подключение всех оказываемых услуг. Сейчас мы действуем поступательно, и детально изучаем клиентский опыт в наиболее критичных услугах, которые наиболее важны для клиентов. Приоритетность определяют наши партнёры от бизнес-функций. На повестке дня так же стоит качественная оценка сервисов инфраструктуры со стороны клиента. В этих вопросах мы занимаемся очень интересными задачами - оцениваем эмоциональное восприятие наших сервисов на стороне клиентов. Даже в таких консервативных сервисах как платежи мы понимаем, когда клиент начинает нервничать, если длительное время не получает подтверждения зачисления средств на его счет. Когда мы видим, что 90% клиентов получают SMS-оповещение с очень высокой скоростью, то для них этот сервис доступен, понятен и очевиден. Но если процент снизится на два-три пункта, то для нас это повод задуматься, в каком месте и по какой причине произошла задержка, и мы сможем оперативно внести необходимые изменения, чтобы вернуть удовлетворенность клиентов на приемлемый уровень.

Как выглядит ваше взаимодействие со службой ИБ в вопросах управления данными?

Это очень важный вопрос. С ИБ мы договаривались заранее и играем по прозрачным правилам. Я бы назвал это нормальным операционным взаимодействием. Мы знаем, какие данные мы можем загружать в Splunk, а какие нет. Иначе есть вариант попасть под действия регуляторов. И этим обстоятельством никак нельзя пренебрегать. Соответственно, мы информируем ИБ о том, какие данные в Splunk хранятся и обрабатываются, кто должен иметь к ним доступ. На этой основе мы согласовываем с коллегами из ИБ ролевую модель доступа.

Можно рассказать, каким образом Splunk позволяет бороться с таким явлением, как fraud?

Fraud очень неприятная история, когда с ней сталкиваешься. Например, нам встречались предложения на рынке от якобы операторов, которые продают услуги звонков в роуминге через симбоксы. Приходится такие эпизоды выявлять и блокировать. Для анализа и выявления сценария fraud используется Splunk, поскольку в данном случае подобные эпизоды будут выдавать себя своим поведением, так как они отклоняются от типовых схем и бизнес-процессов, принятых в системе. Машинные данные, которые приходится анализировать для противодействия fraud, работают и в других функциях, поэтому нам есть с чем сравнивать их содержание и сценарии поведения.

Но для более детального анализа данных и оценок ущерба у нас этим занимается другое подразделение. Наша задача — предоставить им платформу для работы с данными и их анализа. И радует то, что им удается действовать на опережение, то есть предугадывать мошеннические схемы поведения и блокировать прежде, чем злоумышленникам удастся их реализовать.

Данные и их объемы растут как грибы. Как можно координировать процесс, чтобы можно было управлять временем хранения и доступностью тех или иных данных?

Для этого на этапе запуска необходимо выработать внутреннюю политику хранения данных. Технически все делается просто, если удается выстроить и согласовать политики работы с данными. Гораздо важнее понять, к чему может привести пренебрежение подобной задачей управления хранением данных. Прежде всего, это вызовет дисбаланс, когда станет очень много замусоренных, неструктурированных данных, которые приходится хранить долго, а доля размеченных данных станет меньше. В итоге качество данных влияет не только на результаты работы системы, но и на деньги компании. Это продолжение темы подготовки данных для работы в Splunk.

Какие-то еще существуют правила работы с данными, о которых стоит напомнить?

Да, конечно. В частности, с данными нужно работать регулярно. Это означает, что мы постоянно изучаем и подключаем новые источники поступления информации. Проводим их глубокий анализ при необходимости отметая ненужное. Мы создали базу знаний, которая поддерживается в актуальном состоянии, накапливаем размеченные данные на основе существующих моделей - это требует привлечения в команду Data Scientists компетенций в виде специалиста, который занимается изучением данных и сохранением их в базе. Такая функция появилась у нас вместе с Splunk.

Это дорого?

Да. Поэтому лучше воспитывать и растить своих.

Есть еще одна проблема. Как удается отслеживать актуальность источников данных? Я имею в виду те, что потеряли свою актуальность, но продолжают генерировать данные. Или наоборот, данные перестают поступать из источника. Кто отвечает за эти источники данных?

В нашей команде это задача для администратора платформы. У нас уже сейчас более 1500 потоков, которые в онлайн-режиме предоставляют нам данные. Потеря данных от критически важных источников может привести к некорректным показателям, что, в свою очередь, способно мотивировать на принятие ошибочных решений. Проблема в том, что зачастую о неприятностях на источнике мы узнаем с опозданием. Поэтому мы переложили мониторинг удаленных источников на функционал Splunk на предмет того, что данные перестали поступать.

Журнал IT Manager

Опубликовано 04.12.2018

Об авторах

Олег Седов

эксперт по кибербезопасности

МегаФон Телекоммуникации Цифровизация

Предыдущая
Дюжина шагов к «цифре»

Следующая
Как снизить риски при обновлении системного ПО

Новостная лента

Главное за неделю

Нажимая на кнопку, я принимаю условия соглашения.

Соглашение об использовании сайта

Внимательно прочитайте настоящее Соглашение, прежде чем начать пользоваться Сайтом. Вы обязаны соблюдать условия настоящего Соглашения, заходя на Сайт и используя сервисы, предлагаемые на Сайте. В случае, если Вы не согласны с условиями Соглашения, Вы не можете пользоваться Сайтом или использовать любые сервисы, предлагаемые на Сайте, а также посещать страницы, размещенные в доменной зоне Сайта. Начало использования Сайта означает надлежащее заключение настоящего Соглашения и Ваше полное согласие со всеми его условиями.

1. Термины и определения

1.1. Компания - Общество с ограниченной ответственностью «ИТ Медиа» (ООО «ИТ Медиа»).

1.2. Пользователь - лицо, получающее доступ к сервисам и информации, размещенным на Сайте.

1.3. Сайт – веб-сайт Компании, размещенный в сети Интернет по адресу https://www.it-world.ru.

1.4. Соглашение - настоящее Соглашение между Пользователем и Компанией, устанавливающее правила использования Сайта, включая графические изображения, элементы дизайна и средства индивидуализации, текстовую информацию и документацию, программы для ЭВМ и файлы для скачивания, любые иные произведения, объекты и материалы Сайта, а также условия и правила размещения Пользователем информации и материалов в соответствующих открытых разделах Сайта.

2. Общие положения и условия

2.1. Любые материалы, файлы и сервисы, содержащиеся на Сайте, не могут быть воспроизведены в какой-либо форме, каким-либо способом, полностью или частично без предварительного письменного разрешения Компании, за исключением случаев, указанных в настоящем Соглашении. При воспроизведении Пользователем материалов Сайта ссылка на Сайт обязательна, при этом текст указанной ссылки не должен содержать ложную, вводящую в заблуждение, уничижительную или оскорбительную информацию. Перевод, переработка (модификация), любое изменение материалов Сайта, а также любые иные действия, в том числе удаление, изменение малозаметной информации и сведений об авторских правах и правообладателях, не допускается.

2.2. Действующая редакция настоящего Соглашения размещена в сети Интернет на Сайте по адресу: https://www.it-world.ru/about/agreement.php. Компания вправе в любое время в одностороннем порядке изменять условия настоящего Соглашения. Такие изменения вступают в силу по истечении 2 (двух) дней с момента размещения новой версии Соглашения в сети Интернет на Сайте. При несогласии Пользователя с внесенными изменениями он обязан удалить все имеющиеся у него материалы Сайта, после чего прекратить использование материалов и сервисов Сайта. Ваше регулярное посещение данного Сайта считается вашим убедительным принятием измененного соглашения, поэтому Вы обязаны регулярно просматривать настоящее Соглашение и дополнительные условия или уведомления, размещенные на Сайте.

3. Обязательства Пользователя

3.1. Пользователь обязуется не предпринимать действий, которые могут рассматриваться как нарушающие российское законодательство или нормы международного права, в том числе в сфере интеллектуальной собственности, авторских и/или смежных правах, а также любых действий, которые приводят или могут привести к нарушению нормальной работы Сайта и сервисов Сайта.

3.2. Любые средства индивидуализации, в том числе товарные знаки и знаки обслуживания, а равно логотипы и эмблемы, содержащиеся на страницах Сайта, являются интеллектуальной собственностью их правообладателей. Пользователю Сайта запрещено воспроизводить или иным способом использовать указанные средства индивидуализации и/или их элементы без предварительного письменного разрешения соответствующих правообладателей.

3.3. Компания стремится обеспечить, однако не контролирует и не гарантирует конфиденциальность и охрану любой информации, размещенной на Сайте или полученной с Сайта. Компания принимает разумные меры в целях недопущения несанкционированного разглашения размещенной Пользователем на Сайте информации третьим лицам, однако не несет ответственность в случае, если такое разглашение было допущено. В этой связи, передача информации на Сайт означает согласие Пользователя на любое воспроизведение, распространение, раскрытие и иное использование такой информации. Размещая информацию и материалы, включая, фотографии и изображения, Пользователь также гарантирует, что обладает всеми правами и полномочиями, необходимыми для этого, с учетом условий настоящего Соглашения и что такое размещение не нарушает охраняемые законом права и интересы третьих лиц, международные договоры и действующее законодательство Российской Федерации.

3.4. Пользователь самостоятельно несет ответственность за любую информацию и материалы, размещенные им на Сайте. Компания не инициирует размещение указанной информации, не выбирает получателей информации, не влияет на содержание и целостность размещаемой информации, а также в момент размещения Пользователем информации на Сайте не знает и не может знать, нарушает ли такое размещение действующее законодательство Российской Федерации, однако Компания вправе отслеживать, просматривать и/или удалять любую информацию и материалы, размещенные Пользователем на Сайте. При размещении любой информации и материалов Пользователь не становится соавтором Сайта и отказывается от каких-либо претензий на такое авторство в будущем. Компания не выплачивает Пользователю авторского или любого иного вознаграждения, как в период, так и по истечении срока действия настоящего Соглашения.

3.5. В случае предъявления третьими лицами претензий Компании, связанных с нарушением Пользователем условий настоящего Соглашения, а равно с размещенной Пользователем информацией на Сайте, указанный Пользователь обязуется самостоятельно урегулировать такие претензии, а также возместить Компании все понесенные убытки и потери, включая возмещение штрафов, судебных расходов, издержек и компенсаций.

3.6. Компания не несет ответственности за посещение Пользователем, а также любое использование им внешних ресурсов (сайтов третьих лиц), ссылки на которые могут содержаться на Сайте. Компания не несет ответственности за точность, надежность, достоверность и безопасность любой информации, материалов, рекомендаций и сервисов, размещенных на внешних ресурсах. Использование внешних ресурсов осуществляется Пользователем добровольно, исключительно по собственному усмотрению и на свой риск.

3.7. Компания стремится к обеспечению достоверности информации, размещенной на Сайте, однако не несет ответственности за любые неточности и/или недостоверность информации, а равно сбои в работе предоставляемых через Сайт сервисов. Пользователь согласен с тем, что Компания не несет ответственность и не имеет прямых или косвенных обязательств перед Пользователем в связи с любыми возможными или возникшими потерями, или убытками, связанными с любым содержанием Сайта, интеллектуальной собственностью, товарами или услугами, доступными на нем или полученными через внешние сайты или ресурсы либо иные ожидания Пользователя, которые возникли в связи с использованием размещенной на Сайте информации или ссылки на внешние ресурсы. Ни при каких условиях, включая, но не ограничиваясь невнимательностью или небрежностью Пользователя, Компания не несет ответственности за любой ущерб (прямой или косвенный, случайный или закономерный), включая, но не ограничиваясь потерей данных или прибылей, связанной с использованием или невозможностью использования Сайта, информации, файлов или материалов на нем, даже если Компания или ее представители были предупреждены о возможности такой потери. В случае, если использование Сайта приведёт к необходимости дополнительного обслуживания, исправления или ремонта любого оборудования, а равно восстановления данных, все связанные с этим затраты оплачиваются Пользователем самостоятельно.

3.8. Вся представленная на Сайте информация предоставляется «как есть», без каких-либо гарантий, явных или подразумеваемых. Компания полностью, в той мере, в какой это разрешено законом, отказывается от какой-либо ответственности, явной или подразумеваемой, включая, но не ограничиваясь неявными гарантиями пригодности к использованию, а также гарантиями законности любой информации, продукта или услуги, полученной или приобретенной с помощью этого Сайта.

3.9. Пользователь согласен, что все материалы и сервисы Сайта или любая их часть могут сопровождаться рекламой. Пользователь согласен с тем, что Компания не несет какой-либо ответственности и не имеет каких-либо обязательств в связи с такой рекламой.

4. Условия обработки и использования персональных данных. Принимая условия настоящего Соглашения Пользователь выражает свое согласие на:

4.1. Предоставление своих персональных данных, включающих имя, номера контактных телефонов; адреса электронной почты; место работы и занимаемая должность; пользовательские данные (сведения о местоположении; тип и версия ОС; тип и версия Браузера; тип устройства и разрешение его экрана; источник откуда пришел на сайт пользователь; с какого сайта или по какой рекламе; язык ОС и Браузера; какие страницы открывает и на какие кнопки нажимает пользователь; ip-адрес) своей волей и в своем интересе.

4.2. Цель обработки персональных данных:

предоставление Пользователю услуг Сайта;
направление уведомлений, касающихся услуг Сайта;
подготовка и направление ответов на запросы Пользователя;
выполнение регулярной информационной рассылки;
направление информации о продуктах и услугах Компании, а также рекламно-информационных сообщений, касающихся продукции и услуг Компании и ее партнеров.

4.3. Перечень действий с персональными данными, на которые Пользователь выражает свое согласие:

сбор, систематизация, накопление, хранение, уточнение (обновление, изменение), использование, обезличивание, передача третьим лицам для указанных выше целей, а также осуществление любых иных действий, предусмотренных действующим законодательством РФ как неавтоматизированными, так и автоматизированными способами.

4.4. Компания обязуется принимать все необходимые меры для защиты персональных данных Пользователя от неправомерного доступа или раскрытия.

4.5. Настоящее согласие действует до момента его отзыва Пользователем путем направления соответствующего уведомления заказным письмо с уведомлением на адрес Компании.

5. Прочие положения

5.1. Использование материалов и сервисов Сайта, а равно размещение на нем материалов Пользователя, регулируется нормами действующего законодательства Российской Федерации. Все возможные споры, вытекающие из настоящего Соглашения или связанные с ним, подлежат разрешению в соответствии с действующим законодательством Российской Федерации по месту нахождения Компании.

5.2. Признание судом какого-либо положения Соглашения недействительным или не подлежащим принудительному исполнению не влечет недействительности иных положений Соглашения.

5.4. Бездействие со стороны Компании в случае нарушения кем-либо из Пользователей положений Соглашения не лишает Компанию права предпринять соответствующие действия в защиту своих интересов и защиту авторских прав на охраняемые в соответствии с законодательством материалы Сайта позднее.

Пользователь подтверждает, что ознакомлен со всеми пунктами настоящего Соглашения и безоговорочно принимает их.

По всем вопросам, связанным с нарушением авторских прав Компании, незаконного использования материалов Сайта или размещением ложной, вводящей в заблуждение информации о Компании, просим обращаться по  следующим контактным данным:

ООО «ИТ Медиа» ИНН 7802426999, КПП 781301001,
Санкт-Петербург, ул Большая монетная, 16 / К. 30 литера А, пом. 14-Н №30