Цифровизация научных знаний

Логотип компании
Цифровизация научных знаний
Сегодня ученым даже внутри одной крупной организации бывает непросто получить все необходимые данные

Директор по информационным технологиям, если он настоящий профессионал, постоянно развивается, совершенствует свои знания и компетенции, не боится работать в самых различных компаниях, представляющих разные отрасли и сферы деятельности. При этом он везде погружается в предметную область, поскольку задача ИТ и состоит в том, чтобы оптимизировать и сделать более эффективной работу любого сотрудника: менеджера, финансиста, производственника, ученого. Об этом мы беседуем с Олегом Пустельниковым, вице-президентом по инжинирингу британско-российской компании Genestack, разрабатывающей решения в области биоинформатики.

С чего вы начали свой путь в информационных технологиях?

В старших классах школы я увлекся ИТ. Тогда не так много было возможностей для этого, компьютеров в каждом доме еще не было, но мой школьный приятель мог иногда пользоваться компьютером на работе у своего отца и позвал меня присоединиться. Там мы и создавали свои первые программы. Затем была учеба по специальности «прикладная математика» в Ленинградском Кораблестроительном институте. Со второго курса я уже начал работать программистом, писал сначала на dBase, потом на FoxPro, создавая автоматизированные системы для автотранспортного предприятия, Комитета по труду и занятости и других заказчиков. Затем руководил небольшой командой, которая писала информационную систему на С++ для организации процессов декларирования товаров на Пулковской таможне. Проекты для разработчиков некоторое время не подворачивались, а “компьютерщик” в те времена означало очень широкий спектр навыков, так что я устроился системным администратором в компанию «Пепси-кола». Так мне довелось на много лет погрузиться больше в ИТ-инфраструктуру, чем в разработку. В разных зарубежных компаниях я работал сначала системным администратором, затем руководителем администраторов, иногда выполняя смежные функции вроде менеджмента проектов. В итоге, имеется опыт работы в сервисных и производственных компаниях и даже в телекоме.

В 2008 году пришел в компанию «Яндекс-Деньги» директором по эксплуатации, то есть топ-менеджером, отвечающим полностью за функционирование всей платежной системы, отдал этой компании шесть лет своей жизни, приобрел бесценный опыт и уходил оттуда уже будучи техническим директором, отвечающим за весь ИТ-блок (разработка и эксплуатация).

В «Яндекс-Деньгах» я начал с наведения порядка, поскольку компания росла очень быстрыми темпами, и в администрировании работы был непочатый край. Вначале приходилось «тушить пожары», а плановой работы было очень мало. Спустя какое-то время нам удалось все это структурировать и организовать регулярный менеджмент и основные процессы по модели ITIL, с соответствующими контрольными показателями. Видимо, хороший результат подтолкнул моё руководство поручить мне изменить и оптимизировать процессы и в разработке ПО. В то время там трудилось человек 80. В течение следующих трех лет мы перевели разработку с классического Waterfall на Agile. Период разработки некоторых новых элементов системы сократился, но, самое главное, стал более прозрачным для бизнеса с возможностью менять что-то прямо по ходу проекта. Ведь преимущество Agile — это не столько скорость, сколько прозрачность для бизнеса и возможность частой обратной связи. Если вспомнить период 5–7-летней давности в индустрии интернет-платежей, то там тогда происходили радикальные изменения, которым надо было соответствовать. Это же требовало от всех участников глубокого осознания разнообразных аспектов деятельности платежных систем, от безопасности до бухгалтерского учёта. В последний год работы в «Яндекс.Деньгах» я ещё успел запустить проект эмиссии своих платёжных карт, что потребовало погружения в мир карточных платежей и его тонкости.

Затем я ушёл в новый проект, где мы строили аналогичную платёжную систему с абсолютного нуля, собирая команду, прорабатывая требования и архитектуру. Платежная система обеспечивала интернет платежами букмекерский бизнес, который получил новый закон, легализующий приём ставок на спортивные мероприятия в интернете. Пришлось погружаться в тонкости законодательства, новые нормы банковского регулирования и всё прочее. За год мы запустили первые платежи и потом еще два года продолжали развивать систему. Под конец я осознал, что, несколько устал от платежных систем и финансов, поскольку там очень жесткое законодательное регулирование и в какой-то момент ты начинаешь понимать, что не столько делаешь удобный сервис для пользователей, сколько выстраиваешь соответствие многочисленным требованиям законодательства, регулирующих органов, международных стандартов.

Когда меня пригласили в компанию Genestack, занимающейся разработкой платформы для биоинформатиков, мне стало крайне интересно. Сразу несколько внутренних мотиваторов сошлось воедино. Во-первых, возможность работать на благо человечества. Это внутренняя потребность делать что-то хорошее, нести пользу людям. Мне кажется, что есть области, где это ощущаешь более явно – медицина, биология. Во-вторых, это возможность ещё больше вернуться в область разработки программного обеспечения, которая для меня, как я понял, всегда была всё же интереснее. Ну и наконец, ощущение, что именно в этой компании, в этот момент её развития я оказываюсь на своём месте, могу приносить ощутимую пользу, а значит и сам буду получать удовлетворение от работы.

Мы в течение жизни выстраиваем свои компетенции. Каждая компания добавляет что-то. Вы достигли высот в финансовой сфере. И вдруг радикальная смена деятельности. Как вы решились на такое?

Радикальной сменой деятельности было бы, если бы я пошел учиться и работать, например, врачом. Но ИТ везде чем-то похожи. Повсюду приложения, инфраструктура, люди. В мои обязанности здесь всё также входит управление процессами разработки, выстраивание принципов деятельности разработчиков. Конечно, я постепенно погружаюсь в тему генетических исследований, от этого никуда не деться, но это как раз то, что мне интересно и то, что и явилось причиной выбора именно этого места работы.

Чем занимается ваша компания?

Компания Genestack занимается биоинформатикой — некой комбинацией программирования с биологией. Эта отрасль появилась в такой момент, когда у биологов стало слишком много данных для их ручной обработки. Понадобились инструментальные средства, которые бы анализировали результаты исследований и превращали их в цифры. А цифр становится много. Если еще несколько лет назад сканирование генома человека стоило миллионы долларов и подобный проект осуществлялся на уровне целых государств, таких как США, то сейчас можно пойти в любую крупную клинику и всего за сотню-другую долларов в течение нескольких дней получить полную расшифровку своего генома. Сейчас это входит в ежедневную деятельность многих фармацевтических компаний, которые, например, принимают за правило изучать мутации и экспрессию тех или иных белков после применения лекарственного препарата. Развитие техники идет лавинообразно, поэтому такие исследования становятся массовыми. Этим занимаются не только фармацевтические, но и косметические компании. Биоинформатика должна работать с данной информацией. Чтобы заниматься этой дисциплиной, нужно разбираться в биологии, в статистике, уметь программировать, работать с массивами данных. Наша компания позволяет биологам решать стоящие перед ними задачи на современном уровне. Мы создаем платформу, которая позволяет организовать и каталогизировать данные, с возможностью поиска и объединения в наборы для дальнейшего анализа и обработки. Это не всегда большие данные в классическом понимании, но учёные уже начинают применять к ним технологии искусственного интеллекта и машинного обучения. Пока же мы находимся на этапе помощи биологам и стараемся разобраться в хитросплетении данных, быстро что-то найти, обработать определенным образом, собрать из разных источников информацию для релевантного анализа с возможностью визуализации результатов. Таких инструментов еще очень мало.

Как можно расширить и развить применение больших данных в биоинформатике?

Чем дальше, тем больше мы движемся в сторону машинного обучения. Есть ряд операций, которым можно научить компьютер. Например, курирование данных. Ученый садится и начинает вручную разбирать набор данных, выбирать из них качественные и отбраковывать некачественные. Рано или поздно мы научим компьютер запоминать паттерны его поведения, а затем и делать это без участия человека. Уже сегодня используются статистические инструменты, а значит, скоро придёт время и AI/ML.

Каким образом ИТ делают труд ученого более производительным?

Прежде всего, мы делаем информацию более доступной, чтобы ученый мог не вникать в то, как работают базы данных, как хранятся файлы на дисках, в облаках или ещё какие-то технические моменты, а мог просто описать, что ему нужно на понятном для него языке. Плюс, наша платформа, например, позволяет объединить море разрозненной информации для такого поиска в единое пространство. Сегодня ученым даже внутри одной крупной организации бывает непросто получить все необходимые данные, хотя они, возможно, уже имеются у других подразделений – он пишет запросы, ждет ответ по несколько дней или даже недель, уточняет, узнаёт, у кого из коллег какая информация имеется.  Вторая важная задача — обработка и визуализация. И когда данные уже выбраны и соответствующим образом обработаны, ученый, конечно, хочет видеть, как различные параметры связаны, какие закономерности присутствуют в наборах данных.

В чем заключаются ваши обязанности в компании Genestack?

Мою должность можно перевести как «вице-президент по инжинирингу». По сути, это означает, что я выстраиваю процессы разработки и эксплуатации ПО, а все разработчики и технический персонал находятся в зоне моего влияния. Моя задача состоит в том, чтобы все делалось дешево, быстро и эффективно (насколько это в пределах возможного, разумеется).

За «железо» тоже вы отвечаете?

У нас нет своего «железа». Мы обходимся облачными решениями, чаще всего это ресурсы компании Amazon по модели IaaS. Все наши заказчики находятся за пределами России.

С российскими заказчиками вы не работаете?

Дело в том, что в России отсутствует такой рынок. Собственно, у нас практически нет таких компаний, которые бы реально инвестировали в науку, в генетику. Наши фармацевтические компании, насколько я знаю, заняты тиражированием западных лекарств. Ведут ли они собственные исследования и разработки, а если ведут, то какими инструментами для этого пользуются? По крайней мере, запросов со стороны российских компаний мы не получали. Наши заказчики — компании, которые уже накопили большие объемы данных, например, швейцарский фармацевтический холдинг Roche, транснациональная корпорация Unilever и другие крупнейшие игроки мирового уровня.

Не стало ли сложнее работать в связи с ухудшением международной политической ситуации и санкциями?

Мы столкнулись со сложностями, связанными с доступом к облакам Amazon. Это связано с блокировкой Роскомнадзором мессенджера Telegram. Разумеется, с этими проблемами мы справились. Но это вопросы чисто технические, а вот с политическими проблемами мы не сталкивались ни разу.

Почему британская компания разместила свои подразделения разработки в России?

Собственно говоря, компания интернациональная, как по составу, так и по местоположению офисов. Наш основатель и генеральный директор родом из России. Наш основной инвестор — изначально российская, а теперь уже тоже международная компания JetBrains, с которой мы ведём, помимо прочего, совместные проекты. Таким образом, вполне органично сложилось, что значительная часть персонала у нас из России и работает в Санкт-Петербурге. К тому же, это экономически оправдано наличием сильной инженерной школы в России и текущим состоянием рынка труда. Мы одна из немногих компаний Санкт-Петербурга, занимающаяся биоинформатикой и начинающая подключать AI/ML в этой области и именно здесь есть специалисты, которым это интересно и которые имеют релевантный опыт. В Кембридже у нас есть представители многих профессий, включая и разработчиков, но сам офис существенно меньше.

Кстати говоря, мы с удовольствием приглашаем ребят с хорошей разработческой базой, готовых и желающих учиться биоинформатике, стать частью нашей дружной компании.

Насколько широко вы используете облака?

Очень широко. На моих предыдущих проектах, где законодательство обязывало нас держать данные на территории России, приходилось использовать свое собственное «железо», пусть даже в арендуемых дата-центрах. Конечно, держать все в облаке намного проще. Если ты используешь стабильное облако, в долговременной перспективе проблем с инфраструктурой намного меньше.

Многие российские ИТ-директора считают использование облаков, таких как Amazon, большим риском. Тем не менее крупнейшие западные компании активно переходят на их применение. Кто прав?

Вопрос сохранности данных нужно решать в комплексе. Если ты купил сервер и поставил его у себя в серверной или в ЦОДе, это вовсе не дает гарантию, что твои данные будут в безопасности. Нужно позаботиться о бэкапе и резервировании. То же самое можно сказать и в отношении Amazon. Никто не запрещает делать резервные копии в другое облако, а вероятность того, что несколько крупнейших мировых провайдеров упадут, ничтожно мала. Это надуманные страхи. Но и у Amazon есть сервисы с разным уровнем SLA и разной гарантией доступности. На более дешевых можно держать менее критичные данные, на дорогих, где провайдер отвечает значительными денежными штрафами и быстро реагирует на сбои и проблемы, можно разместить более важные данные. Как бы то ни было, я не вижу существенных рисков, связанных с размещением данных в хорошем облаке от ведущего мирового провайдера. Важно и то, что мы существенно экономим на персонале. Хороший системный администратор стоит денег, а при использовании облаков мы можем содержать их втрое меньше, чем если бы у нас было собственное «железо».

И последний вопрос. Чему вы учитесь в каждой из новых компаний?

В каждой компании есть свои особенности. На каждой новой работе я находил что-то новое как в предметной области, так и в технологиях. Безусловно, погружаешься, разбираешься, ведь нельзя же реально управлять чем-либо, ничего не понимая. В финансовых компаниях мне приходилось изучать систему электронных платежей, взаимоотношения с партнерами, законодательные требования. На нынешнем месте работы я погружаюсь в генетику и биоинформатику, узнаю, например, чем мутация отличается от транскрипции (первое – изменение в генном коде, второе – уровень активности гена в клетке). Кстати, возвращаясь из инфраструктуры в чистую разработку, я вижу, сколько нового в ней за последнее время появляется: платформы, библиотеки, инструменты. В этом тоже нужно успевать разбираться.  

Опубликовано 04.09.2018

Похожие статьи