Тони ХЕЙ: «Нам нравится работать с умными людьми»

Логотип компании
Тони ХЕЙ: «Нам нравится работать с умными людьми»
Ситуацию изменили профессор Джеффри Хинтон и его коллеги из Университета в Торонто. Хинтон изучал нейронные сети и вместо концентрации на одном скрытом уровне он анализировал сразу множество скрытых уровней. Этот подход получил название «метод глубоких нейронных сетей»...

В августе Microsoft в лице своего исследовательского подразделения Microsoft Research провела в Москве «Летнюю школу» – ежегодное мероприятие для студентов, аспирантов и молодых ученых. Целую неделю специалисты Microsoft и других технологических компаний, а также известные ученые делились с молодым поколением своими знаниями. В этом году основная тема школы – Big Data. Ключевым спикером школы выступил Тони Хей (Tony Hey), вице-президент Microsoft Research Connection. Он уже восемь лет отвечает за налаживание связей Microsoft Research с научными организациями и университетами всего мира. Мы задали мэтру несколько вопросов.

 

Чем сегодня занимается Microsoft Research? Какие направления исследований наиболее интересны?

Назову лишь две темы: прогресс в области машинного обучения в аспекте распознавания речи, компьютерного видения, а также машинного перевода. В последнее время эти направления существенно продвинулись вперед. Например, в области распознавания речи был период, примерно десятилетний, в течение которого никакого прогресса не наблюдалось. Но затем произошел прорыв, благодаря которому вычислительная машина уже неплохо распознает речь. Конечно, не так хорошо, как человек, но довольно прилично. Так, Рик Рашид (Richard Rashid), директор по разработкам Microsoft, недавно выступил с речью на английском языке, и компьютер автоматически интерпретировал ее в текст. Параллельно шел автоматический перевод на китайский язык, и затем с помощью технологий преобразования текста в речь, уже звучала на китайском языке. Это пример интересных разработок, которые начинают приближаться к коммерческому использованию. Что касается машинного видения или машинного зрения, то здесь нужно упомянуть наш Kinect, который позволяет управлять компьютером жестами. Еще одна область – взаимодействие с пользователем естественными средствами. Сюда следует отнести такие методики, как дополненная реальность. Представьте ситуацию: хирург удаляет опухоль головного мозга. С помощью средств компьютерной визуализации он видит расположение опухоли внутри черепа, но ему не надо отрываться от операции, чтобы касаться органов управления компьютером, поскольку тот сам распознает его жесты: например, по мере необходимости увеличит или уменьшит масштаб изображения требуемого участка мозга и т. д.

 

Еще лет двадцать назад появились первые приложения в области машинного перевода, однако то, как они работали, вызывало смех. В дальнейшем качество перевода улучшалось, но слишком медленными темпами. Вы же говорите о неком революционном скачке. За счет чего он произошел?

Когда в 90-е годы начались попытки разработки в области машинного перевода, тогда ошибки при переводе составляли 30%. Снизить этот процент никак не удавалось, и вот на этом уровне данные системы оставались на протяжении многих лет. Ситуацию изменили профессор Джеффри Хинтон (Geoffrey Hinton) и его коллеги из Университета в Торонто, которые сотрудничали с Microsoft Research. Хинтон изучал нейронные сети в течение многих лет, и новизна его подхода заключалась в том, что вместо концентрации на одном скрытом уровне он анализировал сразу множество скрытых уровней. Этот подход получил название «метод глубоких нейронных сетей». В Microsoft Research поняли, что, используя его, можно резко сократить процент ошибок при переводе. Так что Microsoft Research сыграла ключевую роль в том, чтобы приблизить эти разработки к практическому использованию, и сегодня они применяются в продуктах не только Microsoft, но и других компаний, например Google.

 

Какой процент разработок Microsoft Research находит коммерческое применение?

Цель Microsoft Research – вести исследовательскую работу и изобретать новые технологии, новые возможности. Работа ведется в нескольких направлениях. Первое – Blue Skies Research («Исследования в голубом небе») – сугубо поисковое, перед ним не ставится никаких практических задач. Распознавание речи или компьютерное зрение тоже можно отнести к данной области. Мы работали по этим темам примерно десять лет. И наши поисковые исследования привели к появлению революционных технологий. Однако мы не концентрируемся исключительно на достижении прорывных результатов и много усилий направляем на постепенное улучшение той или иной технологии. По сути, нет ни одного продукта Microsoft, в котором не были бы использованы результаты деятельности Microsoft Research. Следующее направление – исследования, которые можно назвать вспомогательными. Они помогают в разработке систем, лежащих в основе других приложений Microsoft. К примеру, распознавание текста, применяемое в работе поисковиков. Но вернусь к машинному переводу. Нами создано средство, реализующее модель краудсорсинга в машинном переводе – Microsoft Translator Hub. В нем можно найти поддержку языков этнических меньшинств, к примеру таких, как майя. Но помимо этого мы обнаружили удивительные варианты коммерческого применения наших разработок. Дело в том, что теперь можно создавать систему перевода, ориентированную на конкретный бизнес-сегмент, скажем, на область высокой моды. Если вы хотите перевести текст о моде с английского на русский, то Microsoft Translator Hub сделает это гораздо качественнее простого электронного переводчика, поскольку содержит специальный терминологический словарь. Еще один пример. На Гаити было сильное землетрясение. Перед нами стояла задача быстро создать систему перевода с английского языка на креольский, чтобы оперативно доносить необходимую информацию до сотрудников спасательных служб. Если бы мы решали эту задачу традиционным способом, с помощью правил, потребовались бы многие месяцы, а благодаря использованию технологий машинного обучения, основанных на концепции работы с параллельными текстами, удалось решить задачу за пять дней.

 

Исследовательские подразделения есть, наверное, у всех глобальных IT-корпораций. Сотрудничает ли с ними Microsoft Research в фундаментальных областях?

Насколько мне известно, у Microsoft самое крупное подразделение фундаментальных исследований. Возможно, с нами можно сравнить только аналогичное подразделение IBM. Наши научные сотрудники ведут работу в обычном режиме: публикуют статьи, выступают на конференциях, взаимодействуют с коллегами из других научных структур и университетов. В других компаниях сотрудники таких подразделений так не работают, в частности это относится к Google: там они подчинены продуктовому подразделению и работают в кооперации с практическими разработчиками. Если бы вы были ученым в области информатики и стремились заниматься фундаментальными исследованиями, у вас было бы не так много реальных вариантов для работы, помимо Microsoft Research.

 

В России очень хорошая научная школа. Как Microsoft Research сотрудничает с ней? Планируется ли расширять и углублять это взаимодействие?

Моя задача как вице-президента состоит в том, чтобы обеспечить взаимодействие Microsoft Research с научными учреждениями в тех странах, где наука находится на достаточно высоком уровне. К таковым относится и Россия. За последние пять лет мы реализовали ряд проектов в сотрудничестве с университетами Москвы, Санкт-Петербурга, Нижнего Новгорода. Нам нравится работать с умными людьми. Я стараюсь так организовать этот процесс, чтобы университетские ученые работали в непосредственном контакте с Microsoft Research. Мы стремимся расширять это взаимодействие. Естественно, хотелось бы, чтобы кто-то из лучших российских ученых в области вычислительных технологий перешел к нам на работу. Но если они предпочтут оставаться в своих университетах, это никоим образом не помешает нашим творческим контактам.

 

Каждое лето Microsoft Research проводит в России «Летнюю школу». Что это дает непосредственно самой корпорации?

Как я уже говорил, мы заинтересованы работать с умными людьми. В России очень много умных людей и хороших университетов, а «Летняя школа» открывает много возможностей как для слушателей, молодых ученых, так и для нас, организаторов. Не только в России, но и в других странах Европы и Азии ощущается острая нехватка специалистов, умеющих работать с информационными системами. Но, повторяю, если человек хочет заняться фундаментальными исследованиями в области информатики, хочет, чтобы результаты его исследований воплотились в новых продуктах, Microsoft Research – отличный вариант для этого.

Смотреть все статьи по теме "Большие данные (Big data)"

Опубликовано 27.08.2013

Похожие статьи