Moore Threads: колосс на глиняных ногах или будущий победитель?

Логотип компании
Moore Threads: колосс на глиняных ногах или будущий победитель?

Фотографии: пресс-служба Moore Threads Technology, www.mthreads.com

Пару лет назад пошли первые разговоры о появлении на мировом рынке нового производителя графических процессоров – Moor Threads, что в этом сегменте случается чрезвычайно редко. Что это за компания, какие у нее цели, стоят ли ее технологии внимания и действительно ли они принадлежат именно ей? Попробуем разобраться вместе.

Легенда

Moore Threads Technology – это китайская компания со штаб-квартирой в Пекине, основанная в октябре 2020 года Чжаном Цзяньчжуном. Утверждается, что ранее он занимал пост вице-президента и генерального менеджера в китайском филиале NVIDIA, чем якобы и объясняется быстрый старт на рынке видеочипов. Ведь Moore Threads претендует ни много ни мало на лавры первой китайской компании с разработанной с нуля графической архитектурой MUSA (MT Unified System Architecture). В развитие компании вложились такие инвестиционные фонды и компании, как Shenzhen Capital Group, GGV Capital, Sequoia Capital China, ByteDance и Tencent. Кроме прочего, с октября 2023 года Moore Threads включена в американский санкционный список ‘Bureau of Industry and Security's Entity List’, что косвенно подтверждает серьезность ее деятельности – просто так в него не попадают. Начиная с весны 2022 года Moore Threads провела несколько крупных презентаций и публично представила ряд разработок в области графических чипсетов для десктопов, рабочих станций, серверов и ИИ-ускорителей, рассчитанных в первую очередь на внутренний рынок Китая. В связи с тем, что ее руководство предпочитает не давать публичных комментариев по целому ряду вопросов своей деятельности и некоторых технологических особенностях, в СМИ циркулирует ряд устойчивых слухов, проверить которые не представляется возможным.

В наличии

В начале апреля 2022 года Moore Threads анонсировала графические процессоры MTT S60 (для персональных настольных ПК) и MTT S2000 (для серверов), выполненные на базе 12-нм техпроцесса и архитектуры MUSA. На борту S60 8 Гбайт LPGDDR4x, а заявленная вычислительная мощность видеокарты составляет 6 терафлопс. В свою очередь, S2000 снабжена 32 Гбайт памяти, а ее мощность составляет 12 терафлопс. В рамках используемой архитектуры MUSA обеспечивается поддержка DirectX Runtime, OpenCL, OpenGL, Vulkan и NVIDIA CUDA. Кроме того, представленные видеокарты поддерживали кодирование и декодирование видео в форматах H.264, H.265, AV1, только декодирование – VP8, VP9. Видеокарту MTT S2000 также можно использовать при работе с ПО для игр и проектирования Houdini (Side Effects Software), Unreal Engine (Epic Games), Unity (Unity Technologies), D5 Render (Dimension 5 Techs). Карты совместимы с компьютерами и серверами на базе процессоров х86 и ARM.

Весной 2023 года были представлены еще два графических ускорителя MTT S80 с 16 Гбайт 256-битной GDDR6-памяти и MTT S70 с 7 Гбайт 224-битной GDDR6-памяти. Основные технические характеристики S80: максимальная частота ядра – 1800 МГц, эффективная частота памяти – 14 ГГц, пропускная способность памяти – 448 Гбайт/с, вычислительная мощность – до 14,4 терафлопс, теоретическая максимальная скорость закраски – 460 гигапикселей/с, шина – PCI Express 5.0 x16, энергопотребление – до 255 Вт. Основные технические характеристики S70: максимальная частота ядра – 1600 МГц, эффективная частота памяти – 14 ГГц, пропускная способность памяти – 392 Гбайт/с, вычислительная мощность – до 11,2 терафлопс, теоретическая максимальная скорость закраски – 358 гигапикселей/с, шина – PCI Express 5.0 x16, энергопотребление – до 220 Вт. В системном корпусе каждая из видеокарт занимает пространство 2,5-3 слотов, хотя официально заявлено двухслотовое исполнение. Связано это, видимо, с массивной системой охлаждения из внушительного кулера и трех вентиляторов. Ситуация по разъемам отличная: три порта DispayPort 1.4 и один HDMI 2.1.

Moore Threads: колосс на глиняных ногах или будущий победитель?. Рис. 1

В обеих картах используется графический процессор под кодовым названием Chunxiao (техпроцесс 7 нм), но разных версий. Изначально этот GPU производился на производственных линиях тайваньской TSMC, но после усиления американских санкций в отношении КНР, скорее всего, основным производителем станет китайская SMIC.

Стоит отметить, что при использовании в современных играх видеокарты показывают низкую скорость и производительность даже на низких или в лучшем случае средних настройках графики. В большинстве опубликованных тестов, с которыми нам удалось ознакомиться, речь идет о разрешении максимум на уровне Full HD, а часто даже меньше, что тоже не всегда позволяло избежать неожиданных просадок, лагов и фризов. В некоторых старых играх, например Crysis 3, оптимизация была на приемлемом уровне, в связи с чем получалось достичь относительно высоких FPS и качества картинки в целом, но это исключение. Во всех остальных игровых тестах китайские видеокарты проигрывали в полтора-два раза даже Nvidia GeForce GTX 1650, не говоря о GeForce RTX 3050 и других. Список официально поддерживаемых игр ограничен специфичным набором довольно зрелых релизов, о новинках речи не идет. При этом важно отметить, что за отставание видеокарт Moore Threads в значительной степени ответственны проблемы с драйверами и оптимизацией, так как в процессе тестирования китайские чипы были загружены не более чем на 70%. Удастся ли компании наладить контакт с разработчиками игр, чтобы устранить эту проблему, – вопрос открытый.

На этом фоне объемы памяти в 16 Гбайт и даже в 7 Гбайт представляются избыточными в силу того, что остаются невостребованными, по крайней мере если рассматривать эти решения именно как игровые. Также стоит отметить низкую энергоэффективность на фоне показателей конкурентов. При этом по таким параметрам, как количество используемых в картах транзисторов, тензорных ядер, теоретическая максимальная скорость закраски и скорость выборки текстур китайские видеокарты смотрятся хорошо. Достоинством является также использование скоростного интерфейса PCIe 5.0, который пока не представлен в устройствах других производителей. Пожалуй, главной проблемой китайских видеокарт остается отсутствие на данный момент качественных графических драйверов – нынешние их версии существенно снижают производительность графических ускорителей.

Происхождение

Изначально новая графическая архитектура была заявлена как чисто китайская технология, но чрезмерно быстрое продвижение вендора от идеи уровня стартапа к реальному, пусть и сырому, продукту вызывало у скептиков определенные сомнения, что архитектура действительно разработана с нуля за предельно малый срок – один-два года. Впрочем, очевидно, что такого уровня продукты давно никем не разрабатываются без использования базовых наработок других компаний – это просто нерационально. Эксперты по всему миру сходятся во мнении, что если Moore Threads использовала чьи-то разработки, то это были некоторые технологии британской Imagination Technologies, которая известна своими графическими ядрами PowerVR, широко применявшимися в различной технике, от смартфонов и планшетов до телевизоров –- Apple, Samsung и др. Причем сотрудничество, судя по всему, было (если было, так как достоверно это неизвестно) официальным.

Реальные цели

Нетрудно догадаться, что появление и стремительное развитие компании Moore Threads связано с существенным усилением в 2022-2023 гг. санкционного давления на Китай. При этом, несмотря на то что Moore Threads частью своей целевой аудитории называет обычных пользователей, маловероятно, что геймеры, как профессионалы, так и любители, захотят добровольно покупать сырые, недоработанные видеокарты, которые гораздо лучше подходят для выполнения задач других категорий, например для использования в системах ИИ, нейросетях и больших языковых моделях. Кроме того, видеокартами Moore Threads можно оснащать офисные ПК в госучреждениях для снижения рисков ИБ.

Как бы подтверждая эти догадки, в декабре 2023 года Moore Threads представила специализированный ускоритель вычислений MTT S4000 на фирменном графическом процессоре на основе архитектуры MUSA третьего поколения с производительностью на уровне 200 TOPS (триллионов операций в секунду) в операциях, связанных с искусственным интеллектом и большими языковыми моделями. Устройство, на борту которого размещено 48 Гбайт GDDR6-памяти, поставляется в виде обычной PCIe карты расширения. Как и в других видеокартах компании, здесь используется шина PCIe 5.0, общая пропускная способность карты равна 768 Гбайт/с. Поддерживается интерфейс MTLink 1.0, с помощью которого можно объединять вычислительные возможности сразу нескольких ускорителей.

Moore Threads: колосс на глиняных ногах или будущий победитель?. Рис. 2

Про новое устройство MTT S4000 известно, что его производительность в операциях FP32 составляет 25 Тфлопс, в операциях TF32 – 50 Тфлопс, в операциях FP16/BF16 – 100 Тфлопс и в операциях INT8 – 200 TOPS. Это в разы больше показателей представленных в том же декабре 2023 года новых процессоров Intel Core Ultra (до 34 TOPS) и AMD Ryzen 8040 (до 16 TOPS) со встроенными NPU-модулями (Neural Processing Unit), или, иначе говоря, нейронными сопроцессорами, предназначенными специально для ИИ-вычислений. В то же время китайская новинка пока не может сравниться с флагманскими моделями специализированных решений для ИИ-вычислений от NVIDIA и AMD. Например, NVIDIA H100 в PCIe-исполнении с 80 Гбайт памяти на борту выдает до 51 Тфлопс в операциях FP32, до 756 Тфлопс в вычислениях TF32, 1513 Тфлопс в операциях FP16/BF16 и до 3026 TOPS – в INT8.

Интересно, что китайцы снабдили свой ИИ-ускоритель полноценным набором внешних видеоразъемов, что несвойственно для решений этого класса. MTT S4000 поставляется с набором ПО USIFY, которое обеспечивает совместимость с платформой NVIDIA CUDA. Нейронный ускоритель будет продаваться не только как самостоятельное устройство, но и в рамках серверных систем KUAE, аналогичных NVIDIA DGX. В частности, сервер KUAE MCCX D800 оснащен сразу восьмью ускорителями MTT S4000, работающими как единое целое. Более того, при необходимости серверы можно объединять в еще более крупные кластерные структуры. Moore Threads MTT S4000 поддерживает работу с популярными большими языковыми моделями: LLaMA, GLM, Aquila, Baichuan, GPT, Bloom, Yuyan и т. д. Стоимость новинки пока неизвестна.

Выводы

Устройства, выпускаемые в настоящее время компанией Moore Threads, создаются под конкретные задачи, которые имеют мало пересечений с целеполаганием обычных пользователей. Как было сказано выше, они подойдут для оснащения офисных компьютеров в госсекторе, а также для особых вычислений, например в области ИИ и нейросетей. В частности, первая тысяча представленных в декабре прошлого года карт MTT S4000 будет размещена в первом в Китае крупномасштабном вычислительном кластере, создаваемом для решения задач в области ИИ. Очевидно, что подобный проект не может состояться без участия государства.

Увы, но нового конкурента в сегменте видеокарт для геймеров пока не получилось – здесь китайские видеочипы существенно проигрывают современным аналогам от AMD, NVIDIA и Intel. Более того, возможности китайской промышленности в области высокотехнологичных чипов (к коим, безусловно, относятся чипы Moore Threads) весьма ограниченны, и приоритетная задача для компании – обеспечение продукцией внутренних заказчиков. В связи с этим Moore Threads пока что не планирует выход на другие рынки и не продвигает свою продукцию где-либо, кроме Китая, а официальный сайт не переведен даже на английский язык. Конечно, если вы гик и экспериментатор, то посредством определенных усилий сможете найти посредника в Поднебесной, который приобретет видеокарту Moore Threads для вас и отправит в Россию, но большинству пользователей эти видеокарты просто не нужны.

Инженерам и программистам компании Moore Threads предстоит огромная работа по преодолению сложностей, связанных с адаптацией и доработкой довольно старых технологий, на базе которых они начали создавать собственную архитектуру. Еще больше работы ждет их в области разработки ПО и драйверов для новых графических процессоров. В любом случае, с учетом того, насколько несостоятельна конкуренция на рынке производителей графических процессоров, остается только пожелать удачи Moore Threads – ее успехи в будущем могли бы существенно взбодрить рынок.

Опубликовано 25.01.2024

Похожие статьи