Сотрудники студий дизайна, проектных бюро, рекламных агентств и видеопродакшена пользуются графикоемкими программами, такими как Autocad, Photoshop и 3dsmax. Если развернуть ВМ для VDI на серверах с CPU, то это приведет к перебоями в работе и низкой производительности графики. Поэтому все чаще бизнес создает виртуальные рабочие места на базе серверов с GPU или выбирает облачных провайдеров, которые предоставляют в аренду VDI с графическими ускорителями.
В этом материале специалисты ITGLOBAL.COM рассказали, на какие критерии обращать внимание при выборе графического процессора для VDI-инфраструктуры.
Количество GPU в плате
При размещение одного GPU в плате задачи всех пользователей выстраиваются в единую очередь, поэтому рендеринг графики и обработка данных может происходить с задержками. Если графический ускоритель не справляется с нагрузками, лучше использовать более мощные модели GPU, у которых внутри предусмотрено несколько чипов. С их помощью можно создавать профили пользователей разных размеров и типов, такие как виртуальные ПК и виртуальные рабочие станции.
GPU с несколькими чипами обеспечивают более высокую производительность и параллельную обработку задач. При работе нескольких графических ускорителей задачи меньше конфликтуют между собой и выстраиваются сразу в несколько очередей, которые соответствует числу GPU. Это полезно компаниям, где большое количество пользователей одновременно работают с графически интенсивными приложениями.
Количество ядер CUDA
В GPU от ведущего вендора NVIDIA есть специализированные вычислительные ядра CUDA. Они спроектированы для параллельных вычислений и обработки данных на GPU. Каждое ядро может выполнять небольшую часть задачи независимо от других ядер, поэтому чем их больше, тем лучше графический ускоритель справляется со своей работой.
Основная задача таких ядер — помогать рассчитывать графические объекты и отрисовывать изображения (рендеринг) на дисплее. У других производителей, таких как AMD, существуют аналогичные технологии для параллельных вычислений, например, AMD ROCm (Radeon Open Compute).
В графических картах, спроектированных специально для использования в инфраструктуре виртуальных рабочих мест, ядра CUDA также распределяются между GPU чипами, таким образом способствуя изоляции вычислительной нагрузки и снижению влияния пользователей друг на друга. Обратная сторона такого распределения — количество ядер на отдельном чипе может быть недостаточным для задач, связанных со сложными вычислениями и расчетами, однако для типовых задач VDI этого достаточно.
Количество тензорных ядер
Тензорные ядра представляют собой специализированные вычислительные блоки в графических процессорах (GPU), которые спроектированы для обработки тензоров. Тензоры — это многомерные массивы данных, которые являются основным инструментом в машинном обучении и глубоком обучении.
Ядра не участвуют в рендеринге напрямую, но они играют важную роль в технологиях обработки изображений. Например, в DLSS, когда отрисованное изображение нужно с минимальными потерями качества масштабировать на другое разрешение или дорисовать пропущенные кадры, чтобы увеличить показатель количества кадров в секунду (FPS).
На графических картах для VDI тензорные ядра также равномерно распределены между вычислительными чипами и со своими функциями справляются отлично. Однако для задач, связанных с машинным обучением, программированием искусственного интеллекта и тому подобных, лучше использовать специализированные карты.
Количество RT-ядер
RT-ядра (ядра трассировки лучей) обеспечивают высокую точность рендеринга и создают эффекты, близкие к реальным условиям освещения, что значительно повышает качество визуализации.
С использованием технологии трассировки лучей в реальном времени каждый луч света от источника проходит через сцену и взаимодействует с объектами на своем пути. Это позволяет получать фотореалистичные отражения, лучистые и мягкие тени, эффекты преломления света и множество других деталей, которые ранее были сложны для достижения в компьютерной графике.
Эту технологию активно используют в игровой индустрии при создании виртуальных миров и персонажей, архитектурной визуализации, в медицинских исследованиях и разработке автономных автомобилей для моделирования окружающей среды.
По аналогии с остальными типами ядер в графических картах для VDI решений RT-ядра распределяются между вычислительными чипами.
Объем памяти
Чем больше памяти есть в GPU, тем лучше графический ускоритель поддерживает разрешение экранов 4K и 5K, большое количество мониторов и пользователей одновременно. Например, GPU с 64 Гб памяти можно поделить между 64 пользователями, предоставляя каждому по 1 Гб памяти. Большой объем памяти обеспечивает высокую плотность пользователей и позволяет предоставлять доступ к графически насыщенным виртуальным рабочим столам из любой точки мира.
У каждого пользователя на виртуальных рабочих станциях начального уровня есть большой кадровый буфер, где временно хранятся изображения перед тем, как они будут выведены на экран монитора. С его помощью можно запускать рабочие задачи, которые требуют интенсивной графики. Например, системы автоматизации проектирования (САПР) без значительных задержек и ухудшения качества изображения.
Аппаратная кодировка видео
При передаче кадров с виртуальных рабочих столов необходимо их закодировать перед отправкой и декодировать на стороне ВМ пользователя. Если этот процесс осуществляется центральным процессором, то это может создать значительную нагрузку на CPU, что может отрицательно сказаться на его производительности и способности обслуживать другие задачи.
Использование кодеров и декодеров в графическом процессоре позволяет снизить нагрузку на CPU и обеспечить более эффективное выполнение мультимедийных задач в виртуальной среде. Эти компоненты обрабатывают видео- и аудиоданные, сжимают и декомпрессируют мультимедийные потоки. Чем больше кодеров и декодеров есть в GPU, тем более эффективно карта обрабатывает мультимедийный контент.
Графические ускорители с продвинутыми компонентами улучшают качество видео и аудио, а также более эффективно используют ресурсы системы. Особое внимание следует уделять виртуализации кодеров и декодеров, это может существенно улучшить производительность ВМ и снизить нагрузку на хост-систему, что важно в многопользовательской VDI-среде.
Пропускная способность памяти
Для корректной работы с графически интенсивными приложениями большой объем данных должен быстро перемещаться между памятью и процессором. Поддержание высокой скорости передачи данных гарантирует высокую производительность и улучшение пользовательского опыта, даже при одновременном выполнении ресурсоемких задач.
Пропускная способность памяти может влиять на возможность подключения нескольких мониторов с высоким разрешением, что важно для пользователей, которым необходимо расширенное рабочее пространство. Например, один монитор может использоваться для графического рендеринга, в то время как другой — для выполнения вычислений.
Диапазон 144-256 ГБ/c будет достаточным для большинства задач, но для более сложных вычислений может потребоваться и гораздо большая пропускная способность.
Оптимальный вариант для реализации сценария VDI
На рынке представлено много различных GPU. С первого взгляда может показаться, что любые графические процессоры подойдут для создания VDI инфраструктуры, но на практике не всем GPU хватает производительности для одновременной работы пользователей с графикоемкими программами. Поэтому в 2021 году компания NVIDIA выпустила линейку новых устройств — A10, A16 и A30.
Сам вендор делает акцент на том, что для инфраструктуры VDI предназначена модель NVIDIA A16, которая совмещает в себе четыре чипа в одной плате и оптимально подходит для VDI за счет своей производительности, высокой плотности пользователей, поддержке мультимониторных настроек и аппаратному кодированию и декодированию видео. Вот основные характеристики A16:
- ядра CUDA 1280х4;
- тензорные ядра 40х4;
- RT-ядра 10х4;
- память 16 Гбх4;
- кодирование/декодирование H.265, VP9 и декодирование AV1;
- пропускная способность 200 Гб/с х 4.
Единственный минус A16 — это ее высокая стоимость — около 500 000 рублей. Чтобы бизнес мог сэкономить бюджеты на приобретение оборудования, его администрирование, ремонт и перейти от капитальных затрат (CAPEX) к операционным (OPEX), ITGLOBAL.COM предлагает сервис 3D VDI на базе NVIDIA A16.
Сервис 3D VDI от ITGLOBAL.COM
В рамках 3D VDI облачный провайдер предоставляет компании виртуальные рабочие столы с GPU в аренду. Процесс выстроен следующим образом: специалисты ITGLOBAL.COM разворачивают VDI в облаке на базе оборудования, которое размещено в дата-центрах уровня Tier III, и удаленно предоставляют клиенту ВМ с VDI.
Особенности сервиса:
- у каждого пользователя есть собственная виртуальная машина для работы;
- на каждом VDI установлена графическая карта или виртуальный кусочек карты;
- используется для работы с 3D моделированием и проектированием;
- приложения устанавливаются на VDI или на «золотой образ»;
- пользователь видит лишь изображение рабочего стола, все вычисления происходят непосредственно на VDI;
- доступно для выделенных инсталляций, от 100 VDI, инсталл в ITGLOBAL.COM от 2 месяцев;
- стоимость аренды. В VDI редко выдается целая карта, чаще карта делится сразу между несколькими пользователями. Базовый профиль на пользователя от ITGLOBAL.COM — это 4 GB vGPU Nvidia A16, включая лицензию NVIDIA — 4 800 рублей/месяц.
Сервис 3D VDI совмещает в себе преимущества технологии виртуальных рабочих столов и возможностей GPU. Пользователи могут стабильно работать с тяжеловесными графическими программами, бизнес — оптимизировать бюджеты на ИТ и минимизировать риски утечки данных и конфиденциальной информации.