Cервисы
Managed IT
Решения
Security
Импортозамещение
О компании

Новые горизонты с Nvidia HGX H100: Обновление дата-центров ITGLOBAL.COM в Нидерландах

Каждое технологическое нововведение в IT-индустрии открывает перед компаниями не только новые возможности, но и приносит радость тем, кто принимает участие в этих изменениях. Недавнее обновление серверов в Нидерландском офисе ITGLOBAL.COM с использованием платформы Nvidia HGX H100 стало важным этапом, который принес значительные улучшения в нашу инфраструктуру. В этой статье мы подробно рассмотрим, что представляет собой это оборудование, как оно влияет на нашу работу и какие выгоды оно предоставляет нашим клиентам.

Важность обновления

В ITGLOBAL.COM каждая новая поставка оборудования — это больше, чем просто очередное техническое обновление. Это событие, к которому мы подходим с особым вниманием и интересом. Когда в наш офис прибыла большая коробка с серверами Dell PowerEdge XE9680 на базе платформы Nvidia HGX H100, все понимали, что нам предстоит работа с действительно мощным оборудованием, которое значительно повысит наши возможности в обработке данных и выполнении сложных вычислительных задач.

Многие из нас могут вспомнить, как собирали свой первый компьютер или с нетерпением ждали обновления, которое долго планировали. Этот процесс всегда вызывает волнение и радость — от выбора комплектующих до первого запуска системы. В нашем случае ожидание было связано с осознанием того, что это оборудование станет ключевым элементом нашего дата-центра и позволит нам решать новые, более сложные задачи. Это осознание также сопровождалось пониманием того, что установка таких серверов — это долгосрочное инвестиционное решение, направленное на обеспечение стабильного роста и развитие нашего бизнеса.

Знакомство с новым оборудованием

 

Когда мы распаковали серверы, перед нами оказалась основа нашего нового вычислительного комплекса — сервер Dell PowerEdge XE9680 с платформой Nvidia HGX H100. Эта платформа включает в себя передовые GPU, которые предназначены для ускорения задач, связанных с искусственным интеллектом, таких как обучение нейронных сетей и выполнение других ресурсоемких вычислительных процессов.

 

Важно отметить, что HGX H100 — это платформа для OEM-производителей, таких как Dell, и она отличается от референсной DGX H100, производимой Nvidia. Разница между этими платформами аналогична различию между референсными и кастомными моделями видеокарт. OEM-платформы часто имеют определенные преимущества в гибкости настройки и адаптации к специфическим требованиям клиентов, что позволяет использовать их в самых разных сценариях.

 

Основным преимуществом Nvidia HGX H100 является её модульная архитектура, которая делает эту платформу особенно привлекательной для масштабных проектов. В отличие от многих других решений на рынке, она позволяет не только эффективно использовать доступные ресурсы, но и оперативно наращивать мощности по мере роста потребностей бизнеса. Это крайне важно для компаний, которые стремятся оставаться конкурентоспособными в условиях постоянно меняющегося рынка.

Технические особенности

Сравнение NVIDIA HGX H100 с её предшественником, NVIDIA DGX A100, показывает, насколько быстро развиваются технологии. За четыре года новая платформа смогла увеличить производительность задач, связанных с искусственным интеллектом, до 4,5 раз, что свидетельствует о значительном прогрессе межды поколениями видеокарт NVIDIA.

 

HGX H100 включает в себя значительно большее количество транзисторов — до 80 миллиардов по сравнению с 54,2 миллиарда у A100. Эти микросхемы, произведённые по 4-нанометровому техпроцессу, занимают ту же площадь, что и у предыдущих моделей, но предлагают существенно большую мощность и энергоэффективность. Такой уровень плотности и производительности стал возможен благодаря активному развитию полупроводниковых технологий и оптимизации архитектурных решений.

Кроме того, заметно увеличилось количество ядер CUDA и тензорных ядер. Если у A100 было 6912 ядер CUDA и 432 тензорных ядра, то у H100 их уже 14592 и 456 соответственно. Этот рост существенно повышает возможности для выполнения вычислительно интенсивных задач, которые становятся всё более актуальными в современном мире. Это особенно важно для таких направлений, как глубокое обучение и анализ больших данных, где каждая единица производительности может оказаться решающей.

Стоит также отметить, что Nvidia HGX H100 поддерживает новейшие стандарты памяти HBM3, что позволяет существенно увеличить пропускную способность и скорость обмена данными между ядрами. Это делает платформу идеальной для работы с огромными объемами информации, требующими высокой скорости обработки. В совокупности с обновленной архитектурой тензорных ядер, это решение открывает перед пользователями новые горизонты в области искусственного интеллекта и высокопроизводительных вычислений.

Особенности архитектуры

Такая мощная система требует соответствующего энергоснабжения. Максимальное потребление сервера PowerEdge XE9680 составляет 11,5 кВт, и Dell предусмотрела резерв, установив шесть блоков питания по 2800 Вт каждый. Это решение обеспечивает необходимую стабильность и надёжность работы системы, что особенно важно для непрерывной работы с высокими нагрузками.

Одним из ключевых преимуществ Nvidia HGX H100 является её модульная архитектура SuperPOD, которая позволяет гибко и быстро масштабировать вычислительные мощности. В отличие от традиционных архитектур, SuperPOD обеспечивает возможность добавления новых модулей и узлов без необходимости остановки системы или значительных затрат на перестройку инфраструктуры. Это особенно важно для крупных проектов, которые требуют не только высокой производительности, но и гибкости в управлении ресурсами.

 

Например, система DGX SuperPOD, оснащенная восьмью GPU Nvidia H100, обеспечивает высокую пропускную способность и низкую задержку, что делает её идеальной для выполнения сложных задач, таких как обучение крупных языковых моделей и создание сложных графических изображений. Эти задачи становятся всё более важными в современном мире, где искусственный интеллект играет ключевую роль в развитии множества отраслей.

 

Технология Nvidia InfiniBand NDR с пропускной способностью до 400 Гбит/с обеспечивает высокую производительность и минимальные задержки при обмене данными между узлами, что особенно важно для крупных вычислительных кластеров. Это позволяет эффективно распределять задачи между узлами и оптимизировать использование доступных ресурсов, что в конечном итоге повышает общую производительность системы.

Иллюстрация из документации NVIDIA для SuperPOD.

Заключение

Внедрение серверов на базе Nvidia HGX H100 — это не просто обновление нашей инфраструктуры, а важный шаг, который открывает перед ITGLOBAL.COM и нашими клиентами новые возможности. Эти серверы помогут нам не только соответствовать современным требованиям рынка, но и предоставлять нашим клиентам эффективные решения для реализации их самых амбициозных проектов. Мы стремимся к тому, чтобы наши услуги обеспечивали стабильность и производительность, необходимые для успешного развития бизнеса наших клиентов.

ITGLOBAL.COM — это ваш надежный партнёр в мире облачных технологий. Мы предлагаем решения, которые помогают бизнесу адаптироваться к новым вызовам и использовать их в свою пользу. Наши инновационные подходы и готовность идти на шаг впереди позволяют нашим клиентам достигать новых высот, а нам — постоянно развиваться вместе с ними.