По данным исследования CHINT и Аналитического центра ИКС, стойки мощностью более 10 кВт уже используют свыше половины опрошенных компаний (56%). При этом отрасль начинает готовиться к инфраструктуре нового класса - GPU-кластерам для систем искусственного интеллекта (ИИ).
"Появление высоконагруженных GPU-кластеров требует пересмотра привычных подходов к организации инженерной инфраструктуры дата-центров. Рынок начинает готовиться к эксплуатации стоек мощностью в десятки и сотни киловатт, а это уже другой уровень требований к распределению электроэнергии, резервированию и охлаждению. В ближайшие годы внедрение новых архитектур электропитания и изменение подходов к проектированию самих ЦОДов может заметно ускориться", - рассказал лидер сегмента "ЦОД, телеком, банкинг" CHINT Петр Истомин.
Так, компании рассматривают различные сценарии модернизации инфраструктуры. Среди основных проблем действующей инфраструктуры участники исследования назвали высокую стоимость и сложность обслуживания систем распределения электроэнергии (49%), трудности при модернизации (47%) и дефицит места для установки нового оборудования (41%). Отрасль сталкивается не только с ростом нагрузок, но и ограничениями существующих площадок.
"Классические ЦОДы проектировались под стойки 5-15 кВт и предсказуемую, ровную ИТ-нагрузку. ИИ кластеры меняют две вещи сразу. Во-первых, величину нагрузки: GPU-стойки уходят за 40-100+ кВт, и вся цепочка - трансформаторы, шинопроводы, PDU (блоки распределения питания), автоматы - оказывается рассчитана на токи и тепловыделение другого порядка. Во-вторых, характер нагрузки: при обучении тысячи ускорителей как бы синхронизируются с шагами тренировки моделей, давая резкие субсекундные броски мощности. Для такой динамики прежние запасы и логика резервирования просто не были заложены - отсюда и пересмотр архитектуры, а не точечный апгрейд", - говорит руководитель направления ИИ Cloud.ru Дмитрий Юдин.
В исследовании отмечено, что наиболее востребованным оказалось детальное измерение энергопотребления на уровне ИТ-стоек (61%), главных распределительных щитов (56%) и систем гарантированного питания (54%). В качестве основных протоколов передачи данных участники рынка назвали SNMP (83%) и Modbus TCP (59%).
"В индустрии ЦОДов традиционно основное внимание уделяли оборудованию бесперебойного и гарантированного электропитания, ИБП и ДГУ соответственно. На системы распределения электроэнергии обращали меньше внимания. Но с увеличением размеров и сложности объектов, а главное, с повышением плотности мощности и необходимостью обеспечивать высокий уровень надежности, интерес к этим системам существенно вырос", - отметил директор по контенту Аналитического центра ИКС Александр Барсков.
При этом современные ИИ-кластеры отличаются высокой плотностью мощности, и требования к их размещению могут существенно различаться в зависимости от используемого оборудования и решаемых задач. Поэтому ключевым фактором становится то, какие сервисы и вычислительные нагрузки будут размещаться на площадке в будущем. Именно это определяет архитектуру электроснабжения, уровень резервирования, параметры охлаждения и требования к эксплуатации объекта.
Директор по развитию и эксплуатации ЦОД РТК-ЦОД Константин Степанов объясняет, что раньше основными критериями были надежность и стоимость владения, а сегодня на первый план выходят соответствие оборудования будущим нагрузкам, возможность масштабирования и гибкость архитектуры. Выбор оборудования становится следствием более важного решения - понимания того, какие сервисы и технологии будут размещаться в дата-центре.