Rtx Pro 6000 blackwell против четырёх Rtx 5090: ИИ‑производительность и энергоэффективность

Одна профессиональная видеокарта RTX PRO 6000 Blackwell способна заменить сразу четыре топовые GeForce RTX 5090 в задачах искусственного интеллекта - и при этом потребляет примерно в четыре раза меньше энергии. Если связка из четырёх RTX 5090 на пике тянет около 2300 Вт, то одиночная RTX PRO 6000 Blackwell ограничивается примерно 600 Вт при сопоставимой производительности.

Поводом для обсуждения стали свежие тесты, в которых сравнивали несколько конфигураций на базе видеокарт Nvidia. В фокусе - работа с крупной языковой моделью MiniMax M2.7 объёмом 230 млрд параметров. Это уже уровень, требующий не только высокой вычислительной мощности, но и серьёзного объёма видеопамяти, чтобы модель вообще поместилась в GPU.

Для сравнения использовали четыре варианта систем на видеокартах Nvidia:

- одна RTX PRO 6000 Blackwell с 96 ГБ видеопамяти;
- связка из четырёх GeForce RTX 5090;
- конфигурация из четырёх GeForce RTX 4090;
- решение DGX Spark.

Чтобы модель удалось запустить на всех вариантах, применили квантизацию IQ3_XXS. Это агрессивное сжатие весов модели, рассчитанное на сценарии с ограниченным объёмом видеопамяти. При этом оно остаётся достаточно "тяжёлым", чтобы почти полностью загрузить 96 ГБ VRAM у RTX PRO 6000 Blackwell. В тесте также использовался контекст на 32K токенов и максимальная длина ответа 4096 токенов - условия, близкие к реальным нагрузкам при работе с большими LLM.

Результаты по скорости оказались неожиданно близкими для топового игрового и профессионального решений. Связка из четырёх GeForce RTX 5090 обеспечила среднюю скорость генерации 120,54 токена в секунду при задержке до первого токена 725 мс. Одиночная RTX PRO 6000 Blackwell показала практически тот же уровень: 118,74 токена в секунду и 765 мс до первого токена. То есть по ощущениям при работе с моделью разница между решениями практически незаметна.

При этом более старая, но всё ещё популярная конфигурация из четырёх GeForce RTX 4090 заметно проиграла: 71,52 токена в секунду. Аппаратный комплекс DGX Spark выступил ещё слабее - всего 24,41 токена в секунду. Таким образом, с точки зрения "сырой" производительности в генерации текста RTX PRO 6000 Blackwell фактически встаёт в один ряд с четырьмя RTX 5090 и существенно опережает остальные протестированные платформы.

Однако ключевым фактором в этих тестах стала не только скорость, но и энергоэффективность. Здесь профессиональный ускоритель Blackwell демонстрирует особенно впечатляющее преимущество. Четыре GeForce RTX 5090 под полной нагрузкой могут потреблять до 2300 Вт. Для четырёх RTX 4090 этот показатель составляет около 1800 Вт. RTX PRO 6000 Blackwell, при сопоставимой производительности с четырьмя RTX 5090, укладывается в примерно 600 Вт.

Если пересчитать, выходит, что одна RTX PRO 6000 Blackwell даёт примерно ту же производительность в задачах ИИ, что и связка из четырёх RTX 5090, но при этом потребляет примерно в четыре раза меньше энергии. В условиях, когда стоимость электроэнергии и требования к охлаждению становятся критичными для дата-центров и даже энтузиастских домашних кластеров, эта разница превращается в серьёзное преимущество.

Не менее важен и вопрос стоимости. По оценкам, одна RTX PRO 6000 Blackwell стоит около 9500 долларов. Четыре GeForce RTX 5090 - это уже порядка 14 000 долларов. Да, DGX Spark заметно дешевле - примерно 4700 долларов, - но его производительность в этом сравнении оказалась многократно ниже, что делает его менее привлекательным для тяжёлых ИИ-нагрузок с большими моделями и длинным контекстом.

Если смотреть на ситуацию шире, становится понятно, почему Nvidia так активно продвигает профессиональные ускорители линейки Blackwell. Для гейминга и творческих задач GeForce по‑прежнему остаются логичным выбором: там важны другие метрики - цена за FPS, производительность в рендеринге и работе с контентом. Но как только дело доходит до обучения и инференса крупных языковых моделей, в игру вступают совсем иные приоритеты: энергоэффективность, объём видеопамяти, поддержка профессиональных драйверов и инструментов для работы в дата‑центрах.

У RTX PRO 6000 Blackwell есть ещё одно критически важное преимущество - 96 ГБ видеопамяти. С учётом растущего размера современных моделей это позволяет запускать более тяжёлые конфигурации без агрессивной квантизации, а в ряде случаев и вовсе обходиться без распределения модели на несколько GPU. Для разработчиков ИИ это означает упрощение инфраструктуры, снижение накладных расходов на коммуникацию между картами и более предсказуемое поведение системы под нагрузкой.

Четыре RTX 5090, несмотря на впечатляющую суммарную мощность, создают куда более сложную архитектуру: требуется высокоскоростная связка между картами, продуманная система охлаждения и мощный блок питания. Дополнительно возрастают риски отказов и сложность масштабирования. В случае с одной RTX PRO 6000 Blackwell инфраструктура получается значительно компактнее и проще в обслуживании.

Есть и ещё один аспект - акустический комфорт и требования к помещению. Система, потребляющая более 2 кВт, почти неизбежно превращается в "обогреватель" с интенсивным шумом от вентиляторов и/или серверных турбин. Для офисов, небольших студий и даже локальных серверных такой сценарий зачастую неприемлем. Платформа на базе одного энергоэффективного ускорителя куда легче вписывается в существующие условия эксплуатации.

С экономической точки зрения важно учитывать не только цену железа, но и совокупную стоимость владения: расход электроэнергии, обслуживание, охлаждение, аренду помещения, модернизацию электропроводки. При длительной работе кластеров для ИИ - месяцами и годами - именно эти параметры становятся решающими. В таком разрезе преимущество RTX PRO 6000 Blackwell по энергопотреблению может довольно быстро компенсировать более высокую начальную стоимость по сравнению с игровыми картами.

Отдельного внимания заслуживает вопрос сферы применения. RTX PRO 6000 Blackwell ориентирована в первую очередь на профессиональные задачи: от инференса крупных LLM и мультимодальных моделей до сложной аналитики, работы с графами и научных вычислений. Это решение для компаний, исследовательских лабораторий, студий, которые строят свои продукты вокруг ИИ и зависят от стабильной производительности 24/7. GeForce RTX 5090 же, несмотря на впечатляющую мощность, остаётся в потребительском сегменте и в подобной прямой конкуренции с профессиональной серией закономерно уступает.

Важно понимать и ограничения: игровой флагман всё ещё может быть интересен энтузиастам, которые собирают гибридные системы "и для игр, и для ИИ". Но если приоритетом является именно искусственный интеллект, особенно на больших моделях, текущие тесты ясно показывают, куда логичнее направить бюджет. Один профессиональный ускоритель Blackwell даёт более чистое, масштабируемое и экономичное решение, чем связка из нескольких игровых карт.

В долгосрочной перспективе подобные сравнения будут определять архитектуру новых ИИ‑кластеров: всё больше компаний будут уходить от схем, где используются множества потребительских GPU, в пользу специализированных, энергоэффективных ускорителей с большим объёмом памяти. Экосистема вокруг Blackwell - от библиотек до оптимизаций фреймворков - только усиливает эту тенденцию.

Именно поэтому результаты тестов с MiniMax M2.7 и 230 млрд параметров можно рассматривать не просто как красивый бенчмарк, а как наглядный пример того, как будет выглядеть рациональный выбор железа для ИИ уже в ближайшие годы: меньше карт, больше памяти на одну, максимальная энергоэффективность и акцент на профессиональные решения, оптимизированные под реальные нагрузки искусственного интеллекта.

Прокрутить вверх