Видеокарты без видеопамяти: как технология Neural Texture Compression от NVIDIA решит проблему дефицита VRAM
Дата-центры скупили всю память мира для ИИ, что сделало видеокарты слишком дорогими для геймеров. Пока Samsung и Micron не могут увеличить производство чипов, NVIDIA запускает ИИ-технологию, сокращающую потребление видеопамяти в играх в 7 раз.
Серверы для обучения крупных ИИ-моделей (таких как чипы NVIDIA Vera Rubin) требуют до 288 ГБ памяти формата HBM — это в 9 раз больше, чем топовый игровой ПК. Производители памяти (Samsung, SK hynix, Micron) физически не справляются с таким спросом. Вместо расширения производства для нужд геймеров им выгоднее продавать дефицитные чипы по завышенным ценам корпоративным клиентам.
В результате цены на железо для обычных потребителей растут, а релизы новых поколений GPU (RTX 6000 и RDNA 5) могут быть отложены до 2027–2028 годов, пока не разрешится кризис поставок.
Решение NVIDIA: нейросети вместо железа
Поскольку нарастить физический объем памяти на видеокартах сейчас слишком дорого, NVIDIA решила радикально сократить аппетиты самих игр. Технология NTC (Neural Texture Compression) использует возможности нейросетей для экстремального сжатия текстур.
На недавней конференции GTC 2026 компания продемонстрировала работу технологии на примере рендеринга сложной сцены:
- Стандартные методы требовали 6.5 ГБ видеопамяти для отображения текстур.
- При активации NTC потребление упало до 970 МБ.
Таким образом, ИИ сжимает данные на 85% (в 7 раз), при этом качество изображения не деградирует — визуальная точность остается на уровне оригинальных несжатых исходников (что невозможно при классических методах блочного сжатия).
Как это работает
При создании игры оригинальные текстуры преобразуются в веса для небольшой нейросети. Когда игроку нужно увидеть текстуру на экране (Inference on Sample), видеокарта не подгружает тяжелый графический файл из памяти, а в реальном времени «распаковывает» его с помощью тензорных ядер (MLP-сети).
На новейших архитектурах (Blackwell) этот процесс происходит практически мгновенно. Для более слабого железа (или карт от AMD и Intel) предусмотрен режим Inference on Load: текстура распаковывается не в моменте, а во время загрузки уровня. В этом случае VRAM не экономится, но радикально снижается вес самой игры на жестком диске (SSD).
С точки зрения индустрии, NTC — это гениальный финт ушами. NVIDIA убивает двух зайцев: сохраняет сверхприбыли от продажи чипов памяти в дата-центры (не отвлекая их на геймерский сегмент) и одновременно успокаивает игровое сообщество, программно снижая требования к «железу». Для разработчиков игр это означает смену парадигмы оптимизации — оптимизировать придется не вес графики, а нагрузку на ИИ-ядра. А для потребителей это сигнал: видеокарты с малым объемом VRAM (как те же базовые RTX 5070/5080) остаются актуальными, если игра поддерживает технологии Neural Rendering. Проблема VRAM решена софтом, а не кремнием.
Материалы по теме
Вставить свои 5 копеек: