Детали архитектуры NVIDIA Ada Lovelace – отсутствие PCIe 5 и NVLink, потенциал для более производительных видеокарт
После презентации видеокарт NVIDIA RTX 4090 и 4080, на которой мало упоминали о технических нюансах, архитектура GPU Ada Lovelace продолжает обрастать подробностями и разъяснениями. В частности, глава компании Дженсен Хуанг в разговоре с прессой рассказал об отсутствии у новых RTX NVLink, а служба техподдержки уведомила об отсутствии поддержки PCIe 5.
NVIDIA представила видеокарты GEFORCE RTX 4090 за $1599 и RTX 4080 за $899 — в продаже с 12 октября
Стандарт передачи данных PCIe 5.0 был официально представлен в 2019 году. Он обеспечивает пропускную способность до 128 ГБ/с и скорость передачи данных до 32 ГТ/с. Стандарт уже поддерживается системной логикой Intel Alder Lake и будет добавлен в процессоры AMD Ryzen 7000.
Видеокарты Ada Lovelace оснащены разъемом питания 12VHPWR, соответствующим устройства вам с PCIe 5. Дженсен Хуанг вскользь упоминал, что было воспринято как намек на поддержку нового стандарта видеокартами. Однако от него видеоадаптер унаследовал лишь 12-контактное гнездо питания. Официальный ответ NVIDIA сайту TechPowerUp гласит:
«Ada не поддерживает PCIe Gen 5, но разъем питания Gen 5 входит в комплект. PCIe Gen 4 сегодня обеспечивает достаточную пропускную способность для использования графики, поэтому мы посчитали, что нет необходимости внедрять Gen 5 для этого поколения видеокарт. Большие буферы кадра и большие кэши L2 графических процессоров Ada также снижают использование интерфейса PCIe».
Дженсен Хуанг подтвердил информацию о том, что RTX 4090 и более младшие видеоадаптеры линейки лишены поддержки NVLink. Этот порт обеспечивал взаимодействие двух видеокарт, установленных в одной системы. Времена технологии NVIDIA SLI окончательно прошли.
Процессор AD102, на котором основана видеокарта NVIDIA GeForce RTX 4090, построен на техпроцессе TSMC 4N и состоит из 76,3 млрд транзисторов, что почти на 170% больше, чем у предыдущего GA102. Размер его кристалла — 608 мм², что меньше 628 мм² у предшественника – техпроцесс TSMC 4N предлагает почти в три раза большую плотность транзисторов, чем Samsung 8LPP, на котором построен GA102.
В AD102 есть 18 432 ядра CUDA, 568 тензорных ядер четвертого поколения и 142 ядра трассировки лучей третьего поколения. Чип поддерживает до 24 ГБ памяти GDDR6X или до 48 ГБ памяти GDDR6+ ECC, работающей через 384-битную шину.
RTX 4090 на основе этого процессора наделена 16 384 ядрами CUDA. 512 тензорными и 128 RT-ядрами. Примерно 10% запаса NVIDIA, скорее всего, оставила для уменьшения отбраковки RTX 4090 и последующего создания более мощной RTX 4090 Ti.
Глава NVIDIA Дженсен Хуанг: «Идея о том, что чипы будут дешеветь – история из прошлого»
Источник: TechPowerUp