Новости

Архітектура Turing і особливості нових відеокарт GeForce RTX

  1. Відкрите GeForce RTX
  2. Особливості архітектури Turing
  3. трасування променів
  4. Віртуальна реальність
  5. Блок виведення зображення
  6. технологія SLI
  7. Нові можливості GeForce Experience
  8. GPU Boost 4.0 і розгін
  9. Висновки

Життєвий термін відеокарт сімейства Pascal виявився досить довгим. Старші моделі протрималися на ринку більше двох років і ще будуть присутні деякий час у продажу. Протягом цього періоду ми побачили нові рішення на архітектурі Volta, які залишилися долею спеціалізованих прискорювачів обчислень. Єдиним ігровим продуктом сімейства Volta став TITAN V, випущений невеликим тиражем при надзвичайно високій ціні. Але тепер настав момент старту нового покоління, яке має змінити все. Нові відеокарти на архітектурі Turing не просто привносять чергове підвищення продуктивності, вони несуть в собі ряд технологічних інновацій і є першими ігровими рішеннями, які підтримують трасування променів в реальному часі. Тому навіть звичну назву GeForce GTX було змінено на GeForce RTX. В даному огляді ми поговоримо про особливості архітектури Turing і технічних параметрах нових GPU. Практичному знайомству з відеокартами, включаючи тестування і порівняння зі старими моделями NVIDIA, будуть присвячені наступні огляди.

Практичному знайомству з відеокартами, включаючи тестування і порівняння зі старими моделями NVIDIA, будуть присвячені наступні огляди

Відкрите GeForce RTX

У сімействі Turing можна виділити кілька ключових змін. Це абсолютно нова архітектура GPU, поява нових обчислювальних блоків - тензорних і RT ядер, прискорена обробка шейдеров.

На даний момент представлено три відеокарти - GeForce RTX 2080 Ti, GeForce RTX 2080 і GeForce RTX 2070. Всі вони базуються на різних GPU Turing. Топова модель отримала найпотужніший процесор TU102, кристал якого зображений нижче на слайді.

Спочатку наведемо блок-схему кожного нового GPU, опишемо загальні характеристики відеокарт, а потім детально розглянемо архітектурні зміни. Всі процесори виробляються за технологією 12-нм FinFET. Вони зберігають кластерну структуру, коли GPU складається з декількох GPC, і, змінюючи кількість таких кластерів, масштабується продуктивність кожного конкретного чіпа.

TU102 (GeForce RTX 2080 Ti)

Старший графічний процесор TU102 складається з 18,6 мільярдів транзисторів при площі кристала 754 кв.мм. Якщо порівняти його з GP102 ( GeForce GTX 1080 Ti ), То площа нового чіпа і кількість транзисторів зросла на 55-60%. У TU102 всього шість кластерів GPC, кожен містить по шість текстурної-процесорних кластерів TPC, які об'єднують мультипроцесорні блоки SM. Останні помітно реорганізовані і включають нові блоки, про що докладніше буде сказано нижче. Кожен SM-блок налічує 64 основних обчислювальних блоку (CUDA-cores). При 72 SM всього виходить 4608 потокових процесорів. Однак GPU GeForce RTX 2080 Ti (як свого часу і у GeForce GTX 1080 Ti) трохи урізаний. У топової відеокарти відключені два SM, в результаті загальна кількість потокових процесорів дорівнює 4352. Також у даного рішення є 544 нових тензорних ядра і 68 RT-ядер, 272 текстурних блоки і 88 блоків растеризації ROP.

Для порівняння можна нагадати, що GeForce GTX 1 080 Ti на базі GP102 оперував тільки 3584 ядрами CUDA при 224 текстурних блоках. Так що нарощування потенціалу у нового TU102 далеко не останнє. Шина пам'яті залишилася 352-бітної, але використовуються нові мікросхеми пам'яті GDDR6 з ефективною частотою обміну даними, еквівалентній значенням 14 ГГц. Обсяг пам'яті 11 ГБ на рівні старого флагмана, і це цілком достатньо для сучасних ігор у високій роздільній здатності.

Судячи з блок-схемою у процесора TU102 всього 12 контролерів пам'яті розрядністю 32 біта. Тому чіп може працювати з 384-бітовим інтерфейсом. Можливо, ми побачимо таку шину разом з 4608 потокових процесорів в нових Titan. Кеш L2 у GeForce RTX 2080 Ti досягає 5632 КБ. Очевидно, що повний обсяг L2 дорівнює 6 МБ, але він трохи порізаний разом з шиною.

TU104 (GeForce RTX 2080)

Наступний в ієрархії процесор TU104 має конфігурацію з шести кластерів GPC по чотири TPC. У минулому поколінні Pascal зберігалася ідентичність внутрішньої структури кластерів для рішень середнього і топового рівня, лише в бюджетних GPU зменшувалася кількість TPC. Ймовірно, така конфігурація TU104 є оптимальною для збереження певного балансу продуктивності і гнучкого управління ресурсами - число кластерів на рівні топового GPU, але вони слабкіше. При цьому задіяно 46 SM-блоків з 48, що дає 2944 активних обчислювальних ядер CUDA, 368 тензорних ядер, 46 ядер RT і 184 текстурних блоки. Об'єм кеш-пам'яті L2 дорівнює 4 МБ, що вдвічі вище обсягу L2 у GP102 ( GeForce GTX 1080 ).

TU106 (GeForce RTX 2070)

Несподіванкою стала прем'єра третього чіпа для GeForce RTX 2070. За аналогією з минулими поколіннями можна було очікувати простого урізування блоків на процесорі старшої відеокарти. Але основою GeForce RTX 2070 став GPU TU106 з трьома стандартними кластерами по шість TPC. Загальна кількість потокових процесорів 2034, тензорних блоків 288, блоків RT 36, текстурних блоків 144. При прямому порівнянні GeForce RTX 2070 з GeForce RTX 2080 виходить різниця 28% по обчислювальним блокам. Кеш-пам'ять L2 залишилася на рівні 4 МБ.

TU104 і TU106 володіють 256-бітної шиною пам'яті (8 контролерів розрядністю 32 біт). При цьому відеокарти використовують пам'ять GDDR6 з ефективною частотою 14 ГГц, що забезпечує зростання пропускної здатності пам'яті щодо минулого покоління.

Як бачимо, загальна конфігурація обчислювальних блоків навіть у молодшого GPU досить потужна, не кажучи вже про топовом TU102. А адже в них ще з'явилися і нові функціональні блоки. Тому чіпи Turing є складними і досить великими кристалами. TU102 складається з 18,6 млрд. Транзисторів, TU104 з 13,6 млрд., А TU106 налічує 10,8 млрд. Транзисторів. В результаті навіть при переході на 12-нм техпроцес ми не бачимо зростання робочих частот. Якщо говорити, про GeForce RTX 2080 Ti, то тут взагалі заявлено базове значення в 1350 МГц при Boost Clock до 1635 МГц. Для молодших GPU робочі частоти вище, але вони приблизно на рівні моделей Pascal.

З частотами пов'язаний один цікавий момент. Вперше NVIDIA вводить різні Boost-частоти при однакових базових значеннях. В офіційних специфікаціях ми бачимо більш високі значення Boost для моделей Founders Edition виробництва самої NVIDIA. При цьому інші карти теж позначені як Reference, що вводить в оману, оскільки саме референсні версії ми звикли асоціювати з Founders Edition. У нас була можливість швидко порівняти відеокарту від NVIDIA з моделлю іншого виробника, і в реальності різниця по частотах мінімальна. Так що не варто боятися різних характеристик. При наявності хорошого охолодження продуктивність всіх GeForce RTX однієї серії буде схожою. Гірше інших можуть виявитися ті рідкісні моделі з кулером турбінного типу, які анонсували деякі партнери.

Відеоадаптер GeForce RTX 2080 Ti GeForce RTX 2080 GeForce RTX 2070 Ядро TU102 TU104 TU106 Кількість транзисторів, млн. Шт 18600 13600 10800 Техпроцесс, нм 12 12 12 Площа ядра, кв. мм 754 545 445 Кількість потокових процесорів CUDA 4352 2944 2304 Кількість тензорних ядер 544 368 288 Кількість ядер RT 68 46 36 Кількість текстурних блоків 272 184 144 Кількість блоків рендеринга 88 64 64 Частота ядра Base, МГц 1350 1515 1410 Частота ядра Boost, МГц (Reference ) 1545 1710 1620 Частота ядра Boost, МГц (Founders Edition) тисячі шістсот тридцять п'ять 1800 1710 Шина пам'яті, біт 352 256 256 Тип пам'яті GDDR6 GDDR6 GDDR6 Частота пам'яті, МГц 14000 14000 14000 Обсяг пам'яті, ГБ 11 8 8 Підтримувана версія DirectX 12 12 12 Інтерфейс PCI -E 3.0 PCI-E 3.0 PCI-E 3.0 Потужність, Вт 250/260 215/225 175/185 Офіційна вартість MSRP $ 999
Founders $ 1199 MSRP $ 699
Founders $ 799 MSRP $ 499
Founders $ 599

TDP нових відеокарт залишився приблизно на старому рівні. Так, для GeForce RTX 2080 Ti Founders Edition заявлено 260 Вт і 250 Вт для партнерських версій. Для GeForce RTX 2080 це 225 і 215 Вт, що вище TDP серії GeForce GTX 1080, але в цілому прийнятно для топових продуктів.

Після загального огляду нових GPU поговоримо безпосередньо про інновації архітектури Turing.

Особливості архітектури Turing

Важливі зміни відбулися на рівні націнок блоків SM, які мають стандартну структуру першій-ліпшій нагоді GPU Turing. Нова архітектура успадковує можливості обчислювальної архітектури Volta і ігровий архітектури Pascal. Всі обчислювальні блоки всередині SM згруповані в чотири масиву обробки даних зі своєю керуючої логікою (дані регістрів, планувальник). В одному SM налічується 64 потокових процесора. І ці обчислювальні блоки тепер вміють одночасно виконувати цілочисельні операції (INT32) і операції з плаваючою комою (FP32). До речі, на схемі SM вони позначені, як різні функціональні блоки. Цікаво, що у Pascal було по 128 ядер CUDA в SM, але розрахунки формату INT і FP проводилися в послідовному порядку.

Згідно з даними NVIDIA в сучасних додатках при виконанні ігрових шейдеров цілочисельні обчислення займають до 36%. І виконання операцій двох типів в один потік значно прискорить загальні обчислення. Тут заодно можна сказати про якийсь дисбаланс, оскільки повне дублювання INT32 і FP32 не потрібно. Але така структура може бути актуальною для неігрових обчислень і завдань.

Але така структура може бути актуальною для неігрових обчислень і завдань

Оновлена ​​уніфікована структура кеша L1 дозволяє конвеєру TPC ефективніше працювати з ним. При збереженні загального обсягу кешу L1 на рівні 96 КБ менше латентність, а загальна пропускна здатність може вирости до двох разів. Також у всіх процесорах збільшений обсяг загального кеша L2. Наприклад, в GPU TU102 це 6 МБ замість 3 МБ у старого GP102.

Наприклад, в GPU TU102 це 6 МБ замість 3 МБ у старого GP102

З'явилися і абсолютно нові блоки. Це вісім тензорних ядер для математичних операцій машинного навчання і один блок RT (Ray-tracing) для розрахунків трасування променів. Але навіть без урахування нових блоків і нових можливостей рендеринга NVIDIA говорить про середнє зростання шейдерной продуктивності близько 50%, що звучить досить переконливо. У віртуальній реальності VR цей приріст дворазовий і навіть вище. Це виглядає дуже оптимістично, і походу статті ми розкриємо багато нюансів, які дають такий комплексний ефект.

Це виглядає дуже оптимістично, і походу статті ми розкриємо багато нюансів, які дають такий комплексний ефект

В черговий раз поліпшені алгоритми стиснення даних в буфері кадру, що зменшує кількість звернень до зовнішньої пам'яті. У поєднанні з чіпами GDDR6, які працюють при 14 Гбіт / с, стверджується про зростання ефективної пропускної спроможності до 50%. Окремих користувачів насторожило, що GeForce RTX 2080 Ti зберіг обсяг в 11 ГБ, а GeForce RTX 2080/2070 отримали по 8 ГБ пам'яті, адже це на рівні існуючих моделей Pascal. Однак такого обсягу зараз вистачає для високих дозволів, а Turing в теорії ще більш ефективно працює з пам'яттю.

Чіпи Turing отримали підтримку нових feature level з Direct 12. Поліпшено асинхронні обчислення. Також нова архітектура має ряд поліпшень для прискореної обробки шейдеров.

Mesh Shading пропонує новий єдиний конвеєр геометрії, замінюючи вершинні, геометричні шейдери і тесселяцию. Це більш гнучкий в управлінні конвеєр з новим типів шейдеров Task Shaders і Mesh Shaders, який дозволяє одночасно працювати з геометрією групи об'єктів, зменшуючи загальну кількість draw calls.

Це більш гнучкий в управлінні конвеєр з новим типів шейдеров Task Shaders і Mesh Shaders, який дозволяє одночасно працювати з геометрією групи об'єктів, зменшуючи загальну кількість draw calls

Mesh Shading буде ефективний в сценах з безліччю об'єктів і складною геометрією, дозволяючи більш гнучко управляти LOD. На рівні DirectX 12 його можна реалізувати через NVAPI. Також підтримку Mesh Shading додадуть в OpenGL і Vulkan.

Перспективно виглядає технологія Variable Rate Shading (VRS). Цей метод дозволяє регулювати якість шейдинга в семплах 4x4 пікселя. Це дає можливості для гнучкої оптимізації. Наприклад, на периферії зображення може бути розмито ефектами Motion Blur і висока точність опрацювання семплів тут не має значення. Це дуже актуально для гоночних ігор, де дорога і оточення на периферії кадру часто змащуються.

Три алгоритму використовують VRS:

  • Content Adaptive Shading - зменшує швидкість шейдинга для зон зі слабко мінливих кольором;
  • Motion Adaptive Shading - варіативної якість для рухомих об'єктів;
  • Foveated Rendering - зниження якості для областей поза зоною фокусування.

Все це вимагає впровадження з боку розробників. Однак VRS може реально поліпшити продуктивність. Також це один з факторів, що знижують навантаження на відеопам'ять.

Turing підтримує нову модель Texture Space Shading (TSS). Значення шейдерних даних зберігаються в пам'яті в спеціальному текстурному просторі, звідки потім можуть повторно викликатися. TSS дозволяє використовувати такі тексель для тимчасового рендеринга і різних систем координат.

TSS дозволяє використовувати такі тексель для тимчасового рендеринга і різних систем координат

TSS є одним з елементів прискорення обробки VR. Кожне око бачить схоже зображення. При візуалізації кадру правого ока використовуються дані з кадру лівого ока, а заново оброблені будуть тільки ті текстелі, де немає відповідних зразків.

При візуалізації кадру правого ока використовуються дані з кадру лівого ока, а заново оброблені будуть тільки ті текстелі, де немає відповідних зразків

Тензорні ядра Turing є поліпшеними ядрами Volta. Вони потрібні для виконання завдань із застосуванням штучного інтелекту. Ці блоки підтримують розрахунки в режимах INT8, INT4 і FP16 при роботі з масивами матричних даних для глибокого навчання в реальному часі. Кожне тензорне ядро ​​виконує до 64 операцій з плаваючою комою, використовуючи вхідні дані формату FP16. Тобто один SM з вісьмома ядрами обробляє 512 операцій FP16 за такт. Обчислення INT8 проходять на подвоєною швидкості 1024 операцій, а для INT4 виконується 2048 операцій за такт. І топовий GPU TU102 здатний забезпечити пікову тензорну продуктивність до 130,5 TFLOPS (Quadro RTX 6000).

І топовий GPU TU102 здатний забезпечити пікову тензорну продуктивність до 130,5 TFLOPS (Quadro RTX 6000)

Компанія NVIDIA давно працює в області штучного інтелекту. Однак до недавнього часу всі технології на базі яких навчають нейромереж здавалися долею якихось вузькоспеціалізованих областей і великих дата-центрів. З появою Turing ситуація змінюється, адже ми отримуємо не тільки апаратну платформу, але і нові програмні можливості. Для інтеграції можливостей штучного інтелекту використовується NVIDIA NGX (Neural Graphics Acceleration), дозволяючи задіяти можливості глибокого навчання для поліпшення графіки і візуального відображення.

Для інтеграції можливостей штучного інтелекту використовується NVIDIA NGX (Neural Graphics Acceleration), дозволяючи задіяти можливості глибокого навчання для поліпшення графіки і візуального відображення

На базі NGX вже реалізована технологія підвищення дозволу зображення AI Super Rez, технологія InPainting для відновлення фрагментів фотографій і деякі інші цікаві функції.

Але найважливішим є згладжування Deep Learning Super-Sampling (DLSS). Це розвиток Temporal AntiAliasing (TAA) з використанням нових інтелектуальних можливостей Turing. Зараз TAA є найпоширенішим методом згладжування, який дається з мізерними втратами продуктивності в кілька відсотків. TAA використовує дані минулого кадру для семплів нового. При хорошому результаті згладжування країв цей метод дає певне змазування і тремтіння картинки, особливо в динаміці. DLSS використовує спеціально навчену нейронну мережу для більш швидкої і якісної вибірки. Новий метод дає чітку картинку при ще менших витратах продуктивності.

Згладжування DLSS виглядає дуже перспективно, причому воно легко інтегрується в ігри, що спростить його популяризацію. Цікаво, що на графіках NVIDIA показаний досить значне зростання fps при активації DLSS. Причина в тому, що при DLSS можливі різні методи вибірки, і в деяких режимах мова, по суті, йде про реконструкцію фінального зображення з меншого. Тобто це дійсно може прискорювати рендеринг. Також треба розуміти, що багато ігор зараз використовують технології адаптивного дозволу зі згладжуванням через TAA. Не кожен користувач в курсі таких тонких налаштувань. І якщо йому при автоматичній настройці буде виставлений режим DLSS, то він отримає помітне поліпшення якості картинки при реальному зростанні швидкодії.

На даний момент відомо про інтеграцію DLSS в движки Unreal Engine і Unity. А список ігор, в які додадуть це згладжування, стає дедалі більше.

трасування променів

Також технології нейронних мереж потрібні для очищення зображення від шумів при рендеринге з використанням трасування променів. І тут ми підбираємося до головної особливості Turing - підтримки трасування променів в реальному часі. По суті, ми маємо перше покоління відеокарт, яке підтримує новий метод візуалізації. Зараз використовується метод растеризації: об'єкти проектуються на площину екрану з подальшою обробкою пікселів з урахуванням відстані до площини проекції і накладення текстур. Оскільки індустрія розвивалася багато років, то ефективність сучасних методів візуалізації на актуальних GPU досить висока. Трасування променів використовує метод побудови зображення, наближений до реального, імітуючи проходження променів світла в навколишньому середовищі. При трасуванні для кожного пікселя будується промінь, який визначає його видимість. Далі будуються вторинні промені від точки перетину до джерела світла для визначення освітленості точки.

При трасуванні можна коректно прораховувати не тільки освітленість кожної точки, а й взаємний вплив об'єктів один на одного з урахуванням їх матеріалів. При стандартних методах рендеринга ми бачимо якісну симуляцію, де правильне затінення або якісь особливості висвітлення відтворюються з використанням певних спрощень, використовуються заздалегідь підготовлені відображення, карти тіней і різні методи симуляції глобального затінення. Трасування променів дозволяє зробити все це більш достовірним, краще з огляду на особливості навколишнього середовища і матеріалів об'єктів. І чим складніше сцена, тим більше очевидні будуть переваги трасування.

Наприклад, з трасуванням можна створювати коректні відображення з урахуванням всього оточення. При звичайних методах зайві об'єкти поза зоною кадру просто відсікаються. Також краще враховуються особливості переломленого і відбитого світла, який визначається взаємним вліяніеем об'єктів. Простіше відтворювати напівпрозорі об'єкти. Зараз це непогано симулюється, але не завжди картинка виглядає коректно у всіх нюансах.

Трасування дозволяє відтворювати реалістичні тіні, враховуючи спрямованість світла і його неуважність. Ми отримаємо більш точні контури тіні і реалістичне розмиття при віддаленні від джерела освітлення. До речі, схожий ефект працює з технологією м'яких тіней NVIDIA HFTS.

Ну і ключовим моментом є відтворення реалістичного об'ємного освітлення і затінення. Багато переваги рендеринга з використанням трасування добре показані в нижньому відеоролику.

Головною перешкодою по впровадженню трасування були високі вимоги до продуктивності системи, адже ще недавно для цього були потрібні потужні графічні ферми. З моменту розробки цього алгоритму пройшли десятки років. Зараз трасування активно використовується в кіноіндустрії, а з виходом Turing починається шлях по впровадженню даної технології в ігрову індустрію. Всі розуміють, що це перші кроки в цьому напрямі. Тому про повноцінну трасування поки мова не йде. NVIDIA впроваджує гібридний метод візуалізації, який дозволяє поєднувати растеризування з трасуванням для деяких ефектів.

І серед нових ігор, де вже заявлена ​​підтримка трасування, ми бачимо згадка лише деяких ефектів. Так, в Shadow of the Tomb Raider будуть реалізовані реалістичні тіні, в Battlefield V якісніші відображення, а в Metro Exodus реалістичне глобальне затінення.

Проект Atomic Heart обіцяє відразу кілька ефектів. Тут буде як реалістичне затінення, так і коректні відображення. Зверніть увагу на рекурсію відображень в дзеркальній поверхні в кінці ролика - виглядає дійсно круто.

І це лише перша хвиля ігр та перше покоління прискорювачів GeForce RTX, які можуть обробляти трасування в реальному часі.

Докладніше поговоримо про технічну реалізації гібридного рендеринга. Процесори Turing можуть одночасно поєднувати роботу конвеєра растеризации і трасування. Растеризация швидше для визначення видимості об'єкта. Вторинні промені при трасуванні можуть вже використовуватися для створення якісних відображень, тіней та інших ефектів. Розробники отримають можливість регулювати ступінь покриття відбитими променями потрібної поверхні. В цілому ж кількість первинних і вторинних променів залежить від складності сцени і багатьох інших параметрів.

Сама трасування не є якоюсь ексклюзивною особливістю NVIDIA. Компанія Microsoft вже прийняла розширення DirectX Raytracing (DXR) для DirectX 12. API визначає команди на виконання, не обмежуючи апаратний пристрій в методах їх виконання. Технологія NVIDIA RTX пропонує поєднання програмних алгоритмів і апаратних можливостей для реалізації трасування. Природно, що NVIDIA RTX працює в середовищі DirectX 12, але також NVIDIA працює над стандартизацією і впровадженням технології в Vulkan API. З чуток трасування в середовищі Vulkan додадуть в Final Fantasy XV: Windows Edition .

Одним з методів прискорення трасування є застосування алгоритму Bounding Volume Hierarchy (BVH). Він передбачає розбиття сцени на структуру ієрархічно пов'язаних блоків, в які входять різні геометричні примітиви. Кожен промінь тестується, проходячи по цьому дереву, поки не зустріне на своєму шляху примітив. Створення ієрархічної структури BVH позбавляє від зайвих тестів для променя.

Спеціальні RT-ядра беруть на себе апаратні розрахунки за алгоритмом BVH. Без цих блоків процесор змушений виконувати тисячі зайвих операцій і розрахунків.

Pascal не має таких блоків і його продуктивність в трасуванні значно нижче. Для GeForce GTX 1080 Ti озвучується цифра в 1,1 гігалучей в секунду (Giga Rays / s). GeForce RTX 2080 Ti з RT-блоками обробляє 10 гігалучей в секунду. Різніця Величезна.

При використанні трасування променів на зображенні утворюється шум, який забирається спеціальними фільтрами. У Turing використовується апаратне шумозаглушення на основі інтелектуальних алгоритмів з використанням глибокого навчання, забезпечуючи роботою тензорні блоки.

З переходом до гібридного рендерингу виходить різне навантаження на певні блоки GPU. Нижня схема показує приблизний розподіл навантаження для виведення одного кадру. При використанні DLSS близько 20% часу кадру потрібно для тензорних обчислень, а 80% - для звичайного рендеринга з використанням ядер CUDA. При цьому трасування вимагає приблизно половину часу від обробки шейдеров FP32, тобто ядра RT займають 40% часу кадру. І ще 28% йде на операції INT32.

І ще 28% йде на операції INT32

З цього всього NVIDIA виводить нову метрику вимірювання комбінованої продуктивності в гібридному рендеринге:

RTX-OPS = TENSOR * 20% + FP32 * 80% + RTOPS * 40% + INT32 * 28% (Tera-OPS)

Для GeForce RTX 2080 Ti це 76-78 Tera-OPS, для GeForce RTX 2080 це 57-60 Tera-OPS, а для старого флагмана GeForce GTX 1080 Ti лише 11,3 Tera-OPS.

Для наочності наведемо таблицю, в якій зведені разом дані по швидкості виконання різних обчислень. Це пікові показники, з урахуванням невеликої відмінності в частотах Boost Clock.

GeForce RTX 2080 Ti GeForce RTX 2080 GeForce RTX 2070 GeForce GTX 1080 Ti RTX-OPS (Tera-OPS) 76-78 57-60 42-45 11,3 Rays Cast (Giga Rays / s) 10 8 6 1,1 FP32 TFLOPS 13,4-14,2 10-10,6 7,5-7,9 16,3 INT32 TIPS 13,4-14,2 10-10,6 7,5-7,9 н / д FP16 TFLOPS 26, 9-28,5 20,1-21,2 14,9-15,8 н / д FP16 Tensor TFLOPS спільно з FP16 107,6-113,8 80,5-84,8 59,7-63 н / д FP16 Tensor TFLOPS спільно з FP32 53,8-56,9 40,3-42,4 29,9-31,5 н / д INT8 Tensor TOPS 215,2-227,7 161,1-169,6 119,4 -126 н / д INT4 Tensor TOPS 430,3-455,4 322,2-339,1 238,9-252,1 н / д

Віртуальна реальність

Прискорювачі Turing стануть найшвидшим рішенням для віртуальної реальності VR. Підтримується технологія Multi-View Rendering, яка є розвитком Simultaneous Multi-Projection (Pascal). Це метод відтворення зображення для різних проекцій (аж до 32) з прорахунком геометрії одночасно для декількох проекцій. Новий метод передбачає можливість більшого зміщення точок огляду, дозволяючи працювати в VR з великим кутом огляду, аж до 200 градусів.

Через особливості лінз в окулярах віртуальної реальності на периферії якість зображення нижче, і тут можна знизити якість рендеринга. Для прискорення можна застосувати Foveated Rendering. Також важливу роль у віртуальному середовищі відіграє правильне позиціонування звуку. Якість об'ємного звуку поліпшить технологія NVIDIA VRWorks Audio, яка використовує метод трасування для прорахунку шляху звукової хвилі. А оскільки тепер є спеціальні блоки трасування, то такі обчислення помітно прискорилися.

Серед інших достоїнств нові відеокарти NVIDIA підтримують VirtualLink USB Type-C для комутації пристроїв VR через один інтерфейс без зайвих проводів.

Блок виведення зображення

Turing отримав новий блок виведення зображення з інтегрованою підтримкою HDR і більш високих дозволів. З'явилася підтримка DisplayPort 1.4a з можливістю передавати картинку 8K при 60 Гц, плюс технологія стиснення даних без втрат VESA Display Stream Compression (DSC) 1.2. Turing можуть управляти двома дисплеями 8K при частоті 60 Гц з HDR. Для збереження оригінальних кольорів рекомендується підключати HDR-монітори стандарту BT.2100. Всього ж у відеокарт три порти DisplayPort. Ще є один HDMI 2.0b з підтримкою HDCP 2.2.

Згаданий VirtualLink теж дозволяє підключати 8K-монітори. Фізично він виконаний у вигляді порту USB Type-C. Спочатку інтерфейс розроблений для простого підключення гарнітур VR.

У процесорах Turing поліпшений блок кодування відео NVENC. З'явилася підтримка кодування H.265 8K при 30 кадрах. Заявлена ​​якась економія бітрейта до 25% для HEVC і до 15% для H.264, що, ймовірно, варто розуміти, як підвищення якості кодування щодо минулого покоління відеокарт. При цьому апаратний кодер працює помітно швидше програмного x264, забезпечуючи мінімальне навантаження на CPU при стрімінга навіть в 4K. Крім якісного стрімінга можна очікувати і нові можливості для звичайного захоплення відео. При наявності апаратного 8K-кодувальника функція захоплення в 8K повинна з'явитися і в Shadowplay, хоча поки вона не заявлена.

При наявності апаратного 8K-кодувальника функція захоплення в 8K повинна з'явитися і в Shadowplay, хоча поки вона не заявлена

Оновлений і декодер відео для відтворення відеоконтенту: підтримується декодування HEVC YUV444 10 / 12b HDR з частотою 30 кадрів в секунду, H.264 8K і VP9 10 / 12b HDR.

технологія SLI

У поколінні Pascal була покращена пропускна здатність в SLI-режимі завдяки використанню двох роз'ємів MIO з парою відповідних містків. У нових процесорах Turing TU102 і TU104 використовується інтерфейс NVLink другого покоління для обміну даними між GPU. У TU102 реалізовано дві лінії x8 другого покоління NVLink, а в TU104 одна лінія x8. Двунаправленная пропускна здатність однієї такої лінії складає 50 Гбайт / с. Завдяки новому інтерфейсу SLI підтримуються нові високі дозволу. Для GeForce GTX 2080 в SLI доступний режим 8K, 4K Surround 144 Гц або 5K при 75 Гц. GeForce GTX 2080 Ti підтримує навіть 8K Surround.

SLI дозволяє об'єднувати тільки дві відеокарти. І сам цей режим доступний лише на GeForce GTX 2080 Ti і GeForce GTX 2080. Вартість нового містка SLI на офіційному сайті 79 доларів.

Нові можливості GeForce Experience

Поява нових апаратних можливостей дозволило розширити функціональність програмного додатка GeForce Experience. Зокрема, власникам нових відеокарт буде доступний Ansel RTX.

У новому Ansel можна створювати скріншоти з трасуванням променів. Причому в режимі паузи якість трасування буде вище, ніж в грі в режимі реального часу.

Технологія нейронних мереж дозволить робити скріншоти підвищеного дозволу з кращою якістю і опрацюванням.

Плюс можливість обробляти знімки, накладаючи різні зображення один на одного, додавати стікери. Будуть нові фільтри. Інтеграцію Ansel отримають багато нові ігри, хоча не скрізь доступні абсолютно всі функції. Серед гучних релізів осені з Ansel подружаться Battlefield V, Hitman 2, деякі функції будуть в Metro: Exodus.

GPU Boost 4.0 і розгін

У відеоадаптерах NVIDIA давно застосовується технологія GPU Boost, яка регулює і підвищує частоти ядра. Це прискорення з безліччю проміжних значень, де ключовим є утримати відеокарту в певних рамках потужності і температур. В черговий раз нагадаємо, що NVIDIA вказує базове (мінімальне) значення частоти і середнє значення Boost Clock. При певних умовах в ігровій навантаженні частоти будуть вищими заявленого Boost. При хорошому охолодженні так часто і відбувається. І це відрізняється від системи позначень частот у відеокарт AMD, де аж до сімейства Vega вказувалося максимальне значення частоти ядра.

Алгоритм роботи GPU Boost постійно вдосконалюється. У минулому поколінні був реалізований GPU Boost 3.0, де вперше ппользователь отримав можливість налаштувати криву частот через через програмні установки спеціальних утиліт. У новому GPU Boost 4.0 користувачеві доступно ще більше можливостей для тонкої настройки, де можна контролювати другу точку цільової температури і визначати час роботи при досягненні температурних лімітів.

0 користувачеві доступно ще більше можливостей для тонкої настройки, де можна контролювати другу точку цільової температури і визначати час роботи при досягненні температурних лімітів

Нові функції настройки Boost з гнучким підбором параметрів температурної кривої доступні в утиліті EVGA Precision X1.

Нові функції настройки Boost з гнучким підбором параметрів температурної кривої доступні в утиліті EVGA Precision X1

Також в Turing з'явилася функція автоматичного підбору частот для розгону. NVIDIA Scanner запускає спеціальний тест для перевірки на стабільність при поступовому підвищенні частот. Таке сканування і тест займають 20 хвилин, але досить точно визначають стелю максимальних частот, позбавляючи користувача від зайвих тестів. Дуже зручно, особливо, для тих, хто слабо розбирається в цій темі. Підтримка NVIDIA Scanner є в новій версії MSI Afterburner і EVGA Precision X1.

Підтримка NVIDIA Scanner є в новій версії MSI Afterburner і EVGA Precision X1

Якщо виробник дає якісь можливості для прискорення відеокарт, то він упевнений в якісній реалізації харчування і додатковому потенціал охолодження для таких маніпуляцій.

Не випадково встановлені настільки високі ціни на версії Founders Edition. Якщо в минулому поколінні це здавалося переплатою виключно за ранню доступність на ринку і ексклюзивність, то тепер відчувається серйозний ґрунтовний підхід. Відеоадаптери Turing отримали нове охолодження з великим радіатором, випарної камерою і двома вентиляторами. Навіть за вагою відчувається, що це якісний продукт з потужним охолодженням.

Вперше референсні карти від NVIDIA не вимагають компромісів, а відразу забезпечують відмінні температурно-шумові характеристики. Плюс спочатку прошиті більш високі частоти Boost, і є всі можливості для реалізації розгону без заміни охолодження.

Детальніше про конкретні примірниках GeForce RTX ми поговоримо в майбутніх оглядах.

Висновки

NVIDIA Turing - передова графічна архітектура, яка розширює можливості звичного рендеринга, додаючи трасування променів в реальному часі і можливість використовувати нейронні мережі для допоміжних функцій. Нові апаратні можливості забезпечують підтримку абсолютно нових технологій і графічних ефектів. Поява Turing стало знаковою подією, яке позначає старт нової ери і поступову інтеграцію трасування в ігрову індустрію. Уже є перші проекти, де буде підтримка ефектів на базі трасування NVIDIA RTX. Ще більше ігор отримають підтримку нового згладжування NVIDIA DLSS. Також в Turing є багато покращень для прискорення традиційного рендеринга. Навіть без урахування трасування ви спочатку отримуєте найшвидші ігрові відеокарти з потенціалом для нарощування продуктивності після впровадження нових технологій.

Поряд зі своєю технологічністю нове покоління радує якісним підходом до проектування кінцевих пристроїв. Референсні прискорювачі GeForce RTX перейшли на нове охолодження, є функції для більш простого розгону. Все зроблено для того, щоб задовольнити запити самого вимогливого користувача та виправдати високу вартість відеокарт.

Про продуктивності GeForce RTX 2080 і GeForce RTX 2080 Ti в існуючих іграх ми поговоримо в наступних оглядах, які вийдуть в найближчі дні. Залишайтеся з нами і стежте за новинами!

Уважаемые партнеры, если Вас заинтересовала наша продукция, мы готовы с Вами сотрудничать. Вам необходимо заполнить эту форму и отправить нам. Наши менеджеры в оперативном режиме обработают Вашу заявку, свяжутся с Вами и ответят на все интересующее Вас вопросы.

Или позвоните нам по телефонам: (048) 823-25-64

Организация (обязательно) *

Адрес доставки

Объем

Как с вами связаться:

Имя

Телефон (обязательно) *

Мобильный телефон

Ваш E-Mail

Дополнительная информация: