Nvidia Ampere już jest! "Zieloni" zaprezentowali kartę graficzną nowej generacji
Oto jest! Podczas wirtualnej konferencji GTC 2020, Nvidia zaprezentowała A100, a więc pierwszą kartę graficzną z nowej generacji Ampere. Specyfikacja akceleratora wgniata w podłogę, aczkolwiek jest to układ do profesjonalnych zastosowań.
No właśnie, Nvidia póki co skupiła się na segmencie profesjonalnym, gdzie procesory graficzne są stosowane w wysokowydajnych systemach obliczeniowych. Można jednak podejrzewać, że układy z generacji Ampere w późniejszym terminie pojawią się też w kartach graficznych dla graczy.
Nvidia prezentuje topowy układ graficzny z generacji Ampere
Szef Nvidii ujawnił popisowe dzieło „zielonych”. Mowa o układzie Ampere GA100, który jest najbardziej złożonym układem graficznym zaprojektowanym przez inżynierów Nvidii - konstrukcja składa się z ponad 54 miliardów tranzystorów i ma powierzchnię 826 mm2 (do produkcji wykorzystano 7-nanometrowy proces technologiczny TSMC).
Specyfikacja układu wgniata w podłogę. Ampere GA100 składa się z 128 bloków SM – łącznie znajdziemy tutaj 8196 rdzeni CUDA i 512 ulepszonych rdzeni Tensor 3. generacji (producent nic nie wspomina o jednostkach RT, więc konstrukcja najprawdopodobniej została ich pozbawiona). Układ ma również do dyspozycji 48 GB pamięci HBM2 6144-bit.
Nvidia A100 - pierwsza karta graficzna Ampere już jest
Rdzeń Ampere GA100 znalazł zastosowanie w karcie A100 (chociaż bardziej prawdopodobne wydaje się tutaj określenie akcelerator obliczeniowy). Warto jednak zauważyć, że zastosowano tutaj okrojoną wersję rdzenia - dysponuje ona „tylko” 108 blokami SM, które przekładają się na 6912 rdzeni CUDA i 432 rdzeni Tensor (moc obliczeniowa pojedynczej precyzji dochodzi do 19,5 TFLOPS, a w przypadku dla rdzeni tensor jest to 312 TFLOPS FP16 i 624 TOPS INT8). Oprócz tego udostępniono 40 GB pamięci HBM2 5120-bit o przepustowości 1,6 TB/s.
Model | Nvidia Tesla V100 | Nvidia A100 |
Generacja | Volta (12 nm) | Ampere (7 nm) |
Tranzystory | 21,1 mld | 54,2 mld |
Powierzchnia | 815 mm2 | 826 mm2 |
Rdzenie CUDA FP32/FP64 | 5376/2688 | 6912/3456 |
Rdzenie tensor | 672 | 432 |
Moc obliczeniowa FP32/FP64 | 15,7/7,8 TFLOPS | 19,5/9,7 TFLOPS |
Moc obliczeniowa Tensor FP16 | 125 TFLOPS | 312 TFLOPS |
Moc obliczeniowa Tensor INT8 | 62 TOPS | 624 TOPS |
Pamięć VRAM | 32 GB HBM2 4096-bit | 40 GB HBM2 5120-bit |
Przepustowość pamięci | 900 GB\s | 1,6 TB/s |
TDP | 300 W | 400 W |
Wydajność karty i tak robi wrażenie – poniżej znajdziecie porównanie A100 do karty Tesla V100 (model z 2017 roku z generacji Volta).
Ciekawostką jest technologia Multi-instance GPU, która pozwala podzielić kartę A100 na siedem oddzielnych instancji, zajmujących się innymi zadaniami. Każda instancja ma swoje rdzenie CUDA, rdzenie tensor, pamięć podręczną i pamięć HBM2, co pozwala zapobiegać konfliktom między instancjami (można więc powiedzieć, że działają one jako osobne układy graficzne).
Układy A100 oczywiście można też ze sobą łączyć. Producent zastosował 3. generację łącza NVLink, gdzie zwiększono przepustowość z 300 do 600 GB/s (przełączaniem kilku łączy zajmują się przełączniki NVSwitch o przepustowości 4,8 TB/s).
Nvidia prezentuje system obliczeniowy Nvidia DGX A100
Nvidia przy okazji zaprezentowała DGX A100, a więc swój nowy system obliczeniowy – konstrukcja została wyposażona w dwa 64-rdzeniowe procesory AMD Epyc „Rome”, osiem akceleratorów obliczeniowych A100 oraz 15 TB pamięci masowej pod PCI-Express 4.0. Producent chwali się, że to najbardziej zaawansowany system obliczeniowy AI.
Jeżeli bylibyście zainteresowani, system podobno jest dostępny od ręki - jego koszt to „jedyne” 199 000 dolarów.
Źródło: Nvidia, ComputerBase, VideoCardz
Zobacz więcej newsów o kartach graficznych:
- Radeon VII wraca do świata żywych - będzie z niego dobra karta dla profesjonalistów
- Szef Nvidii serwuje popisowe danie - czy to zapowiedź kart graficznych Ampere?
- Karta Intel DG1 nie pojawi się na rynku... a przynajmniej nie w takiej formie co chcemy
Komentarze
40W tym tempie to za 5 lat będę potrzebować 3-fazowego zasilania do kompa.
Chciał bym zauważyć, że zaprezentowany układ w najmniejszym stopniu nie jest "kartą graficzną", dziennikarstwo ma jeszcze jakąś wartość merytoryczną? Na karty graficzne od Nvidi z architekturą Ampere trzeba będzie jeszcze poczekać, to co zaprezentowano z kartą graficzną ma tyle wspólnego, że wygląda jak układ graficzny w rzeczywistości jest to specjalizowana konstrukcja do obliczeń. Ciężko dziś o połapanie się co jest czym.
Nie powinno być odwrotnie?
Czyli jednak można wykorzystać CPU? Można i takie same podejście widzę w grach nowej generacji.
Nvidia szkoda trochę bo oni nie mają swojego CPU więc przyszłościowo są na gorszej pozycji od AMD zaś Intel po ostatnich rewelacjach z TSMC i podpisaniu umowy z USA pokazuje , że u nich z procesami produkcji nie jest ciekawie i będzie tylko gorzej.
19Tflop/9Tflop
A moc samych tensorów to kosmos. Ładny postęp.
niezle, robi wrażenie.