Po 18 miesiącach od premiery swojego ostatniego procesora graficznego X800 (R420) i 3 miesiące po wydaniu przez nVidię drugiego już GPU zgodnego z Shader Model 3.0 (G70), inżynierowe z firmy ATi w koń
Po 18 miesiącach od premiery swojego ostatniego procesora graficznego X800 (R420) i 3 miesiące po wydaniu przez nVidię drugiego już GPU zgodnego z Shader Model 3.0 (G70), inżynierowe z firmy ATi w końcu mogli oddać do użytku swoje najnowsze dzieło - chip o kodowym oznaczeniu R500.
W dzisiejszych czasach głównym elementem określającym nowoczesność i stopień zaawansowania grafiki jest zgodność z ShaderModel 3.0 (DirectX 9c), którą ATi R500 oczywiście już dysponuje. To oznacza, że po ponad półtora roku dominacji nVidii w tej dziedzinie, ATi nareszcie może iść ramię w ramię ze swoim największym konkurentem.
Czy klasyfikowanie kart na podstawie obsługi określonego Modelu Cieniowania jest/było słuszne, tego raczej żaden użytkownik-gracz nie będzie pewien. Zwłaszcza, że oba te modele mieściły się przecież w obrębie jednej specyfkacji DirectX : 9b lub 9c (Microsoft nie chciał ich nawet rozróżnić jako 9.1) - czy taka subtelna różnica może oznaczać coś nadzwyczajnego dla zwyłego gracza? Czy zapewni mu więcej zabawy i emocji podczas gry? Na to pytanie chyba nie musimy już sobie odpowiadać.
Co do jednego jesteśmy natomiast pewni - SM 3.0 stał się potężnym narzędziem walki marketingowej. Co gorsza, ci dwaj najwięksi producenci procesorów graficznych zaczęli wchodzić w 'układy' z producentami gier, optymalizując niektóre z nich pod swoje chipy.
Na szczęście w kolejnej wersji DirectX 10 Microsoft położy kres szybkiemu tempu wprowadzania coraz to nowych funkcji w kartach graficznych. Była to jedna z wielu rewelacji na temat nowego API kart graficznych ogłoszona przez Rudolpha Balaza, menadżera produktu Microsoftu, podczas tegorocznej konferencji Professional Developers Conference. Więcej na ten temat pisaliśmy już we wrześniowym artykule.
Oczywiście zgodność z DirectX 9c to nie jedyna cecha nowych procesorów ATi. Inżynierowie wymyśli jeszcze kilka technologii, dzięki którym karty Radeon X1000 mają bez kompleksów rywalizować z najnowszymi GeForce'ami 7800. Najważniejsze z nich to:
- technologia wykonania 90 nm
- nowa, ultrawątkowa architektura (Ultra-Threaded Shader Engine)
- pierścieniowy kontroler pamięci
- CrossFire - technologia łączenia dwóch kart (odpowiednik SLI u nVidii)
- Avivo - zaawansowany obraz i wideo
Każdą z nich po krótce omówimy w tym artykule.
Na początek porównanie możliwości czterech najsilniejszych chipów : obecny rywal GeForce 7800, oraz dwa starsze. Widać wyraźnie, że ATi nadrabiało poważne tyły w stosunku do swojej konkurencji. Dopiero teraz zaoferowało rozwiązania, które nVidia wprowadzała kolejno w tamtym i w tym roku.
Wydajność 'teoretyczną' karty przyjęło się oceniać na podstawie liczby potoków renderujących i częstotliwości taktowania GPU, oraz liczby jednostek Vertex Shader. Przypomnijmy, że w swojej specyfikacji G70 nVidia rozróżniła 'potoki pixeli' i 'potoki renderujące piksele'. Tych pierwszych GPU nVidii ma aż 24, natomiast rzeczywistych potoków renderujących" jest 16, a więc tyle samo co w nowym X1800.
nVidia NV40 GeForce 6800 | nVidia G70 GeForce 7800 | ATi R400 Radeon X850 | ATi R500 Radeon X1800 | |
data wydania | 04'2004 | 06'2005 | 05'2004 | 10'2005 |
technologia wykonania | 130 nm | 110 nm | 130 nm | 90 nm |
liczba tranzystorów | 222 mln | 302 mln | 160 mln | 320 mln |
kontroler pamięci | 256-bit GDDR | 256-bit GDDR | 256-bit GDDR | 256-bit GDDR |
Pixel procesor | ||||
Shader Model | 3.0 | 3.0 | 2.0b | 3.0 |
potoki Pixel Shader | 16 | 24 | 16 | 16 |
potoki ROP renderujące | 16 | 16 | 16 | 16 |
maksymalna liczba Z w cyklu | 32 | 32 | 16 | 16 |
liczba tekstur w cyklu | 16 | 16 | 16 | 16 |
statyczne pętle i rozgałęzienia | tak | tak | tak | tak |
dynamiczne pętle i rozgałęzienia | tak | tak | nie | tak |
multiple render target | tak | tak | tak | tak |
floating-point render target | tak | tak | tak | tak |
techniki filtrowania | dwu/trójliniowe anizotropowe | dwu/trójliniowe anizotropowe | dwu/trójliniowe anizotropowe | dwu/trójliniowe anizotropowe miejscowe anizo |
maksymalny poziom filtrowania anizo | x 16 | x 16 | x 16 | x 16 |
Vertex procesor | ||||
Shader Model | 3.0 | 3.0 | 2.0b | 3.0 |
liczba jednostek Vertex | 6 | 8 | 6 | 8 |
statyczne pętle i rozgałęzienia | tak | tak | tak | tak |
dynamiczne pętle i rozgałęzienia | tak | tak | nie | tak |
odczyt tekstur z vertex shader | tak | tak | nie | tak |
teselacja | nie | nie | nie | nie |
FSAA, HSR, HDR | ||||
algorytmy FSAA | multipróbkowanie, obracaną siatką | multipróbkowanie, obracaną siatką, przeźroczyste | multipróbkowanie, obracaną siatką, czasowe | multipróbkowanie, obracaną siatką, czasowe, przeźroczyste, |
próbkowanie FSAA | 2/4/6/8 | 2/4/6/8 | 2/4/6 | 2/4/6 |
HSR - usuwanie niewidocznych | tak | tak | tak | tak |
kompresja tekstur, bufora-Z | tak | tak | tak | tak |
szybkie czyszczenie bufora-Z | tak | tak | tak | tak |
HDR | tak | tak | tak | tak |
obsługa OpenEXR HDR | tak | tak | nie | tak |
procesor video | tak | tak | nie | tak |