Pod względem architektury i zgodności ze standardami bibliotek graficznych, procesory obu firm są bardzo podobne. Ich silniki graficzne mają po dwie jednostki geometryczne klasy VertexShader 2.0+ i jednostkę cieniowania pikseli PixelShader 2.0+. Pomiędzy tymi ostatnimi wystepują małe różnice w długości wykonywanych instrukcji, jednak oba układy są w pełni zgodne ze standardem DirectX 9, co dla zwykłego gracza oznacza, że gra obsługująca to API na obu kartach będzie wyglądać tak samo.
Architektura renderingu w obu przypadkach jest czteropotokowa, a to po przemnożeniu przez częstotliwość taktowania GPU, daje maksymalną teoretyczną szybkość wypełniania pikseli (MegaPikseli/sekundę). W każdym potoku jest tylko jedna jednostka teksturująca, a zatem jednocześnie będzie to także szybkość multiteksturowania, czyli nakładania na punkt więcej niż jednej tekstury. Nadal o tym wspominamy, bowiem procesory starszej generacji - zarówno ATI jak i nVidii - w każdym z potoków miały po dwie jednostki teksturujące (tak zwane TMU) i o ile szybkość wypełniania pikseli przy tym samym zegrze była taka sama, to wydajność podczas multiteksturowania wzrastała dwukrotnie.
Zasadniczymi różnicami pomiędzy tymi procesorami są dodatkowe technologie i algortymy, odpowiedzialne za "polepszanie" obrazu lub optymalizowanie wydajności. Inne algorytmy do pełnoekranowego wygładzania krawędzi (FSAA), filtrowania anizotropowego, kompresji koloru, szybkiego czyszczenia bufora Z czy usuwania niewidocznych powierzchni, stosuje firma ATi a inne nVidia, chociaż efekt ich działania jest bardzo podobny.
Niektóre z algorytmów poprawiających wydajność w określonych sytuacjach okazały się na tyle innowacyjne i skuteczne, że wręcz postanowiono je nazwać nowymi technologiami. Tak właśnie jest w przypadku technologii UltraShadow nVidii, która optymalizuje obliczenia rzucanych cieni, a dzięki temu w scenach, w których pojawiać się będzie wiele cieni, procesor będzie mniej przeciążony.
ATi natomiast ma swoją technologię TRUFORM 2.0. Jest to mechanizm który korzysta z powierzchni wyższego rzędu w celu generowania bardziej naturalnych i zawierających więcej szczegółów powierzchni obiektów np: terenu czy postaci. Mówiąc lakonicznie "głowa postaci może być mniej kańciasta". Problem w tym, że aplikacje muszą obsługiwać tą technologię, a więc jej działanie jest ograniczone.
Gigabyte GeForce FX 5700 | Gigabyte Radeon 9600 Pro | |
Silnik graficzny (nazwa marketingowa) | CineFX 2.0 | Smartshader 2.0 |
architektura | 256 bitowa | 256 bitowa |
Vertex Shader | 2.0+ | 2.0+ |
Pixel Shader | 2.0+ | 2.0+ |
zgodność z API | DirectX 9.0 OpenGL 1.4 | DirectX 9.0 OpenGL 1.4 |
potoki renderujące [TMU w potoku] | 4 [1] | 4 [1] |
jednostki geometryczne | 2 | 2 |
ilość tekstur w jednym przejściu | do 16 | do 16 |
ilość instrukcji Pixel shader | do 1024 | do 160 |
ilość instrukcji Vertex shader | do 65,280 | do 65,280 |
max obsługiwany format tekstur | 2048x2048 @32bpp | 2048x2048 @32bpp |
kompresja tekstur | DXTn (S3TC) | DXTn (S3TC) |
metody środowiskowego mapowania | Dot Product3 i EMBM | Dot Product3 i EMBM |
nazwa marketingowa : | Intellisample HTC | SMOOTHVISION 2.1 |
pełno-ekranowe wygładzanie | 2x/2xQ/4x/6xS/8x metodą multipróbkowania | 2x/4x/6x metodą multipróbkowania |
filtrowanie anizotropowe | 2x/4x/8x | 2x/4x/8x/16x |
kontroler pamięci | 4 niezależne 32-bitowe kontrolery | 4 niezależne 32-bitowe kontrolery |
nazwa marketingowa : | Lightspeed Memory Architecture III | HYPER Z III+ |
kompresja koloru | tak | tak |
szybkie czyszczenie Bufora Z | tak | tak |
kompresja Bufora Z | tak | tak |
usuwanie niewidocznych pikseli | tak | tak |
dodatkowe technologie | UltraShadow obliczenia związane z wyświetlaniem cieni | TRUFORM 2.0 drugiej generacji N-Patch, tessellacja wielokątów, mapowanie przemieszczeń |
złącze AGP | AGP 8X/4X | AGP 8X/4X |
RAMDAC | podwójny 400 MHz | podwójny 400 MHz |
transmitter DVI | zintegrowany 165MHz (DVI 1.0) | zintegrowany 165MHz (DVI 1.0) |
obsługa wyjścia TV | zintegrowany w GPU | VIDEOSHADER zintegrowany z GPU |
Wspomaganie DVD | kompensacja ruchu MC + iDCT | kompensacja ruchu MC + iDCT |