Nvidia Titan V - karta za 3000 dolarów ma problem z przeprowadzaniem obliczeń [AKT.]
Najnowsza karta graficzna Nvidii nie nadaje się do profesjonalnych zastosowań? W sieci pojawiły się zaskakujące doniesienia, które mogą niekorzystnie wpłynąć na wizerunek Nvidii.
Nvidia Titan V to karta graficzna zaprojektowana głównie z myślą o profesjonalnych zastosowaniach. Wygląda jednak na to, że akcelerator może tutaj nie być najlepszym wyborem, bo… ma problemy powtarzalnością przy przeprowadzaniu skomplikowanych obliczeń.
Sprawę naświetlił serwis The Register, z którym skontaktował się anonimowy naukowiec - próbował on przeprowadzić obliczenia związane z interakcją między białkami i enzymami, które zawsze powinny dawać takie same rezultaty. W czasie obliczeń pojawiły się jednak pewne problemy. Na cztery karty Titan V, dwa modele zawsze wskazywały takie same wyniki, ale dwa pozostałe nie dawały poprawnych rezultatów mniej więcej w 10% prób obliczeniowych.
Co prawda Nvidia odmówiła komentarza w tej sprawie, ale pojawiły się teorie wyjaśniające sytuację. Można podejrzewać, że problem wynika z niestabilnej pracy pamięci wideo (na pokładzie znajdziemy kości HBM2, które pracują z wyjątkowo wysokim zegarem 1700 MHz). W takim przypadku wprowadzenie poprawek może być dosyć skomplikowane, bo wymagałoby albo zmniejszenia zegarów pamięci i obniżenia wydajności akceleratora albo zwiększenia ich napięcia zasilającego i równocześnie zwiększenia zapotrzebowania na energię elektryczną.
Nie można jednak wykluczyć innego scenariusza - niedopracowanego oprogramowania, na którym przeprowadzane są obliczenia. Druga teoria zakłada, że wykorzystane oprogramowanie nie potrafi poprawnie wykorzystać nowych akceleratorów, co może skutkować generowaniem błędnych wyników. W takim przypadku najprawdopodobniej wystarczyłaby odpowiednia aktualizacja.
Jakby nie było, sytuacja nie wpływa pozytywnie na wizerunek Nvidii. Jak twierdzi The Register, część naukowców nawet zaleca zrezygnowanie z wykorzystywania kart Titan V aż do momentu wyjaśnienia sprawy i wprowadzenia odpowiednich poprawek.
Aktualizacja 26.03.2018 9:50
Nvidia nie przyznaje się do problemów z działaniem karty - serwis The Register opublikował oświadczenie w sprawie problemów:
„Wszystkie nasze procesory graficzne pracują poprawnie. Nasza linia kart Tesla, która wykorzystuje kod korekcji błędów ECC, jest przeznaczona dla tego typu dużych i wysokowydajnych symulacji. Każdy, kto zauważył problemy z działaniem karty, powinien skontaktować się z działem pomocy technicznej: support@nvidia.com."
Źródło podaje również, że Titan V ma problemy z przeprowadzaniem obliczeń tylko w jednej aplikacji - jest to pakiet Amber, który służy m.in. do przeprowadzania symulacji dynamiki molekularnej. Twórcy aplikacji nie potwierdzają jednak doniesień o problemach z działaniem nowego GPU.
Źródło: The Register, Computer Base, Amber
Komentarze
51Gdzieś już to widziałem dawno temu.
"część naukowców nawet zaleca zrezygnowanie z wykorzystywania kart Titan V"
Słabo amd musicie się bardziej postarać....
A może karta w momencie gdy nie liczy to co zostało jej zadane zaczyna sama hakować system bo w końcu jest tak zaawansowana.
Mi najbardzie jpodoba sie zdanie "The Register, z którym skontaktował się anonimowy naukowiec"
to brzmi prawie tak jak by Nvidia to był jakis Putin i wszyscy bali sie gułagu.
Wcześniej byli anonimowi producenci ktorych to gryzło sumienie że umowy sa jakies nielegalne, teraz anonimowi naukowcy.
Kiedys programikiem próbowali wykazać ze pamiec w GTX970 zapycha sie bo te 512MB robi problem. Niestety realnie nie udało sie poza tym programikiem problemu uswiadczyc.
Zobaczymy jak i tu bedzie :)
i tyle w temacie.
znany anonim wywołał bład na titanie v którego nikomu nie udało sie powtórzyć.
A spokesperson for Nvidia has been in touch to say people should drop the chip designer a note if they have any problems. The biz acknowledged it is aware of at least one scientific application – a molecular dynamics package called Amber – that reportedly is affected by the Titan V weirdness.
"All of our GPUs add correctly," the rep told us. "Our Tesla line, which has ECC [error-correcting code memory], is designed for these types of large scale, high performance simulations. Anyone who does experience issues should contact support@nvidia.com."
czyli patchowac beda Amber i tyle.
Dziwna zbieżność sytuacji.
Profesjonalna... taaa. Jak będziecie powtarzać takie głupoty to tak będzie.
Lepiej napisac bez sensu ze nvidia sie nie przyznaje.