Skocz do zawartości
Nargil

Potrzebna Pomoc Ludzi Z Gf8 / Ati Sm4 - Testowanie Projektu + Benchmark

Rekomendowane odpowiedzi

Tak jak obiecałem: oto zoptymalizowana wersja, która sprawdza co wyliczyła:

benchmark

zmiany:

- sensowniejsze komunikaty co aktualnie program robi

- weryfikacja danych

- przyspieszenie programu

- w związku z przyspieszeniem - program mnoży większe macierze, aby czas był +/- podobny do poprzedniej wersji.

- w związku z gromadzeniem większych macierzy w pamięci - program potrzebuje więcej RAM'u.

 

gdyby komuś wyskakiwał błąd o niepoprawnej konfiguracji komputera: http://www.microsoft.com/downloads/details...;displaylang=en <- są to pliki potrzebne by uruchomić programy skompilowane w MS Visual c++ 2008. Jeśli ktoś nie ma, to na pewno mu się przyda w przyszłości, aby uruchomić nowe gry i programy.

 

Będę wdzięczny za test jak ma się czas działania programu do prędkości PCIe

Proszę również ludzi z kartami ATI @SM4 lub SM3 o test. Spodziewam się, że bedą błędy mimo niekręconych kart. Proszę wówczas o wrzucenie screenów.

 

Jeśli ktoś nie wie co oznacza zapis xxxx e+/-yyy

xxxx to wartosc, ktora mnozymy *10 ^ (+/-)yyy

np: 1.1000e002 oznacza liczbę 110.0, zaś 1.8000e-003 oznacza 0.0018

 

» Naciśnij aby pokazać/ukryć tekst oznaczony jako spoiler « - "Poprzednia wersja posta"
Jako projekt na uczelnię napisałem aplikację, która mnoży 2 macierze używając do tego GPU. Obecnie jestem w fazie testowania prędkości działania (do sprawozdania).

 

Tutaj pojawia się moja prośba do was o ściągnięcie aplikacji, a następnie napisanie tutaj na forum:

- czasu działania (aplikacja wyświetla go pod sam koniec)

- procesora i jego taktowania

- ilosci, taktowania, timingów ram

- karty graficznej [model, ilosc, taktowanie gpu, shader, mem]

 

Program mnoży macierze o wymiarach 6000x4000 * 4000x5000. Przykładowo 1 jajku c2q @ 3.0 ghz zajmuje to ~13 minut. U mnie na gf 8800 gt jest to ~30 sekund

 

download link: http://www.nargil.hostedwindows.pl/gpu.rar

Z tego co się orientuję działa niepoprawnie na kartach ATI - niby liczy, ale wyniki są nieprawidłowe, gdyż shadery się w pewnym momencie przestają wykonywać, stąd wyższość ATI nad NV w tym teście o niczym nie świadczy

gdyby komuś wyskakiwał błąd o niepoprawnej konfiguracji komputera: http://www.microsoft.com/downloads/details...;displaylang=en

 

Najbardziej zależy mi na teście

a) procesorów AMD, a w zasadzie zysku z powodu wbudowanego kontrolera pamięci, gdyż moc obliczeniowa CPU w tym programiku nie jest wykorzystywana.

b) SLI

 

 

gdyby kogoś interesowały wyniki testów, które udało mi się przeprowadzić do tej pory:

 

 

<div class="spoilbody">

<div class="spoilheader" onMouseDown="java script:if(this.parentNode.getElementsByTagName('div')[1].style.display == 'none')

this.parentNode.getElementsByTagName('div')[1].style.display = 'block'; else this.parentNode.getElementsByTagName('div')[1].style.display = 'none';"> » Naciśnij aby pokazać/ukryć tekst oznaczony jako spoiler « - "Testy"</div>

<div class="spoilcontent" style="display:none;">Posiadany sprzęt testowy:

Asus p5w64 deluxe @ fsb 400 mhz

Core 2 duo e6300 @ 2.8 ghz

2gb geil ddr 800-4-4-4-12

palit geforce 8800 gt 512 mb 112 shaderów, 600 mhz gpu, 1500 mhz shader, 900 mhz vram

 

wynik ~33 sek

 

zmiana taktowania karty graficznej na odpowiednio 800, 2000, 1000 mhz

wynik ~26 sek

 

zmiana taktowania pamięci na 600-5-5-5-15, przy zachowaniu pierwotnego taktowania płyty i procesora poskutkowała nieznacznym pogorszeniem wyników.

 

Dla standardowych taktowań karty graficznej:

wynik ~36 sek

 

Podkręcenie karty graficznej jak wyżej 800,2000,1000 mhz

wynik ~27 sek

 

Przywróciliśmy standardowe taktowanie pamęci ram 800-4-4-12, a następnie spowolniliśmy procesor do standardowych 1.86 ghz (fsb płyty 200 mhz). Taktowanie karty graficznej 600,1500,900 mhz

wynik ~34 sek

 

Podkręcenie karty graficznej jak wyżej 800,2000,1000 mhz

wynik ~27 sek

 

 

Pozbawiając komputer 2gb ram na rzecz 512mb tej samej prędkości uzyskany wynik był niezadowalająco niski. Główną przyczyną tego było niemal ciągłe "mielenie" dysku twardego.

wynik ~3 min

 

 

Ostatni z testów wykonał kolega na swoim komputerze wyposażonym w procesor core2 3.0 ghz, 4 gb 800-4-4-4-12 pamięci, Geforce 8800gts 512mb, 128 shaderów, taktowanie odpowiednio 721, 1913, 1005

wynik ~25 sek</div>

 

Z góry dziękuję za przeprowadzone testy. Fanatycznych fanboyów danych podzespołów proszę o podawanie prawdziwych wyników :)

Edytowane przez Nargil

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

post-110226-1209462987_thumb.jpg

8800GT 600 1500 1800

 

35641

 

Przy 640 1600 1900

34297

 

Przy 660 1610 1920

33172

 

Przy 670 1620 1940

33031

 

EDIT

Przy 670 1700 1940

32750

 

680 1725 1850

32562

 

700 1700 1900

32422

 

700 1720 1900

32906 (SPADEK przy wyższych shaderach)

 

700 1500 1900

33938

Edytowane przez djsilence

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

CPU: E8200@3.5GHz

RAM: 2x1GB 875MHz 4-5-6-15

GPU: 9600GT SLI @ 700/1750/1900

 

Wynik: 46282 <_<

ciekawe czemu tak mało??

 

@EDIT:

CPU: E8200@3.5GHz

RAM: 2x1GB 875MHz 4-5-6-15

GPU: 9600GT @ 700/1750/1900

 

Wynik: 46266

Czyli SLI nie daje przyrostu wydajności??

Edytowane przez torque

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

torque: o ile dobrze kojarzę to można zmienić tryb pracy SLI. Standardowo renderuje klatkę w przód i takie coś nie ma najmniejszego wpływu na wydajność. Możesz ustawić dzielenie renderingu 1 klatki 50/50 (coś na wzór 2x voodoo2) ?

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Ali, czym Ty to chłodzisz ?! :)

Stock :lol2: Oczywiście sprawa ma się dokładnie jak piszę darkx, u mnie max stable to jakieś 740 na rdzeniu, a w tym progsie 828. Dodatkowo shader'y tutaj można kręcić pewnie do 2,5GHz, bo i tak nic nie robią :wink: pzdr

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Dziękuję wszystkim za testy. W szczególności tym od AMD i SLI.

 

Dodatkowo shader'y tutaj można kręcić pewnie do 2,5GHz, bo i tak nic nie robią :wink: pzdr

Nie wysuwaj tak pochopnych wniosków. Shadery odgrywają kluczową rolę w tym programie. Kod shadera w pętli sampluje 3 tekstury, mnoży dwie z nich, a następnie sumuje ich wartości. Uzależnienie czasu potrzebnego do tej operacji od gpu, a nie shaderów najprawdopodobniej wynika z tego, że samplowaniem zajmuje się gpu i to ono jest wąskim gardłem w aplikacji, przy którym mnożenie 2048 licz i sumowanie 4096 liczb w shaderach wydaje się nieistotne.

 

To NIE JEST benchmark ! To, że przepuszczane są tak wysokie takty wynika tylko z tego, że nie widzimy powstałych artefaktów. Gdyby dodać kontrolę uzyskanych wyników, można by to nazwać benchmarkiem. Może zrobię specjalnie dla was taki benchmark :>

 

Pozdrawiam ludzi dobrej woli :>

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Przepraszam za wprowadzenie w błąd :oops: Faktycznie shader'y liczą, ale ograniczeniem wydaję się reszta :unsure:

 

Pobawiłem się trochę i w sumie mogę powiedzieć, że program bardzo dziwnie się zachowuję. Działa pomimo tego, że system chodzi na granicy stabilności :blink: Przeszedł mi jeden cykl na taktach 830/2200/1050 i wynik

post-20691-1209654452_thumb.jpg

 

Shader'y na 2,2GHz no to w sumie nieźle i wydaję mi się, że nastąpił jakiś błąd w liczeniu dlatego taki wynik :wink: pzdr

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

@chemiczny_ali

To, że przepuszczane są tak wysokie takty wynika tylko z tego, że nie widzimy powstałych artefaktów. Gdyby dodać kontrolę uzyskanych wyników, można by to nazwać benchmarkiem.

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Ale co mi cytujesz? To, że program liczy i nie weryfikuje to wiem! Dlatego chodzi na ustawieniach niemożliwych do uzyskania w grach czy "benchach". Napisałem, że nastąpił błąd w liczeniu i powtórzenie tego wyniku jest niemożliwe! Poprawny wynik powinien wynosić ponad 21s. pzdr

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

na standardowych taktach

CPU Quad@3.6GHz RAM 960MHz /GPU 832/1070/2020

wynik 21`250

max stabilne takty CPU i GPU /ATiTool bez artefaktów

CPU Quad@4.0GHz RAM 960MHz /GPU 890/1123/2125

Dołączona grafika

wynik 19`969

ciekawostka - w trybie awaryjnym na standardowych taktach

Dołączona grafika

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Benchmark obsluguje 2 jajka ;)

wydaje ci się... Nie ma najmniejszego sensu implementowac >=2 wątków, gdyż całość jest obliczana na gpu. W momencie gdybym miał 2 gpu, mógłbym sie pobawić, by 2 wątki wystartowały 2 osobne konteksty opengl dla dwóch różnych kart. Wtedy można by wygodnie rozłożyć pracę na 2 karty.

 

Chociaż nadal przepuszcza bardzo niestabilne ustawienia gpu :)

Widać na tyle stabilne, do tak wąskiej dziedziny zastosowań. W 3D przecież dochodzą oświetlenia, cieniowania, translacje w vertex shaderze, mnozenia macierzy 4x4 za pomocą pojedynczej instrukcji (cos jak SSE w procesorach CPU), culling i depth-test i wiele innych.

Moja aplikacja praktycznie korzysta tylko z przesyłania danych RAM->VRAM, VRAM->RAM oraz dodawania i mnożenia liczb. Widocznie do tych zastosowań wysokie takty są stabilne.

 

To nigdy nie miało służyć do stressowania kart. Ten topic pomaga mi zmierzyć wydajność aplikacji na różnych konfiguracjach do sprawozdania. Ubenchmarkowienie aplikacji traktuję jako zabawę :]

Edytowane przez Nargil

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

@Nerevar marnie :wink: Chyba coś źle policzył ten programik :unsure:

 

No właśnie programik... Weryfikacja danych podniosła poprzeczkę, ale dalej przechodzą ciekawe takty :D U siebie rdzeń musiałem dać na 800MHz (w grach niestabilnie)i shader'y na 1890MHz (w grach w miarę stabilnie) za to memki poszły jak oszalałe, 1188 :mrgreen: Chyba nie muszę mówić jakie przy taktach 1,1GHz są krzaczory np. w TDU :lol: pzdr

 

Acha bym zapomniał, wynik:

post-20691-1209839945_thumb.jpg

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

U mnie to dopiero słabo wypadło :damage_wall: :oops:

Czas 41,9, a sprzęt to E6750@3,3 i 9600gt stock ale zauważyłem, że podkręcenie jej nic nie wnosi poprawy. Dziwne.

Najwyraznej 64 jednostki cieniujące sobie nie radzą :)

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Dołącz do dyskusji

Możesz dodać zawartość już teraz a zarejestrować się później. Jeśli posiadasz już konto, zaloguj się aby dodać zawartość za jego pomocą.

Gość
Dodaj odpowiedź do tematu...

×   Wklejono zawartość z formatowaniem.   Przywróć formatowanie

  Dozwolonych jest tylko 75 emoji.

×   Odnośnik został automatycznie osadzony.   Przywróć wyświetlanie jako odnośnik

×   Przywrócono poprzednią zawartość.   Wyczyść edytor

×   Nie możesz bezpośrednio wkleić grafiki. Dodaj lub załącz grafiki z adresu URL.

Ładowanie


×
×
  • Dodaj nową pozycję...