Nargil Opublikowano 28 Kwietnia 2008 Zgłoś Opublikowano 28 Kwietnia 2008 (edytowane) Tak jak obiecałem: oto zoptymalizowana wersja, która sprawdza co wyliczyła: benchmark zmiany: - sensowniejsze komunikaty co aktualnie program robi - weryfikacja danych - przyspieszenie programu - w związku z przyspieszeniem - program mnoży większe macierze, aby czas był +/- podobny do poprzedniej wersji. - w związku z gromadzeniem większych macierzy w pamięci - program potrzebuje więcej RAM'u. gdyby komuś wyskakiwał błąd o niepoprawnej konfiguracji komputera: http://www.microsoft.com/downloads/details...;displaylang=en <- są to pliki potrzebne by uruchomić programy skompilowane w MS Visual c++ 2008. Jeśli ktoś nie ma, to na pewno mu się przyda w przyszłości, aby uruchomić nowe gry i programy. Będę wdzięczny za test jak ma się czas działania programu do prędkości PCIe Proszę również ludzi z kartami ATI @SM4 lub SM3 o test. Spodziewam się, że bedą błędy mimo niekręconych kart. Proszę wówczas o wrzucenie screenów. Jeśli ktoś nie wie co oznacza zapis xxxx e+/-yyy xxxx to wartosc, ktora mnozymy *10 ^ (+/-)yyy np: 1.1000e002 oznacza liczbę 110.0, zaś 1.8000e-003 oznacza 0.0018 » Naciśnij aby pokazać/ukryć tekst oznaczony jako spoiler « - "Poprzednia wersja posta" Jako projekt na uczelnię napisałem aplikację, która mnoży 2 macierze używając do tego GPU. Obecnie jestem w fazie testowania prędkości działania (do sprawozdania). Tutaj pojawia się moja prośba do was o ściągnięcie aplikacji, a następnie napisanie tutaj na forum: - czasu działania (aplikacja wyświetla go pod sam koniec) - procesora i jego taktowania - ilosci, taktowania, timingów ram - karty graficznej [model, ilosc, taktowanie gpu, shader, mem] Program mnoży macierze o wymiarach 6000x4000 * 4000x5000. Przykładowo 1 jajku c2q @ 3.0 ghz zajmuje to ~13 minut. U mnie na gf 8800 gt jest to ~30 sekund download link: http://www.nargil.hostedwindows.pl/gpu.rar Z tego co się orientuję działa niepoprawnie na kartach ATI - niby liczy, ale wyniki są nieprawidłowe, gdyż shadery się w pewnym momencie przestają wykonywać, stąd wyższość ATI nad NV w tym teście o niczym nie świadczy gdyby komuś wyskakiwał błąd o niepoprawnej konfiguracji komputera: http://www.microsoft.com/downloads/details...;displaylang=en Najbardziej zależy mi na teście a) procesorów AMD, a w zasadzie zysku z powodu wbudowanego kontrolera pamięci, gdyż moc obliczeniowa CPU w tym programiku nie jest wykorzystywana. b) SLI gdyby kogoś interesowały wyniki testów, które udało mi się przeprowadzić do tej pory: <div class="spoilbody"> <div class="spoilheader" onMouseDown="java script:if(this.parentNode.getElementsByTagName('div')[1].style.display == 'none') this.parentNode.getElementsByTagName('div')[1].style.display = 'block'; else this.parentNode.getElementsByTagName('div')[1].style.display = 'none';"> » Naciśnij aby pokazać/ukryć tekst oznaczony jako spoiler « - "Testy"</div> <div class="spoilcontent" style="display:none;">Posiadany sprzęt testowy: Asus p5w64 deluxe @ fsb 400 mhz Core 2 duo e6300 @ 2.8 ghz 2gb geil ddr 800-4-4-4-12 palit geforce 8800 gt 512 mb 112 shaderów, 600 mhz gpu, 1500 mhz shader, 900 mhz vram wynik ~33 sek zmiana taktowania karty graficznej na odpowiednio 800, 2000, 1000 mhz wynik ~26 sek zmiana taktowania pamięci na 600-5-5-5-15, przy zachowaniu pierwotnego taktowania płyty i procesora poskutkowała nieznacznym pogorszeniem wyników. Dla standardowych taktowań karty graficznej: wynik ~36 sek Podkręcenie karty graficznej jak wyżej 800,2000,1000 mhz wynik ~27 sek Przywróciliśmy standardowe taktowanie pamęci ram 800-4-4-12, a następnie spowolniliśmy procesor do standardowych 1.86 ghz (fsb płyty 200 mhz). Taktowanie karty graficznej 600,1500,900 mhz wynik ~34 sek Podkręcenie karty graficznej jak wyżej 800,2000,1000 mhz wynik ~27 sek Pozbawiając komputer 2gb ram na rzecz 512mb tej samej prędkości uzyskany wynik był niezadowalająco niski. Główną przyczyną tego było niemal ciągłe "mielenie" dysku twardego. wynik ~3 min Ostatni z testów wykonał kolega na swoim komputerze wyposażonym w procesor core2 3.0 ghz, 4 gb 800-4-4-4-12 pamięci, Geforce 8800gts 512mb, 128 shaderów, taktowanie odpowiednio 721, 1913, 1005 wynik ~25 sek</div> Z góry dziękuję za przeprowadzone testy. Fanatycznych fanboyów danych podzespołów proszę o podawanie prawdziwych wyników :) Edytowane 1 Maja 2008 przez Nargil Cytuj Udostępnij tę odpowiedź Odnośnik do odpowiedzi Udostępnij na innych stronach Więcej opcji udostępniania...
djsilence Opublikowano 29 Kwietnia 2008 Zgłoś Opublikowano 29 Kwietnia 2008 (edytowane) 8800GT 600 1500 1800 35641 Przy 640 1600 1900 34297 Przy 660 1610 1920 33172 Przy 670 1620 1940 33031 EDIT Przy 670 1700 1940 32750 680 1725 1850 32562 700 1700 1900 32422 700 1720 1900 32906 (SPADEK przy wyższych shaderach) 700 1500 1900 33938 Edytowane 29 Kwietnia 2008 przez djsilence Cytuj Udostępnij tę odpowiedź Odnośnik do odpowiedzi Udostępnij na innych stronach Więcej opcji udostępniania...
blasphemy Opublikowano 29 Kwietnia 2008 Zgłoś Opublikowano 29 Kwietnia 2008 (edytowane) CPU: intel c2d e4300 @ 3150 MHz Ram: 2x1GB 700 MHz 4-4-4-12 GPU: 8800gt @ 670 / 1728 / 1890 Wynik: 29125 http://img124.imageshack.us/img124/3989/schowek01od8.jpg Edytowane 29 Kwietnia 2008 przez darkx Cytuj Udostępnij tę odpowiedź Odnośnik do odpowiedzi Udostępnij na innych stronach Więcej opcji udostępniania...
torque Opublikowano 29 Kwietnia 2008 Zgłoś Opublikowano 29 Kwietnia 2008 (edytowane) CPU: E8200@3.5GHz RAM: 2x1GB 875MHz 4-5-6-15 GPU: 9600GT SLI @ 700/1750/1900 Wynik: 46282 <_< ciekawe czemu tak mało?? @EDIT: CPU: E8200@3.5GHz RAM: 2x1GB 875MHz 4-5-6-15 GPU: 9600GT @ 700/1750/1900 Wynik: 46266 Czyli SLI nie daje przyrostu wydajności?? Edytowane 29 Kwietnia 2008 przez torque Cytuj Udostępnij tę odpowiedź Odnośnik do odpowiedzi Udostępnij na innych stronach Więcej opcji udostępniania...
Nargil Opublikowano 29 Kwietnia 2008 Zgłoś Opublikowano 29 Kwietnia 2008 torque: o ile dobrze kojarzę to można zmienić tryb pracy SLI. Standardowo renderuje klatkę w przód i takie coś nie ma najmniejszego wpływu na wydajność. Możesz ustawić dzielenie renderingu 1 klatki 50/50 (coś na wzór 2x voodoo2) ? Cytuj Udostępnij tę odpowiedź Odnośnik do odpowiedzi Udostępnij na innych stronach Więcej opcji udostępniania...
serwal4 Opublikowano 29 Kwietnia 2008 Zgłoś Opublikowano 29 Kwietnia 2008 PentiumE 2140 @ 2.66GHz (333MHz FSB) RAM: 2x 1GB 667MHz 5-5-5-15 8800GT Stock (600 1500 1800) wynik: 33,672 sec Cytuj Udostępnij tę odpowiedź Odnośnik do odpowiedzi Udostępnij na innych stronach Więcej opcji udostępniania...
torque Opublikowano 29 Kwietnia 2008 Zgłoś Opublikowano 29 Kwietnia 2008 Próbowałem teraz zmieniać tryby w sterownikach. Te co u góry były dla zalecanych ustawień. Gdy zmieniłem tryby SLI wynik spadał do ~50k. Cytuj Udostępnij tę odpowiedź Odnośnik do odpowiedzi Udostępnij na innych stronach Więcej opcji udostępniania...
chemiczny_ali Opublikowano 29 Kwietnia 2008 Zgłoś Opublikowano 29 Kwietnia 2008 Proc 3,2GHz, reszta nie kręcona wynik 27000. Po podkręceniu grafy na 756/1890/1053 wynik 23297 :wink: pzdr Cytuj Udostępnij tę odpowiedź Odnośnik do odpowiedzi Udostępnij na innych stronach Więcej opcji udostępniania...
djsilence Opublikowano 29 Kwietnia 2008 Zgłoś Opublikowano 29 Kwietnia 2008 Czyżby nowy benchmark PPC ? :D Cytuj Udostępnij tę odpowiedź Odnośnik do odpowiedzi Udostępnij na innych stronach Więcej opcji udostępniania...
xpektor Opublikowano 29 Kwietnia 2008 Zgłoś Opublikowano 29 Kwietnia 2008 28172 Sprzet jak w podpisie. Cytuj Udostępnij tę odpowiedź Odnośnik do odpowiedzi Udostępnij na innych stronach Więcej opcji udostępniania...
dred Opublikowano 29 Kwietnia 2008 Zgłoś Opublikowano 29 Kwietnia 2008 Sprzęt jak w podpisie a wynik to... 32563 . Zastanawia mnie co tak słabo ;) Cytuj Udostępnij tę odpowiedź Odnośnik do odpowiedzi Udostępnij na innych stronach Więcej opcji udostępniania...
chemiczny_ali Opublikowano 29 Kwietnia 2008 Zgłoś Opublikowano 29 Kwietnia 2008 Po kilku testach mogę stwierdzić, że poprawę wyniku przynosi tylko podkręcenie rop/tmu. Pamięci i shader'y nic nie dają :wink: Ostatni wynik (rdzeń na 828) to 21609 :wink: pzdr Cytuj Udostępnij tę odpowiedź Odnośnik do odpowiedzi Udostępnij na innych stronach Więcej opcji udostępniania...
blasphemy Opublikowano 29 Kwietnia 2008 Zgłoś Opublikowano 29 Kwietnia 2008 Sprzęt jak w podpisie a wynik to... 32563 . Zastanawia mnie co tak słabo ;) Karta @ stock, i wszystko jasne ;) Cytuj Udostępnij tę odpowiedź Odnośnik do odpowiedzi Udostępnij na innych stronach Więcej opcji udostępniania...
djsilence Opublikowano 29 Kwietnia 2008 Zgłoś Opublikowano 29 Kwietnia 2008 Ali, czym Ty to chłodzisz ?! :) Cytuj Udostępnij tę odpowiedź Odnośnik do odpowiedzi Udostępnij na innych stronach Więcej opcji udostępniania...
blasphemy Opublikowano 29 Kwietnia 2008 Zgłoś Opublikowano 29 Kwietnia 2008 Ten "benchmark" sie nie wykrzacza nawet przy taktowaniach mocno niestabilnych w innych okolicznosciach ;) U mnie max stable w crysis to 670 MHz na rdzeniu, a ten benchmark spokojnie hula na 730. Cytuj Udostępnij tę odpowiedź Odnośnik do odpowiedzi Udostępnij na innych stronach Więcej opcji udostępniania...
Gość Elviso26 Opublikowano 30 Kwietnia 2008 Zgłoś Opublikowano 30 Kwietnia 2008 (edytowane) 26957 wyniczek Edytowane 30 Kwietnia 2008 przez Elviso26 Cytuj Udostępnij tę odpowiedź Odnośnik do odpowiedzi Udostępnij na innych stronach Więcej opcji udostępniania...
chemiczny_ali Opublikowano 30 Kwietnia 2008 Zgłoś Opublikowano 30 Kwietnia 2008 Ali, czym Ty to chłodzisz ?! :)Stock :lol2: Oczywiście sprawa ma się dokładnie jak piszę darkx, u mnie max stable to jakieś 740 na rdzeniu, a w tym progsie 828. Dodatkowo shader'y tutaj można kręcić pewnie do 2,5GHz, bo i tak nic nie robią :wink: pzdr Cytuj Udostępnij tę odpowiedź Odnośnik do odpowiedzi Udostępnij na innych stronach Więcej opcji udostępniania...
Nargil Opublikowano 1 Maja 2008 Zgłoś Opublikowano 1 Maja 2008 Dziękuję wszystkim za testy. W szczególności tym od AMD i SLI. Dodatkowo shader'y tutaj można kręcić pewnie do 2,5GHz, bo i tak nic nie robią :wink: pzdr Nie wysuwaj tak pochopnych wniosków. Shadery odgrywają kluczową rolę w tym programie. Kod shadera w pętli sampluje 3 tekstury, mnoży dwie z nich, a następnie sumuje ich wartości. Uzależnienie czasu potrzebnego do tej operacji od gpu, a nie shaderów najprawdopodobniej wynika z tego, że samplowaniem zajmuje się gpu i to ono jest wąskim gardłem w aplikacji, przy którym mnożenie 2048 licz i sumowanie 4096 liczb w shaderach wydaje się nieistotne. To NIE JEST benchmark ! To, że przepuszczane są tak wysokie takty wynika tylko z tego, że nie widzimy powstałych artefaktów. Gdyby dodać kontrolę uzyskanych wyników, można by to nazwać benchmarkiem. Może zrobię specjalnie dla was taki benchmark :> Pozdrawiam ludzi dobrej woli :> Cytuj Udostępnij tę odpowiedź Odnośnik do odpowiedzi Udostępnij na innych stronach Więcej opcji udostępniania...
chemiczny_ali Opublikowano 1 Maja 2008 Zgłoś Opublikowano 1 Maja 2008 Przepraszam za wprowadzenie w błąd :oops: Faktycznie shader'y liczą, ale ograniczeniem wydaję się reszta :unsure: Pobawiłem się trochę i w sumie mogę powiedzieć, że program bardzo dziwnie się zachowuję. Działa pomimo tego, że system chodzi na granicy stabilności :blink: Przeszedł mi jeden cykl na taktach 830/2200/1050 i wynik Shader'y na 2,2GHz no to w sumie nieźle i wydaję mi się, że nastąpił jakiś błąd w liczeniu dlatego taki wynik :wink: pzdr Cytuj Udostępnij tę odpowiedź Odnośnik do odpowiedzi Udostępnij na innych stronach Więcej opcji udostępniania...
KrOOliK89 Opublikowano 1 Maja 2008 Zgłoś Opublikowano 1 Maja 2008 @chemiczny_ali To, że przepuszczane są tak wysokie takty wynika tylko z tego, że nie widzimy powstałych artefaktów. Gdyby dodać kontrolę uzyskanych wyników, można by to nazwać benchmarkiem. Cytuj Udostępnij tę odpowiedź Odnośnik do odpowiedzi Udostępnij na innych stronach Więcej opcji udostępniania...
chemiczny_ali Opublikowano 1 Maja 2008 Zgłoś Opublikowano 1 Maja 2008 Ale co mi cytujesz? To, że program liczy i nie weryfikuje to wiem! Dlatego chodzi na ustawieniach niemożliwych do uzyskania w grach czy "benchach". Napisałem, że nastąpił błąd w liczeniu i powtórzenie tego wyniku jest niemożliwe! Poprawny wynik powinien wynosić ponad 21s. pzdr Cytuj Udostępnij tę odpowiedź Odnośnik do odpowiedzi Udostępnij na innych stronach Więcej opcji udostępniania...
KrOOliK89 Opublikowano 1 Maja 2008 Zgłoś Opublikowano 1 Maja 2008 Wybacz, zrozumiałem Twój post jakbyś się dziwił, że na takich taktach przechodzi;P Cytuj Udostępnij tę odpowiedź Odnośnik do odpowiedzi Udostępnij na innych stronach Więcej opcji udostępniania...
lama1 Opublikowano 1 Maja 2008 Zgłoś Opublikowano 1 Maja 2008 na standardowych taktach CPU Quad@3.6GHz RAM 960MHz /GPU 832/1070/2020 wynik 21`250 max stabilne takty CPU i GPU /ATiTool bez artefaktów CPU Quad@4.0GHz RAM 960MHz /GPU 890/1123/2125 wynik 19`969 ciekawostka - w trybie awaryjnym na standardowych taktach Cytuj Udostępnij tę odpowiedź Odnośnik do odpowiedzi Udostępnij na innych stronach Więcej opcji udostępniania...
Nargil Opublikowano 1 Maja 2008 Zgłoś Opublikowano 1 Maja 2008 Benchmark dostępny w pierwszym poscie. Cytuj Udostępnij tę odpowiedź Odnośnik do odpowiedzi Udostępnij na innych stronach Więcej opcji udostępniania...
blasphemy Opublikowano 1 Maja 2008 Zgłoś Opublikowano 1 Maja 2008 Benchmark obsluguje 2 jajka ;) Bardzo fajna sprawa. Chociaż nadal przepuszcza bardzo niestabilne ustawienia gpu :) Cytuj Udostępnij tę odpowiedź Odnośnik do odpowiedzi Udostępnij na innych stronach Więcej opcji udostępniania...
Nargil Opublikowano 1 Maja 2008 Zgłoś Opublikowano 1 Maja 2008 (edytowane) Benchmark obsluguje 2 jajka ;) wydaje ci się... Nie ma najmniejszego sensu implementowac >=2 wątków, gdyż całość jest obliczana na gpu. W momencie gdybym miał 2 gpu, mógłbym sie pobawić, by 2 wątki wystartowały 2 osobne konteksty opengl dla dwóch różnych kart. Wtedy można by wygodnie rozłożyć pracę na 2 karty. Chociaż nadal przepuszcza bardzo niestabilne ustawienia gpu :) Widać na tyle stabilne, do tak wąskiej dziedziny zastosowań. W 3D przecież dochodzą oświetlenia, cieniowania, translacje w vertex shaderze, mnozenia macierzy 4x4 za pomocą pojedynczej instrukcji (cos jak SSE w procesorach CPU), culling i depth-test i wiele innych. Moja aplikacja praktycznie korzysta tylko z przesyłania danych RAM->VRAM, VRAM->RAM oraz dodawania i mnożenia liczb. Widocznie do tych zastosowań wysokie takty są stabilne. To nigdy nie miało służyć do stressowania kart. Ten topic pomaga mi zmierzyć wydajność aplikacji na różnych konfiguracjach do sprawozdania. Ubenchmarkowienie aplikacji traktuję jako zabawę :] Edytowane 1 Maja 2008 przez Nargil Cytuj Udostępnij tę odpowiedź Odnośnik do odpowiedzi Udostępnij na innych stronach Więcej opcji udostępniania...
Nerevar Opublikowano 3 Maja 2008 Zgłoś Opublikowano 3 Maja 2008 U mnie tyle - sprzęt z podpisu, karta @stock. Cytuj Udostępnij tę odpowiedź Odnośnik do odpowiedzi Udostępnij na innych stronach Więcej opcji udostępniania...
chemiczny_ali Opublikowano 3 Maja 2008 Zgłoś Opublikowano 3 Maja 2008 @Nerevar marnie :wink: Chyba coś źle policzył ten programik :unsure: No właśnie programik... Weryfikacja danych podniosła poprzeczkę, ale dalej przechodzą ciekawe takty :D U siebie rdzeń musiałem dać na 800MHz (w grach niestabilnie)i shader'y na 1890MHz (w grach w miarę stabilnie) za to memki poszły jak oszalałe, 1188 :mrgreen: Chyba nie muszę mówić jakie przy taktach 1,1GHz są krzaczory np. w TDU :lol: pzdr Acha bym zapomniał, wynik: Cytuj Udostępnij tę odpowiedź Odnośnik do odpowiedzi Udostępnij na innych stronach Więcej opcji udostępniania...
Gavik Opublikowano 3 Maja 2008 Zgłoś Opublikowano 3 Maja 2008 U mnie to dopiero słabo wypadło :oops: Czas 41,9, a sprzęt to E6750@3,3 i 9600gt stock ale zauważyłem, że podkręcenie jej nic nie wnosi poprawy. Dziwne. Cytuj Udostępnij tę odpowiedź Odnośnik do odpowiedzi Udostępnij na innych stronach Więcej opcji udostępniania...
blasphemy Opublikowano 3 Maja 2008 Zgłoś Opublikowano 3 Maja 2008 U mnie to dopiero słabo wypadło :oops: Czas 41,9, a sprzęt to E6750@3,3 i 9600gt stock ale zauważyłem, że podkręcenie jej nic nie wnosi poprawy. Dziwne. Najwyraznej 64 jednostki cieniujące sobie nie radzą :) Cytuj Udostępnij tę odpowiedź Odnośnik do odpowiedzi Udostępnij na innych stronach Więcej opcji udostępniania...