Skocz do zawartości
Saimek

Optymalizacja Seti Enhanced Pod Windowsa I Linuxa!

Rekomendowane odpowiedzi

Free wcale nie tak szybko - mój wynik na 3.0G i SSE3

 

http://setiathome.berkeley.edu/result.php?resultid=420094222

 

edit.

 

ok jestem po testach tej optymki dla c2d - jest gorzej niż na SSe3 :|

 

identyczne próbki - WU Angle 0.4277777

 

SSSE3 - 5611s, 5389s, 5638s

SSE3 - 4583s, 4479s, 4628s

 

chyba całkiem niezłe czasy jak na C2D@3.0G :P

Edytowane przez Raptor

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

ok jestem po testach tej optymki dla c2d - jest gorzej niż na SSe3 :|

...Lord cos tam sciemnial, ze sa wolniejsze od 2 ;)...

:twisted: :twisted: :twisted:

 

 

Powtórze profilaktycznie moje wyniki:

Poniżej podane są odpowiednio:

* Optymalizacja

* Czas pracy procesora na 1 otrzymany punkt przy próbce 30c

* Czas pracy procesora na 1 otrzymany punkt przy próbce 65c

* Łączny czas liczenia próbki 30c

* Łączny czas liczenia próbki 65c

 

Crunch3r SSE3 # 113,17sek. # 87,77sek. # 3396sek. # 5705sek.

Chicken SSE2 P4 # 113,52sek. # 79,27sek. # 3406sek. # 5152sek.

Chicken SSE3 PD # 113,88sek. # 79,52sek. # 3416sek. # 5169sek.

Chicken SSSE3 C2D # 151,4sek. # 111,25sek. # 4542sek. # 7232sek.

Jeszcze dla pełnej wiadomości - każdy czas uśredniany z 8 próbek obu wielkości na danej optymalizacji (dlatego trochę to trwało - musiały się odpowiednie nazbierać)

 

Może ta optymalizacja pod SSSE3/SSE4 (jak zwał, tak zwał) tylko pod 6600/6700 daje kopa?

A na 2MB Allendale głupieje...?

 

 

@Raptor

Kurde, faktycznie te czasy ładne... Pochwal się, co tam jeszcze za tajne tricki stosujesz :wink:

Edytowane przez LordFury

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

identyczne próbki - WU Angle 0.4277777

 

SSSE3 - 2403916[/snapback]

trików żadnych nie ma - procek śmiga tymczasowo na 433x7 i pamiątki tylko na 433- trików to będe potrzebował żeby ustabilizować proca @3.4-3.5G na AC :P
Heh, chyba że masz naprawdę niezłą sztukę i mało prądu będzie chciała :wink:. Wczoraj dostałem maila ze sklepu, że mają wreszcie na miejscu złączki do CWU dokładnie te, które chciałem, więc w tym tygodniu pewnie powrót do WC...

 

 

=========

 

EDIT:

 

Kolejne potwierdzenie, że nowe optymalizacje dają kopa - Sempron 3000 s.939 @ 2,25GHz

Crunch3r SSE3: 17,212.73@62.56, 17,159.38@64.36

Chicken SSE2: 10,805.86@60.68, 11,141.89@60.65

 

Różnica jak najbardziej zauważalna, więc kto jeszcze nie zmienił optymalek na swoim A64/S64 - do roboty! :wink:

Edytowane przez LordFury

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

UWAGA! Do wszystkich z teamu ktorzy pod windowsem nie maja jescze optymalek:

(....)

Ok, ściągnąłem to i zainstalowałem tą optymalke.

Powiedzcie mi tylko czy mogę jakoś sprawdzić czy ona działa i o ile mi przyśpiesza liczenie ? [;

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Ok, ściągnąłem to i zainstalowałem tą optymalke.

Powiedzcie mi tylko czy mogę jakoś sprawdzić czy ona działa i o ile mi przyśpiesza liczenie ? [;

Najpierw zrób jedną rzecz - zmerguj Twoje kompy, bo masz tego obecnego w sygnaturze dodanego trzy razy na liście:

1. Wejdź tutaj

2. Klikni numer jednego z kompów zupełnie po lewej

3. Na samym dole strony będzie opcja "Merge computer"

4. Wybierz, z którym ma połaczyć (bez znaczenia) i OK/Merge

5. Powtórz jeszcze raz cała procedurę - zostanie Ci jeden aktywny komp

 

Żeby zobaczyć, czy optymalka jest dobrze wgrana, musisz niestety chwilę poczekać - do momentu, kiedy przeliczy na niej i odeśle jakieś próbki. Wówczas gdy wejdziesz na stronę podaną powyżej kliknij liczbę w kolumnie "Results", a następnie "Result ID" (po lewej) przy przeliczonej próbce. Jeżeli teraz opis będzie zawierał częśc podobną do tej poniżej, to wszystko jest ok:

<core_client_version>5.5.0</core_client_version>

<stderr_txt>

Optimized SETI@Home Enhanced application

Optimizers: Ben Herndon, Josef Segur, Alex Kan, Simon Zadra

Version: Windows SSE3-P4/PD 32-bit based on S@H V5.15 'Noo? No - Ni!'

Revision: R-2.2B|xP|FFT:IPP_SSE3|Ben-Joe

CPUID: Intel Pentium D 'Smithfield'

CPUs: 1, cores: 2, threads: 1 cache: L1=16K, L2=1024K, L3=0K

Features: MMX, SSE, SSE2, SSE3,

speed: 3800 MHz -- read MB/s: L1=14225, L2=9222, RAM=6269

</stderr_txt>

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

LordFury, wielkie dzięki ^^.

A więc ja mam coś takiego:

<core_client_version>5.8.15</core_client_version>

<![CDATA[

<stderr_txt>

Optimized Windows SETI@Home Enhanced application

Version info: Windows P4 SSE2 32-bit V5.15 'Chicken Good!' (R-1.3|+freq|xN)

Compiled by Simon Zadra (KWSN - Chicken of Angnor) - Member of the Knights who say Ni! (http://www.kwsn.net)

Download Updates at: http://www.zadra.org/seti_enhanced/

 

CPU real speed: 2599 MHz

 

Work Unit Info

True angle range: 7.541742

Optimized Windows SETI@Home Enhanced application

Version info: Windows P4 SSE2 32-bit V5.15 'Chicken Good!' (R-1.3|+freq|xN)

Compiled by Simon Zadra (KWSN - Chicken of Angnor) - Member of the Knights who say Ni! (http://www.kwsn.net)

Download Updates at: http://www.zadra.org/seti_enhanced/

 

CPU real speed: 2600 MHz

 

Work Unit Info

True angle range: 7.541742

 

Flopcounter: 3227970158013.454100

 

Spike count: 0

Pulse count: 0

Triplet count: 2

Gaussian count: 0

</stderr_txt>

]]>

Powiedzcie czy ta optymalizacja jest dobra czy są jeszcze lepsze ;) .

 

Aha, po zainstalowaniu tej optymalki nie mogę wyświetlić tego ekranu 3D, czy jest jakiś sposób aby znowu go włączyć ? [;

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Version info: Windows P4 SSE2 32-bit V5.15 'Chicken Good!' (R-1.3|+freq|xN)

Uuuu, to jest chlernie stara wersja. W zasadzie pierwsza w wydaniu tych gości i była ona niestety kiepska - obecne sa dużo, duuużo wydajniejsze.

 

Dla Twojego kompa w tej chwili najlepsze będą te:

* SSE2-Intel P4 with graphics rev. 2.2A - jeśli chcesz mieć ten panel z wykresami i wygaszacz

* SSE2-Intel P4 without graphics rev. 2.2B - odrobinę nowsza (pewnie minimalnie wydajniejsza), bez tych kororowych dupereli :wink:

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

No to zaczynam liczyć pełną parą :D .

To jeszcze puść tego P4 na 3,6GHz+ i będzie w ogóle cacy :wink:

 

Edit:

I jeszcze jedna sprawa - masz strasznie mało próbek na tym kompie - ustaw sobie, żeby pobierał zapas na kilka dni. Wtedy w razie braku netu przez jakis czas albo gdy seti chwiliwo padnie będziesz miał co liczyć.

Klik -> General preferences -> Edit preferences -> Connect to network about every -> i tam daj np. 5 dni. I przy okazji upewnij się, czy masz wybrane: Do work while computer is in use? = yes i On multiprocessors, use at most = 2 processors (jeśli masz P4 z HT)

Edytowane przez LordFury

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Ta 'optymalizacja' chyba nie jest 'optymalizacja tylko zwyklym oszustwem' !!!

 

Zadajcie sobie pytanie: Czy to jest możliwe, aby to chodziło aż tak szybko z porównaniem do oryginału ?!

 

No, właśnie.

 

To czy ktoś będzie oszukiwał czy nie to sprawa jego własnego sumienia.

 

 

------------------------------------------------------------------------------------------------

 

Ile z Was z tego korzysta licząc dla PCPure? - to chyba powinno sie znaleźć w nowym temacie.

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Ta 'optymalizacja' chyba nie jest 'optymalizacja tylko zwyklym oszustwem' !!!

 

Zadajcie sobie pytanie: Czy to jest możliwe, aby to chodziło aż tak szybko z porównaniem do oryginału ?!

 

No, właśnie.

 

To czy ktoś będzie oszukiwał czy nie to sprawa jego własnego sumienia.

Oszustwem? Jakim oszustwem, chyba już dawno nie jesteś na bieżąco odnośnie optymalizacji - tu już nie czasy starego SETI i początki na platformie boinc, gdzie manipulowane były dane o próbkach, żeby zawyżać wyniki.

 

To są faktyczne _optymalizacje_, które skracają czas liczenia dzięki wykorzystaniu dodatkowych instrukcji (działań matematycznych, mówiąc najprościej), zaimplementowanych w kolejne serie procesorów. Standardowy klient BOINC, żeby być kompatybilnym ze wszystkimi możliwymi procesorami, może używać tylko tych naprawdę najprostszych z najprostszych. Optymalizacja jest po prostu narzędziem, które pozwala procesorowi liczyć tak, jak może (bez ograniczeń co do działań = specjalizacja pod dany procesor). A że stopień skomplikowania kalkulacji matematycznych jest tu ogromny, to bardziej zaawansowane instrukcje potrafią czynić cuda.

 

 

Najbardziej obrazowy przykład: masz wielki sześcian złożony z mniejszych sześcianów, po 10 wzdłuż każdej krawędzi. Jak policzyc, z ilu się składa?

* podstawowy klient boinc potrafi tylko dodawać i odejmować (żeby działać na wszystkich procesorach), dlatego jedzie: 1+1+1+1+...+1=1000 i musi wykonać 1000 operacji by to policzyć (kupa czasu)

* jakaś wersja optymalizacji dla nowszych procesorów pozwala im wykorzystać mnożenie i dzielenie, więc mamy już tylko: 10*10*10=1000 (2 operacje)

* jeszcze nowsza wersja dla jeszcze nowszych procesorów potrafi potęgować i pierwiastkować: 10^3=10 (wystarczy 1 operacja).

Widzisz już, o co chodzi? Optymalizacje pozwalają po prostu procesorom rozwinąć skrzydła. A różnice potrafią być po prostu kolosalne.

 

Albo inny przykład: Ty jesteś klientem boinc i masz do policzenia skomplikowane zadanie. W podstawowej wersji nie masz nic, liczysz na placach i trwa to rok. Przy lekkiej optymalizacji dostajesz kalkulator, liczysz miesiąc. Przy pełnej optymalizacji dostajesz kompa z Excelem - dwie minuty i po sprawie. Comprende?

 

 

Już zupełnie technicznie, co do samych procesorów i obsługiwanych przez nie instrukcji:

* podstawowy klient boinc korzysta tylko z podstawowych instrukcji matematycznych obsługiwanych przez każdy procesor; ale z biegiem czasu pojawiły się w kolejnych seriach procesorów coraz to nowsze zestawy działań

* MMX - 57 nowych instrukcji

* 3DNow! - kolejne 21 instrukcji

* SSE - kolejny pakiet, nie wiem dokładnie ile

* SSE2 - 144 nowe instrukcje

* SSE3 - 14 nowych poleceń

* SSSE3/SSE4 - 16 nowych instrukcji

Traktuj instrukcje jako mozliwe do wykonania przez procesor działania matematyczne i ich zestawy.

 

 

Zresztą było to już po prostu mierzone, jak długo fizycznie liczona jest próbka o konkretnym True Angle i wartości punktowej przez konkretne procesory i na konkretnych optymalizacjach. Skoro są fizyczne róznice w czasie liczenia, to raczej logiczne, że wydajność rośnie, nie? To tak ku pamięci i na przyszłość najpierw sugeruję zapoznać się z zasadami i sposobem działania konkretnego programu (w tym przypadku optymalizacji), a nie powtarzać zasłyszane archaizmy...

 

Jesli wiesz, że optymalizacje po prostu, jak twierdzisz, oszukują, to podziel się z nami maluczkimi swoją wiedzą i wyjaśnij, w jaki sposób to robią, a nie rzucasz typowo "od czapy" niepotwierdzone żadnym logicznym uzasadnieniem oskarżenia. Trochę powagi!

Edytowane przez LordFury

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

A jak myślisz po co udostepnione są kody źródłowe. Po to by robić optymalizacje. Sam możesz zrobić, żeby liczyło szybciej. Nawet zacząłem sie w to bawić. (póki co bez większych sukcesów). Zabezpieczylili sie przed oszustwami tym, że jedna próbka jest liczona przez cztery kompy. Trzy muszą dać identyczny wynik żeby było zaliczone. Spróbuj zrobić oszukaną optymalizacje i zobaczysz co ci to da. Będzie ci odrzucać przeliczone próbki i zero kredytów dostaniesz.

Prędzej uwierzę w wątpliwości czy naprawdę liczymy to co myślimy że liczymy niż w to że optymalizacje oszukują.

 

Swoją drogą nigdy nie miałeś do czynienia widzę z żadnymi formami optymalizacji. Nie wiem czy jesteś studentem i miałeś do czynienia z programem Matlab. Jak tak to zrób tam coś takiego napisz programik do mnożenia dwu macierzy 1000 elementowych za pomocą pętli for i zrób za pomocą funkcji mnożenia macieżowego. Zapewniam, że różnica będzie nie kilku krotna w czasie ale kilkaset razy chociaż oba programiki dadzą ten sam wynik. Drugi z nich będzie tym zoptymalizowanym.

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Nie wiem czy jesteś studentem i miałeś do czynienia z programem Matlab. Jak tak to zrób tam coś takiego napisz programik do mnożenia dwu macierzy 1000 elementowych za pomocą pętli for i zrób za pomocą funkcji mnożenia macieżowego. Zapewniam, że różnica będzie nie kilku krotna w czasie ale kilkaset razy chociaż oba programiki dadzą ten sam wynik. Drugi z nich będzie tym zoptymalizowanym.

Profilaktycznie właśnie dlatego w moim tłumaczeniu dawałem przykłady, które przekonają nawet przeciętnego ucznia szkoły podstawowej...

"+ i - => * i / => ^ i sqrt" oraz druga wersja "palce => kalkulator => komputer" :lol2:

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Ta 'optymalizacja' chyba nie jest 'optymalizacja tylko zwyklym oszustwem' !!!

Zadajcie sobie pytanie: Czy to jest możliwe, aby to chodziło aż tak szybko z porównaniem do oryginału ?!

No, właśnie.

To czy ktoś będzie oszukiwał czy nie to sprawa jego własnego sumienia.

------------------------------------------------------------------------------------------------

Ile z Was z tego korzysta licząc dla PCPure? - to chyba powinno sie znaleźć w nowym temacie.

z jakiego jestes teamu?

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Optymalizacje Chickena i reszty pod Linuxa w ver. 2.2B, testuje od 5:00 ;). Potezna roznica...

No, to sie parę osób ucieszy :). A różnica pewnie taka jak między pierwotnymi, słabymi KWSN 1.3 (słabszymi od starego Cruch3ra sse2/3), a nowymi 2.2 pod Windowsem, czyli kosmiczna. Instalować, koledzy, 15-20% szybsze liczenie piechodzą nie chodzi :lol2:

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Chicken 'wypuscil' update optymalek 2.2b pod linuksa - z poprzednimi jakies problemy byly. Zalecana zmiana pod okreslone jajo (po rozpakowaniu mozna wybrac 2.4 lub 2.6), ze wzgledu na mozliwe bledy obliczen, a przez to niepotrzebna strate pkcikow.

 

Link do nich ten sam jak dwa posty wyzej - mam tez w sigu.

Edytowane przez Free'

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Jaka jest najlepsza optymalizacja dla seti pod widowsa xp sp2 z Athlonem A64 3800+ s.939.

Zastanawiam sie jaka mam wgrac na drugi komp ,bo te optymalki co mialem pod c2d nie chca sie wogole odpalic pod a64.

Prosilbym o jakiegos linka ze sparwdzonym programem dla tej platformy i jakas krotka instrukcje.

Dzieki.

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Dolanczam po dlugiej przerwie do zabawy

 

poki nie odpale WC na C2D bede wspieral technologie AM2+ :D

checkne roznice pomiedzy oryginalnym Boinc a AK V8 for AMD :D

 

pozdro

 

 

 

EDIT

moze ktos zdradzic gdzie mieszcza sie probki do obliczenia w najnowszym Managarze Boinc ??

za hiny nie moge znalesc...

 

EDyt2

Roznica pomiedzy optymalka jest przeogromna....2h liczenia z nowego boinca kontra 0.5 h !!! na tym samym taktowaniu 4.6ghz :D

instrukcje sse4.1 pewnie tez cos daja, bo na 65nm na 3.4GHz liczy az 50 minut - nie chc emi sie wierzyc ze jest az tak wielka roznica w liczeniu.

Edytowane przez Zulusman

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Aye Aye.

Zaczynam od dzisiaj liczyć SETI i tu mam kilka pytań.

Wrzuciłem Windows 32 bit AK v8.0 SSSE3x, niby coś miało się pojawić po włączeniu, ale nic takiego nie było. Jak sprawdzić czy ta optymalka działa?

I czy nie lepiej wrzucić dla 4.1?

 

Długo się czeka na zweryfikowanie wysłanych próbek? Bo na razie na stronie mam wszystko IN PROGRESS

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Powinno sie pojawic "Found app_info.xml; using anonymous platform" po uruchomieniu w zakladce wiadomosci. Jesli masz zainstalowanego boinca jako serwis to musisz zrestartowac ten serwis, samo zamkniecie boinc managera nie spowoduje wczytania pliku xml.

Innym sposobem sprawdzenia czy dziala optymalizacja jest spojrzenie jaki proces obciaza procesor, jesli jest to ten plik exe, ktory wrzuciles do folderu projects/setiathome.berkeley.edu (AK_v8_win_SSE3.exe) to jest OK.

 

Wrzuc optymalizacje dla SSE4.1 skoro Twoj procesor to obsluguje, powinno sie szybciej liczyc.

 

Jesli masz status "in progress" to znaczy, ze probka jest nie odeslana albo odeslana, ale nie zraportowana. Boinc raportuje odeslane zadania przy prosbie o nastepne. Jak chcesz wymusic raportowanie to kliknij Projekty -> Zaktualizuj projekt.

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Właśnie miałem kasować tamtego posta, bo już wszystko wiem.

Tak to jest jak człowiek dobrze patrzeć nie potrafi ;)

Wrzuciłem też SSE4.1 i ustawiłem na 2 jajka.

W każdym razie dzięki :)

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach




×
×
  • Dodaj nową pozycję...