Skocz do zawartości
Saimek

Optymalizacja Seti Enhanced Pod Windowsa I Linuxa!

Rekomendowane odpowiedzi

Po krotkiej przerwie pojawily sie nowe optymalki 2.0 autorstwa KWSN - Chicken of Angnor.

 

Narazie zapodalem sse3 version na jednym z celeronkow 3.06GHz. Wynik ponizej:

CPU time 11014.53125

...

Optimizers: Ben Herndon, Josef Segur, Alex Kan, Simon Zadra

Version: Windows SSE3 32-bit 'Ni!' based on seti V5.15 'Chicken Good!'

Rev: (R-2.0|QxP|FFT:IPP_SSE3|Ben-Joe)

CPUID: 'Intel PD Celeron (Prescott)'

cpus: 1 cores: 1 threads: 1 cache: L1=16K L2=256K L3=0K

features: mmx sse sse2 sse3

speed: 3059 MHz -- read megs/sec: L1=11358, L2=7455, RAM=3201

...

</stderr_txt>

 

Jak widac fajne info z cpuid n/t procka. Ale to the point czyli skrocil sie czas liczenia czy nie?

Powyzsza probka jest z claimed = 60.82 - 11.014k.

Na optymalce Crunch3ra z ~ 12.800k (srednia z 5 obliczen).

 

Conclusion - oczywiscie wstepna jest taka ze probka na celku liczy sie pol godzinki szybciej, wiec calkiem sporo;).

W tej chwili zapuszczam na pentium M odpowiednia wersje i zobaczymy jak bedzie tutaj.

 

Zachecam do eksperymentow i podawania wynikow!

Edytowane przez Free'

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

P4 3.470GHz, 1MB cache, HT on, claimed - 62.39 = 12,529k --Chicken

P4 3.470GHz, 1MB cache, HT on, claimed - 62.39 = 16,021k --Crunch3r

Acceleration time ~ 1 godzina.

 

To co w sigu - claimed - 62.39 = 10,872k --Chicken

To co w sigu - claimed - 62.39 = 12,030k --Crunch3r

Acceleration time ~ 20 minut.

 

Zauwazylem, ze przy claimed mniejszym, nie jest juz tak rozowo. :angry:

Edytowane przez Free'

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

OK, dzięki Free, zapowiada się ciekawie :wink:. Zapodałem właśnie SSE3, niech przez nockę policzy i zobaczymy, ile nowe optymalki na C2D dają.

 

Profilaktycznie jutro po pół dnia będzie też liczone na SSE2 P4 oraz SSE2 PM - a nuż widelec któreś okaże się jeszcze skuteczniejsze...

 

Jakiś szybki Excel do porównań gotowy, zobaczymy...

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

OK, dzięki Free, zapowiada się ciekawie :wink:. Zapodałem właśnie SSE3, niech przez nockę policzy i zobaczymy, ile nowe optymalki na C2D dają.

Nie wiem czy na C2D cos daja. Wedlug tego watku raczej nie. Sprobuj moze tego.

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Nie wiem czy na C2D cos daja. Wedlug tego watku raczej nie. Sprobuj moze tego.

Dają, dają :wink:. Aktualnie jadę na uniwersalnym SSE3 dla P4/PD i już widać, że wyniki się poprawiły. Nie o tyle, ile u Was, ale zawsze to ciut szybciej - dokładne dane dam jak już się wszystko potestuje (niestety na razie same małe [ciach!]a pościągał). Oczywiście tego pod C2D też sprawdzę, dzięki!

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Holy Shit :o ;]

13,149.58 - 64.75 claimed - SSE3 by Crunch3r

9,546.55 - 64.75 - SSE2 by Chicken

 

Szybciej o 3,603 sekund czyli ~60 minut. Baaaardzo mi się podoba ta optymalka :twisted2:

 

To teraz co do mniejszych claimed to:

8,092.41 - 32.74 - SSE3 by Crunch3r

4,963.92 - 31.90 - SSE2 by Chicken

 

Zysk to 3129 sekund czyli ~52 minuty :mrgreen:

Edytowane przez Lanc

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

...i potestował :wink:

 

Sprawdzane na E6400 @ 3,0GHz. 2 wielkości próbek - średnia 25-35c. oraz duża ok. 65c; w ramach każdej wielkości wynik brany z 8 różnych próbek i uśredniany.

 

Poniżej podane są odpowiednio:

* Optymalizacja

* Czas pracy procesora na 1 otrzymany punkt prz próbce 30c

* Czas pracy procesora na 1 otrzymany punkt prz próbce 65c

* Łączny czas liczenia próbki 30c

* Łączny czas liczenia próbki 65c

 

Crunch3r SSE3 # 113,17sek. # 87,77sek. # 3396sek. # 5705sek.

Chicken SSE2 P4 # 113,52sek. # 79,27sek. # 3406sek. # 5152sek.

Chicken SSE3 PD # 113,88sek. # 79,52sek. # 3416sek. # 5169sek.

Chicken SSSE3 C2D # 151,4sek. # 111,25sek. # 4542sek. # 7232sek.

 

WNIOSKI:

Optymalizacje Chickena SSE2/SSE3 pod normalne Intele dają na C2D w porównaniu do SSE3 Crunch3ra przyspieszenie liczenia o ok. 10%. Niestety, jest ono zauważalne jedynie przy dużych próbkach - przy mniejszych czasy są identyczne. Tak czy inaczej - jak najbardziej warto zmienić; w moim przypadku minimalnie lepiej wypadła optymalka SSE2.

 

Natomiast radzę unikać podanej później optymalizacji pod C2D, bo to tragedia - zreszta widać po czasach liczenia. W porównaniu do "starych" SSE3 Crunch3ra wzrosły one o ok. 30%. Najwyraźniej coś sie chłopakom tutaj nie udało i muszą jeszcze poprawić.

 

Long story short, optymalny wybór na ten moment to SSE2/SSE3 by Chicken B-)

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

a do c2d jaka najlepsza no i do a64, bo w pracy tez bym podmienil ;]

kszonek => nowe bqi, nowe bqi a ja kuzwa nawet starego nei dostalem :/

mowilem pisz na gadu.....

 

podkuś sie ktos i zamiesc d ojakiego proca najlepsze optymalki, bo namieszane.... jezeli bedzie to dzisiaj zrobie nowe bqi bo mam chwilke (e6600 ie dotarl, wiec dodam sobie te 20kg lodu do cocacoli i bede pisal bqi :P )

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

optymalki 2.0 autorstwa KWSN - Chicken of Angnor. jak zainstalowac te aktualizacje ?? :( bo jakos nie moge ;(

"Copy all files in the "Files to install" directory to your BOINC\projects\setiathome.berkeley.edu folder.

There is a file called "app_info.xml" included that will make BOINC use this app automatically.

To use it, exit and re-open the BOINC Manager if you're running it in single-user mode, or re-start the service if you're using service mode.

That's it, you're done! You can open your task manager to see that it's really the new optimized app crunching your WUs.

BOINC will tell you that it found app_info.xml and is using an "anonymous platform".

"

 

Powyzej plik instructions.txt z paczki Chickena. Tylko nie mowcie ze nie wiecie jak...

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

wsadzilem te optymalki do siebie i jest poprawa nawet znaczna :D :

Crunch3r SSE3: 12,938.09 64.35

Chicken SSE 2: 8,751.67 64.86

wiec niezle zapie... na moim sempie :D

nawet sie nie przyznawaj, ze na sempie zapodales sse3...

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Kontynuacja dyskusji o optymalizacjach, żeby 2400225[/snapback]

ja bym dał tak :

=== KOMPUTERY STACJONARNE ===

Nie robilbym osobiscie podzialu na lapki i reszta, za duze zamieszanie.

Ja jednak będę raczej upierał się przy wydzieleniu laptopów. Może z punktu widzenia komputerów firmowych nie ma to aż takiego znaczenia, ale jesli chodzi o studentów, to sprawa zaczyna wyglądać troche inaczej. Po pierwsze, w moim akademiku w 5 najbliższych pokojach jest łącznie 6 stacjonarek i 7 lapów. Proporcje dają do myślenia. I nie jest to bynajmniej "wyjątkowy zakątek" - tak jest w całym akademiku. Po drugie, przeciętny lap jest maszyną sporo nowszą => wydajniejszą od stacjonarek. Więc mysle, że wydzielenie lapów jak najbardziej ma sens - szkoda byłoby tych zmarnowanych hostów ze złymi optymalkami, bo nie wiedzieli jakie wybrać...

 

 

 

Celeron D i P4 dobrze sobie radza na sse3 intel, czyli to samo co PD i CD, C2D.

=>

tyle, że nie wszystkie P4 mają SSE3 - na przykład Northwoody nie mają :/

willamette tez nie maja, ale czy ktos tutaj oprocz Saimka "siedzi na dziadkach" ? ;)

a czy BQI jest dla Saimka? To ma nam pomoc infekowac wszystkie komputery, przy ktorych bedziemy min 30s i nie wazne co za dziadek to bedzie ;)

Ja :) Mysle, ze ludzie maja P4 SSE2, a ze roznica chyba niewielka w wydajnoosci miedzy SSE2 i SSE3 (z tego co poczytalem...)

Podzieliłem własnie w taki sposób, aby uzyskać maksymalną kompatybilność. I tak jak koledzy powyżej napisali - ludzie z forum z mocnymi sprzętami raczej poradzą sobie z normalną instalacją i optymalizacją. BQI ma byc dla tych z zewnątrz - a tu, co tu dużo ukrywać, dominują maszyny sporo słabsze. I np. w przypadku takich Celofanów/P4 często przewijaja się egzemplarze bez obsługi SSE3. A różnica w wydajności SSE2/SSE3 jest zapewne tak mała (jeśli jest w ogóle), że jeden źle zoptymalizowany i w rezultacie nieliczący procek zje całe zyski.

 

 

 

Celeron M, P4M, Pentium M - tu sse2 mobile i sprawa zalatwiona.

Właśnie nie jestem do końca pewien, czy SSE2 Mobile będzie działać na Celeronie M i P4M - w instukcji było chyba, że jest ona przeznaczona wyłacznie dla Pentium M i Core Duo. Więc nie ma co ryzykować - ponownie szkoda potencjalnie zmarnowanych proców.

Edytowane przez LordFury

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Właśnie nie jestem do końca pewien, czy SSE2 Mobile będzie działać na Celeronie M i P4M - w instukcji było chyba, że jest ona przeznaczona wyłacznie dla Pentium M i Core Duo. Więc nie ma co ryzykować - ponownie szkoda potencjalnie zmarnowanych proców.

Ja za to jestem tego pewien, sprawdzone i dziala od tygodnia.

 

Pentium M max obsluzy sse2, sse3 nie przejdzie bo jadro ich nie obsluguje.

 

W dalszym ciagu nie widze potrzeby podzialu na lapki itd. lecz na procki, no ale jak tam chcecie...

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Ja za to jestem tego pewien, sprawdzone i dziala od tygodnia.

Pentium M max obsluzy sse2, sse3 nie przejdzie bo jadro ich nie obsluguje.

No chyba, że tak - już zmienione :wink:

 

W dalszym ciagu nie widze potrzeby podzialu na lapki itd. lecz na procki, no ale jak tam chcecie...

Wiesz, jak dla mnie to mogłaby zostać nawet taka prosta lista optymalizacji, jaka była w BQI do tej pory. Tylko weź pod uwage, że w większości przypadków będa to instalować osoby, które nie mają bladego pojęcia, jakie instrukcje obsługuje ich procesor. Ba, czesto nie wiedzą, jaki w ogóle mają procesor :lol:.

 

Dlatego jestem za tym, żeby pokazać im maksymalnie łopatologicznie, co dokładnie mają kliknąć. Zmniejszy to ryzyko zainstalowania złej optymalki i zmarnowania proca. Jeśli zobaczy takowy osobnik oddzielną kategorie "Laptopy" i skojarzy którąś z podanych nazw z naklejką na obudowie, jest szansa, że nie spieprzy sprawy.

 

Po prostu boje sie, że jeśli wszystkie proce będą razem, w jednej wspólnej kategorii, może się to okazać zbyt dużą ilością informacji do przetworzenia :wink:

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

No coz.... do roboty.....

 

Zrobie podzial na lapki, bo jednak trzeba zauwazyc ze jezli dajesz to komus to prtzynajmiej bedzie wiedzial co zaisntalowac, a nie jakies dziwne instrukcje. Jak sami bedziemy infekowac to przeciez dla p4 mozemy zainstalowac optymalke od amd :D bo czemu nie? jak sie tak podoba....

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Poczekać na pierwszą przeliczoną i odesłaną próbkę, wejść w jej właściwości i sprawdzić, czy masz tam coś w tym stylu:

<core_client_version>5.5.0</core_client_version>

<stderr_txt>

Optimized SETI@Home Enhanced application

 

Optimizers: Ben Herndon, Josef Segur, Alex Kan, Simon Zadra

Version: Windows SSE2 32-bit 'Ni!' based on seti V5.15 'Chicken Good!'

Rev: (R-2.0|QxN|FFT:IPP_SSE2|Ben-Joe)

CPUID: 'Intel C2D Core 2 Duo (Conroe 2M)'

cpus: 1 cores: 2 threads: 1 cache: L1=32K L2=2048K L3=0K

features: mmx sse sse2 sse3 ssse3

speed: 3003 MHz -- read megs/sec: L1=11207, L2=9707, RAM=6590

...

</stderr_txt>

Oczywiście procek i optymalizacja inne...

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

<core_client_version>5.5.0</core_client_version>

<stderr_txt>

Optimized SETI@Home Enhanced application

 

Optimizers: Ben Herndon, Josef Segur, Alex Kan, Simon Zadra

Version: Windows SSE3 32-bit 'Ni!' based on seti V5.15 'Chicken Good!'

Rev: (R-2.0|QxP|FFT:IPP_SSE3|Ben-Joe)

CPUID: 'Intel C2D Core 2 Duo (Conroe)'

cpus: 1 cores: 2 threads: 1 cache: L1=32K L2=4096K L3=0K

features: mmx sse sse2 sse3 ssse3

speed: 3644 MHz -- read megs/sec: L1=13604, L2=11633, RAM=6056

 

Work Unit Info

True angle range: 0.494604

 

Spikes Pulses Triplets Gaussians Flops

22 1 0 3 14519778631608

</stderr_txt>

u mnie to wyglada tak, a mam nadzieje ze po zwodowaniu bedzie nieco inaczej ;D

Jesli chodzi o czasy, to roznicy w claimed~62 roznicy nie widac a nawet jesli, to na niekorzysc nowej optymalki...

Czekam na cos dedykowanego C2D co bedzie dawalo wymierne korzysci, w koncu nie na darmo mamy ssse3 i i ntelowego kompilatora :D

pozdro dla calego teamu

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Czekam na cos dedykowanego C2D co bedzie dawalo wymierne korzysci, w koncu nie na darmo mamy ssse3 i i ntelowego kompilatora :D

Ja na Twoim miejscu korzystalbym z napisanych pod c2d optymalek (Lord cos tam sciemnial, ze sa wolniejsze od 2 ;) ).

Tutaj masz analogicznego procka (pare mhz szybszy od Twojego), wlasnie z takimi optymalkami.

Jak widac robi probki o wiele szybciej. Ma jeszcze zainstaloanego boincstudio, ale to nie ma znaczenia - programik, ktory kiedys pomagal poprzez korekcje, teraz mozna uzywac do zdalnego zarzadzania boinc'ami (juz sprawdzalem i nie wplywa w zaden sposob na szybkosc ani na przyznane credits).

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Ja na Twoim miejscu korzystalbym z napisanych pod c2d optymalek (Lord cos tam sciemnial, ze sa wolniejsze od 2 ;) ).

Tutaj masz analogicznego procka (pare mhz szybszy od Twojego), wlasnie z takimi optymalkami.

Jak widac robi probki o wiele szybciej. Ma jeszcze zainstaloanego boincstudio, ale to nie ma znaczenia - programik, ktory kiedys pomagal poprzez korekcje, teraz mozna uzywac do zdalnego zarzadzania boinc'ami (juz sprawdzalem i nie wplywa w zaden sposob na szybkosc ani na przyznane credits).

za czasow einsteina i jednostek S4 wykrecalem dzieki bionc studio 3x wiecej racu. Moj sempronik na 2,8ghz robil 250-300 dziennie a przy bioncstudio dobilem do 1001 i wtedy troche spadlem (chodzil mniej komp) oraz pojawilo sie seti i nasz team, no i skoczyly sie serie jedostek s4 :(

 

Ogolnie w tej chwili tylko seto jest takie fajne, bo zaden inny projekt nie ma optymalizacji, jest nuda w nich, a tutaj jescze mozna cos pokombinowac.

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach




×
×
  • Dodaj nową pozycję...