Skocz do zawartości
specdriver

Qnap TS-231 losowe restarty

Rekomendowane odpowiedzi

Witam,

 

w kwietniu 2015 zakupiłem serwer QNAP TS-231. Chodził od tamtej pory bez zarzutu. Pod koniec roku pojawiły się restarty, kompletnie losowe, nieważne czy coś było robione czy nie (oglądanie filmów, odczyt/zapis plików). Pomyślałem, żeby postawić system od nowa bo miałem kopie więc to nie był problem. Nie pomogło.

Pomyśłalem, że to dyski, ale je wykluczyłem stawiając system na nowych dyskach i używanych. NA wszystkich zachowywał się tak samo czyli restarty. Stawiałem jako pojedyńcze dyski jak i RAID aby wykluczyć wszystkie opcje. Nic nie pomagało.

Zgłosiłem więc reklamacje do eMAG(byłe Agito) 9 stycznia. Paczka została odebrana 20 stycznia (wysłałem trochę później , bo z kurierem się minąłem).

Wszystko w zgłoszeniu opisałem tak jak wyżej.

Wczoraj otrzymałem informację, że zgłoszenie zmieniło status na "Wada nie wykryta". Oczywiście serwer już dzisiaj do mnie wraca przy którym nic nie zrobiono.

Aby wykluczyć inne możliwości (złe prądy ;) i takie tam) Pożyczyłem od kolegi inny serwer tej samej firmy)

NA tych samych dyskach nie ma żadnego problemu ani restartu od 2tygodni, czyli ewidentnie IMO problem leży po stronie QNAP TS-231.

 

Teraz pytanie co w tym temacie można zrobić? Jak widać eMag umywa rączki i nie może wykryć wady (ciekawe czy coś sprawdzali czy tylko podłączyli na 1h i stwierdzili, że ok).

 

Mam odebrać paczkę dzisiaj czy odmówić przyjęcia?

Co można dalej zrobić? Rzecznik?

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Właśnie o to chodzi, że sam spędziłem nad tym z 2 tygodnie i nie znalazłem powtarzalnej sytuacji, czasem podczas kopiowania pliku, czasem podczas oglądania filmu na TV z serwera a czasem budził mnie dźwięk uruchamiania serwera w nocy jak zaliczył restart i tak to opisałem. Nie jestem specjalistą aby móc coś więcej zrobić jeśli sami nie napiszą co mogę zrobić aby im ułatwić diagnozę. Wystarczy żeby z 8-10h pochodził serwer na serwisie lub skopiowali kilka plików większych i powinno za którymś razem się zrestartować.

Sam siedzę w reklamacjach i jeśli jest losowa usterka to nadal jest usterka i nie wysyła się tego do klienta tylko ewentualnie zadaje pytania. Tutaj nie było żadnych pytań ani kontaktu przez 2 tygodnie.

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Rozumiem, że jesteś pewien tego gniazdka 230V? Nie wystarczy sprawdzić multimetrem czy jest w danej chwili 230V. Najprościej podłączyć lapka/komp bez baterii do tego gniazdka, ustawiając w bios, że po restarcie nie włączaj. Choć to też nie jest do końca pewny test, bo zasilacze mają pewną pojemność, wyłączenie na krótki czas napięcia (milisekundy), na jednym urządzeniu może dać restart, a na innym nie.

Jeśli wykluczysz problemy z 230V, to odsyłaj. Opisz dokładnie procedure testową, którą trzeba przeprowadzić w celu uzyskania prawdopodobnego restartu.

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Gniazdka jestem pewien jak i dysków, bo wystarczyło podpiąć w to samo gniazdo zasilania i ten sam port tym samym kablem ale inny model qnap i śmiga to ponad 2 tygodnie.

Odebrałem właśnie serwer z serwisu, podłączyłem i przy próbie kopiowania pliku od razu restart.

Serwis odpisał, że robił 26godzinny stress test HDD i memory test i nic nie wykryto.

Co mi da opis i odesłanie jeszcze raz na gwarancji? Sprawdzą i odeślą jeszcze raz czy zrobią coś więcej? 

Dla przypomnienia, to samo opisałem im w zgłoszeniu.

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Pierwsze co mi przychodzi do głowy, to temperatura. Serwis mógł wykonać testy, ale w temperaturze np. o 1*C niższej, niż masz w mieszkaniu i problem nie wystąpił. Poczytaj w instrukcji, czy to gdzieś wystawia jakieś dane o temperaturze czegokolwiek. Albo wstaw w chłodniejsze miejsce i spróbuj odtworzyć problem. 

 

Kolejna opcja - naucz się jak łączyć się z nasem po ssh, zapuść tail -f /var/log/dmesg i sprawdzaj, co będzie na ekranie w kliencie ssh po restarcie nasa. Jeżeli to coś na styku hardware-software - pewnie coś wypluje do tty.

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Gdyby to było takie proste. Wczoraj godzinę próbowałem się dostać po SSH, bo ciągle się restartował. Jak juz się dostałem to kilka razy zapuściłem dmesg zanim coś wypluł, bo znów restarty.

 

  Pokaż ukrytą zawartość

 

Edytowane przez Klaus
dla długich logów używaj spoilerów

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

  W dniu 14.02.2017 o 14:23, specdriver napisał(a):
Serwis odpisał, że robił 26godzinny stress test HDD i memory test i nic nie wykryto.

 

A może oni robili test na zasadzie, że się zalogowali zapuścili test HDD kopiowania z dysku na dysk i już. Może problem jest z padniętą kartą sieciową i te testy trzeba robić kopiując z NAS na kompa i odwrotnie, tak aby wygrzać sieciówkę, a nie CPU, czy kontroler HDD.

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Ktoś tam po mistrzowsku napisał to coś, co loguje do dmesg, nie ma co.

Jakkolwiek nie sądzę, abyś miał tam coś zobaczyć teraz. Chodzi mi o to, żeby w putty (czy czego tam używasz) skonfigurować przyzwoicie duży bufor ekranu, zapiąć sesję SSH do nasa, zostawić ciągłe tailowanie tego loga i niech sobie chodzi w tle. Być może chwile przed tym, jak nas się zrestartuje, coś wypluje jakieś ostrzeżenie - może nawet nie do loga, tylko prosto na ekran. Bo może nawet do tego loga nie może pisać, może filesystem wypada albo daemony się kładą z powodu błędu RAM. W momencie, kiedy nas się zrestartuje, zerwie połączenie SSH i ekran zostanie zamarznięty. Może coś na nim będzie. 

 

W linuxie poszczególne komponenty systemu działają mocno niezależnie i bardzo dużo może ich nie działać, zanim kernel odmówi bezpieczeństwa. Jeżeli nas restartuje się, nie freezuje, to prawdopodbne jest, że restaruje go kernel i możliwe, że coś wcześniej zdoła dać znać o problemie. IMHO albo to jest problem hardware, np. RAM ma za gorąco i sieje błędami, albo jakiś moduł jądra ma błąd - i są duże szanse, że zdąży zostawić ślad w tty, choćby jedną linijkę.

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Dzięki za pomoc, ale moja wiedza jak tak marna, że czarną magią do mnie piszesz teraz :)

Za gorąco to nie ma i nie miał, nie przestawiałem go a skoro w lato upały nawet 40st przetrwał to w zimę przy 19st w pomieszczeniu raczej nie grzeje się za bardzo tym bardziej, że temp systemowa pokazuje około 30st.

Na razie ludzie stawiają na RAM a skoro go wymienić się nie da to muszę jakoś go przetestować. Podobno serwis zgodnie z opisem przetestował RAM i też nic nie stwierdzili więc nie wiem czy to coś da, ale jeśli jakoś sam mogę go sprawdzić to spróbuje. RAM jest wlutowany więc podmiana nie wchodzi w grę.

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Dołącz do dyskusji

Możesz dodać zawartość już teraz a zarejestrować się później. Jeśli posiadasz już konto, zaloguj się aby dodać zawartość za jego pomocą.

Gość
Dodaj odpowiedź do tematu...

×   Wklejono zawartość z formatowaniem.   Przywróć formatowanie

  Dozwolonych jest tylko 75 emoji.

×   Odnośnik został automatycznie osadzony.   Przywróć wyświetlanie jako odnośnik

×   Przywrócono poprzednią zawartość.   Wyczyść edytor

×   Nie możesz bezpośrednio wkleić grafiki. Dodaj lub załącz grafiki z adresu URL.



×
×
  • Dodaj nową pozycję...