Skocz do zawartości
djsilence

Stu-rdzeniowy Procesor Już Niebawem

Rekomendowane odpowiedzi

Dołączona grafika

 

 

TILERA ogłosiła nową rodzinę czterech procesorów, w tym jeden ze stoma rdzeniami.

 

Rodzina TILE Gx obejmuje Tile-GX100, który ma 100 rdzenie - czyli więcej niż potrzeba ;)

Procesor jest dostępny w wersji z 16, 36, 64 i 100 rdzeniami.

 

Nowy procek zużywa ponoć bardzo mało prądu, przesuwając poprzeczkę wyżej w kwestii rdzeń/watt w porównaniu do procesorów Westmere od Intela. Osiągnięto to poniekąd dzięki opracowaniu własngo środowiska Multicore Development Environment.

 

Środowisko to zbudowane jest wokół dwuwymiarowego łącznika Imesh, dzieki czemu wyeliminowano potrzebę istnienia wewnętrznego busu chipa. Dynamic Distributed Cache pozwala na współdzielenie lokalnego cache-u przez inne rdzenie.

 

 

Dołączona grafika

 

 

 

Poniekąd oznacza to, iż prędkość działania procesora wzrasta liniowo wraz z ilością rdzeni.

 

 

Dołączona grafika

 

 

 

Proces produkcyjny (40nm) pozwolił na pracę w zakresie 10W - 55W przy zegarze sięgającym 1,5GHz.

 

Nie podano jeszcze ceny.

 

Jeżeli cokolwiek z powyższego zrozumieliście to dobrze, bo choć tłumaczyć umiem, to nie mam pojęcia co wyżej napisałem :)

pzdr

 

Więcej:

http://www.tilera.com/products/TILE-Gx.php

http://www.theinquirer.net/inquirer/news/1...-core-processor

http://www.tgdaily.com/content/view/44417/135/

Edytowane przez djsilence

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Gość <account_deleted>

Liczba rdzeni to żaden wskaźnik wydajności. Im więcej rdzeni tym trudniej wykorzystać ich potencjał.

500Gbps RAM bandwidth = ~60GB/s - "up to" 600MB/s na rdzeń (100 rdzeni) to mało, bardzo mało - co oznacza że bottleneck oczywiście będzie występował i to gigantyczny - szczególnie gdyby chcieć odpalić niezależnie działające wątki - reklamy są "lekko" przesadzone. Tym bardziej że przepustowość to pikuś - tragiczne będą opóźnienia w dostępie do RAM gdy taka masa rdzeni będzie tego potrzebować. A będzie: streaming = nie działa cache - głównie RAM. Jednocześnie max 4 rdzenie / kanały DMA mogą korzystać z dobrodziejstw trybu Burst, blokując tym samym pozostałe - system i aplikacje muszą być ekstremalnie dobrze napisane żeby wykorzystać potencjał drzemiący w tym układzie.

 

Niemiej jednak jest to konstrukcja stworzona do streamingu/obliczeń na macierzach - poszczególne rdzenie połączone są transparentnymi switchami, co pozwala na przekazywanie wyników różnymi drogami i z dużą prędkością (25GB/s średnio przy 100 rdzeniach) Streaming z obróbką w locie, gdzie każdy rdzeń wykonuje inną częśc obliczeń będzie zapitalał - bardzo duże podobieństwo do sposobu działania GPU. Może to być również podstawa do budowy szybkich sieci neuronowych.

 

Każdy rdzeń jest natywnie 64-bitowy z 64-bitowymi rejestrami - to wygląda ciekawie, ale bez wglądu w strukturę i zestaw instrukcji ASM nie ma co się podniecać.

Udostępnij tę odpowiedź


Odnośnik do odpowiedzi
Udostępnij na innych stronach

Dołącz do dyskusji

Możesz dodać zawartość już teraz a zarejestrować się później. Jeśli posiadasz już konto, zaloguj się aby dodać zawartość za jego pomocą.

Gość
Dodaj odpowiedź do tematu...

×   Wklejono zawartość z formatowaniem.   Przywróć formatowanie

  Dozwolonych jest tylko 75 emoji.

×   Odnośnik został automatycznie osadzony.   Przywróć wyświetlanie jako odnośnik

×   Przywrócono poprzednią zawartość.   Wyczyść edytor

×   Nie możesz bezpośrednio wkleić grafiki. Dodaj lub załącz grafiki z adresu URL.

Ładowanie


×
×
  • Dodaj nową pozycję...