djsilence Opublikowano 26 Października 2009 Zgłoś Opublikowano 26 Października 2009 (edytowane) TILERA ogłosiła nową rodzinę czterech procesorów, w tym jeden ze stoma rdzeniami. Rodzina TILE Gx obejmuje Tile-GX100, który ma 100 rdzenie - czyli więcej niż potrzeba ;) Procesor jest dostępny w wersji z 16, 36, 64 i 100 rdzeniami. Nowy procek zużywa ponoć bardzo mało prądu, przesuwając poprzeczkę wyżej w kwestii rdzeń/watt w porównaniu do procesorów Westmere od Intela. Osiągnięto to poniekąd dzięki opracowaniu własngo środowiska Multicore Development Environment. Środowisko to zbudowane jest wokół dwuwymiarowego łącznika Imesh, dzieki czemu wyeliminowano potrzebę istnienia wewnętrznego busu chipa. Dynamic Distributed Cache pozwala na współdzielenie lokalnego cache-u przez inne rdzenie. Poniekąd oznacza to, iż prędkość działania procesora wzrasta liniowo wraz z ilością rdzeni. Proces produkcyjny (40nm) pozwolił na pracę w zakresie 10W - 55W przy zegarze sięgającym 1,5GHz. Nie podano jeszcze ceny. Jeżeli cokolwiek z powyższego zrozumieliście to dobrze, bo choć tłumaczyć umiem, to nie mam pojęcia co wyżej napisałem :) pzdr Więcej: http://www.tilera.com/products/TILE-Gx.php http://www.theinquirer.net/inquirer/news/1...-core-processor http://www.tgdaily.com/content/view/44417/135/ Edytowane 26 Października 2009 przez djsilence Cytuj Udostępnij tę odpowiedź Odnośnik do odpowiedzi Udostępnij na innych stronach Więcej opcji udostępniania...
Gość <account_deleted> Opublikowano 26 Października 2009 Zgłoś Opublikowano 26 Października 2009 Liczba rdzeni to żaden wskaźnik wydajności. Im więcej rdzeni tym trudniej wykorzystać ich potencjał. 500Gbps RAM bandwidth = ~60GB/s - "up to" 600MB/s na rdzeń (100 rdzeni) to mało, bardzo mało - co oznacza że bottleneck oczywiście będzie występował i to gigantyczny - szczególnie gdyby chcieć odpalić niezależnie działające wątki - reklamy są "lekko" przesadzone. Tym bardziej że przepustowość to pikuś - tragiczne będą opóźnienia w dostępie do RAM gdy taka masa rdzeni będzie tego potrzebować. A będzie: streaming = nie działa cache - głównie RAM. Jednocześnie max 4 rdzenie / kanały DMA mogą korzystać z dobrodziejstw trybu Burst, blokując tym samym pozostałe - system i aplikacje muszą być ekstremalnie dobrze napisane żeby wykorzystać potencjał drzemiący w tym układzie. Niemiej jednak jest to konstrukcja stworzona do streamingu/obliczeń na macierzach - poszczególne rdzenie połączone są transparentnymi switchami, co pozwala na przekazywanie wyników różnymi drogami i z dużą prędkością (25GB/s średnio przy 100 rdzeniach) Streaming z obróbką w locie, gdzie każdy rdzeń wykonuje inną częśc obliczeń będzie zapitalał - bardzo duże podobieństwo do sposobu działania GPU. Może to być również podstawa do budowy szybkich sieci neuronowych. Każdy rdzeń jest natywnie 64-bitowy z 64-bitowymi rejestrami - to wygląda ciekawie, ale bez wglądu w strukturę i zestaw instrukcji ASM nie ma co się podniecać. Cytuj Udostępnij tę odpowiedź Odnośnik do odpowiedzi Udostępnij na innych stronach Więcej opcji udostępniania...
Arni Opublikowano 9 Listopada 2009 Zgłoś Opublikowano 9 Listopada 2009 Pffff a o intelu już konkurencja zapominała Cytuj Udostępnij tę odpowiedź Odnośnik do odpowiedzi Udostępnij na innych stronach Więcej opcji udostępniania...