Mesco

Start -> SPRZĘT KOMPUTEROWY -> Rozwiązania sprzętowe -> GPU TESLA w obliczeniach numerycznych

GPU TESLA w obliczeniach numerycznych

Rodzina akceleratorów GPU nVidia TESLA


Koncern Nvidia oficjalnie wprowadził do swojej oferty akcelerator obliczeniowy Tesla K40, który jest pierwszym i jednocześnie najwydajniejszym akceleratorem zoptymalizowanym do analizy dużych zbiorów danych oraz wielkoskalowych badań naukowych. Konstrukcja ta sprawdzi się w zastosowaniach naukowych, inżynieryjnych, obliczeniach wysokowydajnych (HPC) oraz aplikacjach biznesowych.
Tesla K40 wykorzystuje procesor graficzny bazujący na architekturze Kepler z 2880 rdzeniami CUDA, którego moc obliczeniowa sięga 4,29 TFLOPSa w operacjach na liczbach zmiennoprzecinkowych z zastosowaniem pojedynczej oraz 1,43 TFLOPSa w podwójnej precyzji. Dodatkowo producent zastosował tutaj w technologię GPU Boost, która umożliwia przekształcenie zapasu mocy w dodatkową wydajność, do wykorzystania w używanych przez użytkowników aplikacjach.
Na pokładzie akceleratora znalazło się również 12 GB pamięci typu GDDR5 – pojemność ta pozwala przetwarzać dwukrotnie większe zbiory danych względem poprzedniego modelu Tesla K20X (z 6 GB pamięci GDDR5). Cała konstrukcja komunikuje się z komputerem za pomocą interfejsu PCI-Express 3.0, a więc dwukrotnie szybszego względem PCI-Express 2.0.


Rodzina akcelatorów GPU TESLA przedstawia poniższa tabela.

Features Tesla K40 Tesla K20X Tesla K20 Tesla K10
Number and Type of GPU 1 Kepler GK110B 1 Kepler GK110 2 Kepler GK104s
Peak double precision floating
point performance
1.43 Tflops 1.31 Tflops 1.17 Tflops 0.19 Tflops
Peak single precision floating
point performance
4.29 Tflops 3.95 Tflops 3.52 Tflops 4.58 Tflops
Memory bandwidth (ECC off) 288 GB/sec 250 GB/sec 208 GB/sec 320 GB/sec
Memory size (GDDR5) 12 GB 6 GB 5 GB 8 GB
CUDA cores 2880 2688 2496 2 x 1536
Features Tesla K40 Tesla K20X Tesla K20 Tesla K10 Number and Type of GPU 1 Kepler GK110B 1 Kepler GK110 2 Kepler GK104s Peak double precision floating
point performance
1.43 Tflops 1.31 Tflops 1.17 Tflops 0.19 Tflops Peak single precision floating
point performance
4.29 Tflops 3.95 Tflops 3.52 Tflops 4.58 Tflops Memory bandwidth (ECC off) 288 GB/sec 250 GB/sec 208 GB/sec 320 GB/sec Memory size (GDDR5) 12 GB 6 GB 5 GB 8 GB CUDA cores 2880 2688 2496 2 x 1536 - See more at: http://www.nvidia.com/object/tesla-servers.html#sthash.2CpZdo6S.dpuf

Select the Right Tesla GPU

Features Tesla K40 Tesla K20X Tesla K20 Tesla K10
Number and Type of GPU 1 Kepler GK110B 1 Kepler GK110 2 Kepler GK104s
Peak double precision floating
point performance
1.43 Tflops 1.31 Tflops 1.17 Tflops 0.19 Tflops
Peak single precision floating
point performance
4.29 Tflops 3.95 Tflops 3.52 Tflops 4.58 Tflops
Memory bandwidth (ECC off) 288 GB/sec 250 GB/sec 208 GB/sec 320 GB/sec
Memory size (GDDR5) 12 GB 6 GB 5 GB 8 GB
CUDA cores 2880 2688 2496 2 x 1536


* Note: Tesla K10 specifications are shown as aggregate of two GPUs. With ECC on, 6.25% of the GPU memory is used for ECC bits. For example, 6 GB total memory yields 5.25 GB of user available memory with ECC on.

- See more at: http://www.nvidia.com/object/tesla-servers.html#sthash.2CpZdo6S.dpuf
* Uwaga: W przypadku włączonej opcji ECC dla pamięci RAM, 12.5% zasobów pamięci karty rezerwowane jest dla kontroli parzystości. Przykładowo: dla 6GB pamięci RAM, dla uzytkownika przy włączonej opcji ECC pozostaje 5.25GB.

 


Więcej informacji:

 



Porównanie obecnej architektury kart nVidia TESLA serii Kepler do poprzednika - serii Fermi: