NVIDIA Deep Learning

NVIDIA Deep Learning

Grenzenlose Berechnungen in modernen Rechenzentren!

Der NVIDIA Tesla P100-Grafikprozessor ist der fortschrittlichste Rechenzentren Beschleuniger, der je gebaut wurde. Seine neue innovative Grafikprozessor-Architektur ermöglicht die schnellsten Rechenknoten der Welt und kann die Leistung von Hunderten langsamer Rechenknoten enorm steigern. Die superschnellen Tesla P100-Rechenknoten beschleunigen HPC-Aufgaben und Deep-Learning-Anwendungen, die beinahe unbegrenzte Berechnungen erfordern.

 

 

 

TESLA P100 UND NVLINK LIEFERN BEI ANWENDUNGEN FÜR RECHENZENTREN EINE BIS ZU 50-FACHE LEISTUNGSSTEIGERUNG

Künstliche Intelligenz für selbstfahrende Autos. Zukunftsprognosen für unser Klima. Ein neues Medikament zur Krebsbehandlung. Schon von Beginn an übt Deep Learning einen gewaltigen Einfluss aus und ist in allen Branchen das große Thema. Für einige der wichtigsten Herausforderungen auf der Welt müssen wir dringend eine Lösung finden, die aber einen enormen Rechenaufwand erfordert. Die heutigen komplexen Rechenzentren verlassen sich auf miteinander verknüpfte Rechenknoten mit Standardkomponenten. Das bremst jedoch die Leistung, die für so wichtige Berechnungen nötig wäre. Daher müssen sich die Rechenzentren intensiver als jemals zuvor auf die High-Performance Computing‑ und Hyperscale-Rechenlasten einstellen, die es zu bewältigen gilt.

Der NVIDIA Tesla P100-Grafikprozessor ist der fortschrittlichste Rechenzentren Beschleuniger, der je gebaut wurde. Seine neue innovative Grafikprozessor-Architektur ermöglicht die schnellsten Rechenknoten der Welt und kann die Leistung von Hunderten langsamer Rechenknoten enorm steigern. Die superschnellen Tesla P100-Rechenknoten beschleunigen HPC-Aufgaben und Deep-Learning-Anwendungen, die beinahe unbegrenzte Berechnungen erfordern.

 

TESLA P100 UND NVLINK LIEFERN BEI ANWENDUNGEN FÜR RECHENZENTREN EINE BIS ZU 50-FACHE LEISTUNGSSTEIGERUNG

 

 

TESLA P100-GRAFIKPROZESSOR – MERKMALE UND VORTEILE

Der Tesla P100-Grafikprozessor basiert auf vollkommen neu entwickelter Hard- und Software. Jede der innovativen Technologien liefert eine deutliche
Leistungssteigerung, um den schnellsten Rechenknoten der Welt zu ermöglichen

    

 
Pascal-Architektur für exponentielle Leistungssteigerung

Durch die neue NVIDIA-Pascal™-Architektur liefert der Tesla P100 bei HPC‑ und Hyperscale-Aufgaben unübertroffene absolute Leistung. Mit einer FP16-Leistung von über 21 TeraFLOPS wurde Pascal dafür optimiert, Deep-Learning-Anwendungen großartige, neue Möglichkeiten zu eröffnen. Des Weiteren liefert Pascal bei HPC-Berechnungen eine Leistung von über 5 TeraFLOPS bei doppelter Genauigkeit und von über 10 TeraFLOPS bei einfacher Genauigkeit.

  

 

Unübertroffene Effizienz mit HBM2-Speicherstacks

Durch integriertes HBM2-CoWoS® (Chip-on-Wafer-on-Substrate) mit einer bis zu 3-mal so hohen Speicherleistung wie die NVIDIA-Maxwell™-Architektur kombiniert der Tesla P100 maximale Rechenlei

  

Extrem umfangreiche Anwendungen mit NVIDIA NVLink

Die Systemleistung wird häufig durch langsame Verbindungen zwischen einzelnen Knoten begrenzt. Die innovative NVIDIA NVLink™ Highspeed-Verbindungstechnologie ist für die Anwendungsskalierung auf mehrere Grafikprozessoren ausgelegt und liefert 5x mehr Leistung als die zur Zeit führenden Technologien.

  

Einfache Programmierung mit der Page Migration Engine

Die Page Migration Engine ermöglicht Entwicklern, sich gezielt auf das Feintuning für mehr Rechenleistung anstatt auf die Verwaltung der Datenübertragungen zu konzentrieren. Die Anwendungen können nun über die Größe des physischen Speichers im Grafikprozessor hinaus skalieren, nämlich bis auf 2 Terabyte

 

 

MERKMALE DES NVIDIA-TESLA-P100-GRAFIKPROZESSORS

  • 5,3 TeraFLOPS Double-Precision-Leistung mit NVIDIA GPU Boost™
  • 10,6 TeraFLOPS Single-Precision-Leistung mit NVIDIA GPU Boost
  • 21,2 TeraFLOPS Half-Precision-Leistung mit NVIDIA GPU Boost
  • 80 GB/s Verbindungsbandbreite mit NVIDIA NVLink
  • 720 GB/s Speicherbandbreite mit CoWoS-HBM2-Stapelspeicher
  • 16 GB CoWoS-HBM2-Stapelspeicher
  • Verbesserte Programmierbarkeit mit Page Migration Engine und Unified Memory
  • ECC-Schutz für höhere Zuverlässigkeit
  • Server-Optimierung für maximalen Durchsatz im Rechenzentrum