Höchstleistungsrechner-Kompetenzzentrum
Baden-Württemberg



 
<-- Menue Folgeseiten ------------------------->

 

english version

 


HP XC6000 Cluster am SSCK

Am SSCK wird in mehreren Stufen, beginnend in 2004 ein HP XC6000 Cluster als Landeshöchstleistungsrechner installiert. Das unter Linux betriebene System besteht aus leistungsfähigen Einzelknoten, die jeweils zwei, vier oder 16 Intel Itanium-2-Prozessoren enthalten und durch einen schnellen Interconnect (Quadrics QSNet II) verbunden sind.

In der Endausbaustufe Anfang 2006 wird das redundant ausgelegte, hochverfügbare System mit 1.200 Prozessoren eine Rechenleistung von ca. 11 TeraFlop/s erreichen und mehr als 7 TB Hauptspeicher zur Verfügung stellen.

Nach der im April 2004 erfolgten Installation eines Test-Clusters mit 16 Knoten wird der Systemausbau der Phase 1 (Ende 2004 / Anfang 2005) über eine Peak Performance von ca. 2,2 TFlop/s sowie eine Speichergröße von 2,2 TB verfügen.

Struktur des HP XC-Clusters in Phase 1:

  • 116 2-Wege Knoten mit je 12 GB Hauptspeicher
  • sechs 16-Wege Knoten mit je 128 GB Hauptspeicher
  • Single rail Quadrics QSNet II Interconnect
  • 10 TB globaler Plattenplatz
Architektur des HP XC6000 Clusters

Zur Phase 2 (Anfang 2006) wird dieses System erweitert um zusätzlich:

  • 218 4-Wege Knoten mit je 24 GB Hauptspeicher mit
  • Dual rail Quadrics QSNet II Interconnect
  • 30 TB globaler Plattenplatz

Schnelles Kommunikationsnetzwerk und hohe Skalierbarkeit

Die Architektur des HP XC Clusters zeichnet sich durch eine klare Gliederung und Spezialisierung der einzelnen Knoten aus. Für Anwendungen, die mittels MPI parallelisiert sind, werden 2- bzw. 4-Wege Knoten eingesetzt. Das Kommunikationsnetzwerk mit einer Latenzzeit von ca. 3 µs und einer Bandbreite von ca. 800 MB/s auf MPI-Ebene ermöglicht eine hohe Skalierbarkeit, so dass auch kommunikationsintensive Anwendungen mit hohen Prozessorzahlen effizient ausgeführt werden können.

Applikationen, die nach dem Prinzip des gemeinsamen Speicherzugriffs parallelisiert sind, können auf den 16-Wege-Knoten ausgeführt werden und vom 128 GigaByte großen, gemeinsamen Hauptspeicher und der lokalen Plattenkapazität von mehr als 1 TeraByte pro Knoten profitieren. Auch für interaktive Anwendungen zum Pre- und Postprocessing sowie zur Datenfilterung ist die Verwendung der 16-Wege-Knoten vorgesehen.

Paralleles Cluster File System Lustre

Das HP XC6000 Cluster verfügt mit Lustre über ein zentrales, paralleles Dateisystem, das speziell für sehr große Cluster und hohe I/O-Bandbreiten konzipiert wurde. Durch die Nutzung mehrerer Object Storage Server (OSS) und Meta Data Server (MDS) wird sowohl eine Parallelität des Datenzugriffs als auch eine Redundanz beim Ausfall einzelner Server erreicht. Sowohl für parallele als auch serielle I/O-Operationen werden in der vorgesehenen Konfigurationen hohe Datenübertragungsraten von bis zu mehreren GByte pro Sekunde erreicht.

In der ersten Ausbaustufe werden 10 TB, in der zweiten Stufe 40 TB Plattenplatz für globale Dateisysteme verfügbar sein. Daneben ist jeder Knoten des XC Clusters mit lokalen Platten für temporäre Dateien ausgestattet.

Hohe Effizienz durch Cache-Nutzung

Die Knoten des HP XC-Clusters basieren auf Intel Itanium-2-Prozessoren. Diese Prozessoren zeichnen sich insbesondere durch eine hohe Leistung im Bereich der Gleitpunktarithmetik sowie durch einen sehr großen Datencache aus, der auf dem Prozessorchip liegt und deshalb mit sehr kurzer Latenzzeit und extrem hoher Bandbreite angesprochen werden kann. Damit ist das System insbesondere für Applikationsprogramme geeignet, die für die Cache-Nutzung optimiert sind.

Einfache Portierung von Anwendungsprogrammen

Die Programmierumgebung und Applikationsschnittstellen des HP XC6000-Systems basieren auf offenen Standards und ermöglichen deshalb eine einfache Portierung von Anwendungsprogrammen.