Regeln für den dirac-Cluster
Stand: 06.03.2012, Redaktion: Andreas Tomiak, FM-D
Der High-Performance-Computing-Cluster dirac ist mit jeder HZB-Intranet-Kennung mit ssh zugänglich. Beim erstmaligen Zugang wird ein Heimatverzeichnis unter /home eingerichtet.
Für die Nutzung gelten ergänzend zur Benutzungsordnung folgende Regeln:
- Alle Nutzer werden gleich behandelt; wer zuerst kommt, rechnet zuerst.
- Mit den Ressourcen CPU und RAM ist sparsam und rücksichtsvoll umzugehen.
- Jobs mit kurzer Rechenzeit und kleiner Kernanzahl werden gegenüber wenigen mit langer Rechenzeit bevorzugt.
- Auf den Rechenknoten können nur Batchjobs (Stapelverarbeitung) mit Hilfe der Sun Grid Engine gerechnet werden.
- Interaktive Jobs müssen auf den Servern dinux4 und dinux5 gerechnet werden.
- Jeder Job in der Queue all.q kann maximal 24 Stunden wahre Zeit laufen.
- In den Queues long und magny können Jobs maximal 168 Stunden (eine Woche) laufen.
- Jobs in der Queue phobos können so lange laufen, wie sie möchten.
- Jobs über 24 Stunden wahre Zeit können aus betrieblichen Gründen (z.B. zur Wartung, bei Erweiterung oder Änderungen) abgebrochen werden.
- Die Queue magny ist für eine geschlossene Nutzergruppe reserviert.
- Die Jobs sollen ihren Zustand regelmäßig zwischenspeichern (Checkpointing). Wer darauf verzichtet, hat die Folgen selbst zu tragen.
- Jeder Job kann maximal 16 (8-Kern-Nodes), 32 (16-Kern-Nodes) oder 64 (48-Kern-Nodes) GB RAM je Rechennkoten belegen.
- Jobs müssen die Speicherangabe (-l vf=Größe) enthalten, sonst starten sie nicht.
- Auf dem Heimatverzeichnis in /home sollen nicht mehr als 100 GB belegt werden. Wird mehr Platz benutzt, so muss dieser bei Bedarf durch andere Nutzer unterhalb der Grenze umgehend freigegeben werden.
- Temporäre Daten können clusterweit erreichbar in /data1/temp abgelegt werden und werden nach 28 Tagen gelöscht.
- Temporäre Daten können lokal auf den Rechenknoten in /tmp abgelegt werden, diese sind nach Neustart der Knoten verloren. Es stehen dort nur 140 MB zur Verfügung. Auf node28 und node29 stehen jeweils 480 GB dauerhaft zur Verfügung.
[at]