RSS-Feed abonnieren

Passwort vergessen?

v Anmelden

25. Jan 2017

Wartungsarbeiten am HPC-Cluster IANVS | Maintenance Downtime for IANVS Cluster

Verfasst von

Please see below for the English version.

Deutsche Version

Sehr geehrte Nutzer des IANVS-Clusters,

Auf Grund von notwendigen Wartungsarbeiten wird IANVS vom Dienstag, dem 7.2. 16:00 Uhr, bis zum Freitag, dem 10.2. 18:00 Uhr nicht zur Verfügung stehen. Wir bitten um Ihr Verständnis.

In dieser Zeit wird das Dateisystem neu konfiguriert, einige Nodes neu verkabelt und Caches vergrößert. Dies sollte zu einem Netto-Performancegewinn beim Zugriff auf die Plattensysteme führen.

Falls Sie Jobs in der Warteschlange haben, die bis zum 7.2. 16:00 fertig werden, werden diese noch vor dem Wartungszeitraum durchlaufen. Alle anderen Jobs werden vom Batchsystem automatisch zurückgestellt, bis die Wartungsarbeiten vorüber sind.

Sie können uns unterstützen, indem Sie zu Beginn des Wartungsfensters möglichst wenige Daten im /scratch haben. Dies minimiert die bei der Sicherung übertragene Datenmenge und hilft uns so, das Zeitfenster einzuhalten.

Ablauf

  1. Am 7.2. 16:00 wird der Login für alle Nutzer auf dem Cluster gesperrt. Bereits eingeloggte Nutzer werden mit einer Frist von einer Stunde automatisch ausgeloggt.
  2. Ihre Daten werden von /scratch auf /home verschoben und gesichert.
  3. Der Cluster wird heruntergefahren und die beschriebenen Wartungsarbeiten durchgeführt.
  4. Der Cluster wird hochgefahren und getestet.
  5. Ihre Daten werden wiederhergestellt.
  6. Am 10.2. 18:00 geht der Cluster spätestens wieder in Betrieb.

Im Falle von Fragen können Sie sich gern bei uns melden: per E-Mail an hpc@itz.uni-halle.de oder telefonisch unter (0345) 55-21864 bzw. (0345) 55-21860.

Mit freundlichen Grüßen,
Ihr HPC-Team

English Version

Dear IANVS users,

the IANVS cluster will be down for maintenance from Tuesday, Feb 7th, 4:00 P.M. until Friday, Feb 10th, 6:00 P.M. We apologize for the inconvenience.

During the maintenance period we will reconfigure file systems, change connections for some of the nodes, and increase cache sizes. The end result of these changes should be an overall increase in disk performance.

Jobs which are able to run to completion until Feb 7th, 4:00 P.M., will be run until that time frame. Jobs whose runtimes would affect the maintenance window will automatically be scheduled for after the maintenance window.

You can assist us by having as little of your data in /scratch as possible by Tuesday, Feb 6th, 4:00 P.M. This reduces the amount of data that we need to back up, and helps us stick to the schedule.

Planned Procedure

  1. On Feb 7th, 4 P.M., new log-ins to the cluster login nodes will be disallowed. Existing log-ins will be notified and logged out after one hour (i.e., by 5:00 P.M.).
  2. Your /scratch data will be moved over to a new directory in /home. Afterwards, /home will be backed up.
  3. The cluster will be powered down for maintenance.
  4. Upon completion, the cluster will be powered on and undergo testing.
  5. Your /scratch and /home data will be restored.
  6. The cluster will be back online by Feb 10th, 6:00 P.M. at the latest.

Please contact us if you have any questions: via e-mail (hpc@itz.uni-halle.de) or phone, (0345) 55-21864 or (0345) 55-21860.

Best regards,
ITZ HPC team

Über Patrice Peterson

Kommentare sind geschlossen.


Seiten

Letzte Kommentare