FAS Research Computing - gpu_test partition down – Details zu Vorfällen

Teilweise herabgesetzte Leistung festgestellt

Status page for the Harvard FAS Research Computing cluster and other resources.

Cluster Utilization (VPN and FASRC login required): Cannon | FASSE


Please scroll down to see details on any Incidents or maintenance notices.
Monthly maintenance occurs on the first Monday of the month (except holidays).

GETTING HELP
Documentation: https://docs.rc.fas.harvard.edu | Account Portal https://portal.rc.fas.harvard.edu
Email: rchelp@rc.fas.harvard.edu | Support Hours


The colors shown in the bars below were chosen to increase visibility for color-blind visitors.
For higher contrast, switch to light mode at the bottom of this page if the background is dark and colors are muted.

gpu_test partition down

Gelöst
Beeinträchtigte Leistung
Aufgetreten am vor etwa 2 JahrenDauerte etwa 2 Stunden

Betroffen

Cannon Cluster

Beeinträchtigte Leistung aus 1:42 PM zu 3:17 PM

Cannon Compute Cluster (Holyoke)

Beeinträchtigte Leistung aus 1:42 PM zu 3:17 PM

GPU nodes (Holyoke)

Beeinträchtigte Leistung aus 1:42 PM zu 3:17 PM

FASSE Cluster

Beeinträchtigte Leistung aus 1:42 PM zu 3:17 PM

FASSE Compute Cluster (Holyoke)

Beeinträchtigte Leistung aus 1:42 PM zu 3:17 PM

Aktualisierung
  • Gelöst
    Gelöst

    gpu_test and FASSE GPU partitions are back. We are looking into replacement power supply units to mitigate this issue.

  • Analyse
    Analyse

    gpu_test is down again due to an IB switch failing

    the gpu partition in FASSE is also down