FAS Research Computing - அறிவிப்பு வரலாறு

பகுதி செயல்திறன் குறைவை எதிர்கொள்கிறது

Status page for the Harvard FAS Research Computing cluster and other resources.

Cluster Utilization (VPN and FASRC login required): Cannon | FASSE


Please scroll down to see details on any Incidents or maintenance notices.
Monthly maintenance occurs on the first Monday of the month (except holidays).

GETTING HELP
Documentation: https://docs.rc.fas.harvard.edu | Account Portal https://portal.rc.fas.harvard.edu
Email: rchelp@rc.fas.harvard.edu | Support Hours


The colors shown in the bars below were chosen to increase visibility for color-blind visitors.
For higher contrast, switch to light mode at the bottom of this page if the background is dark and colors are muted.

செயல்திறன் குறைந்துள்ளது

SLURM Scheduler - Cannon - செயல்திறன் குறைந்துள்ளது

Cannon Compute Cluster (Holyoke) - செயல்திறன் குறைந்துள்ளது

Boston Compute Nodes - செயல்திறன் குறைந்துள்ளது

GPU nodes (Holyoke) - செயல்திறன் குறைந்துள்ளது

seas_compute - செயல்திறன் குறைந்துள்ளது

இயங்குகிறது

SLURM Scheduler - FASSE - இயங்குகிறது

FASSE Compute Cluster (Holyoke) - இயங்குகிறது

இயங்குகிறது

Kempner Cluster CPU - இயங்குகிறது

Kempner Cluster GPU - இயங்குகிறது

இயங்குகிறது

FASSE login nodes - இயங்குகிறது

இயங்குகிறது

Cannon Open OnDemand/VDI - இயங்குகிறது

FASSE Open OnDemand/VDI - இயங்குகிறது

இயங்குகிறது

Netscratch (Global Scratch) - இயங்குகிறது

Home Directory Storage - Boston - இயங்குகிறது

Tape - (Tier 3) - இயங்குகிறது

Holylabs - இயங்குகிறது

Isilon Storage Holyoke (Tier 1) - இயங்குகிறது

Holystore01 (Tier 0) - இயங்குகிறது

HolyLFS04 (Tier 0) - இயங்குகிறது

HolyLFS05 (Tier 0) - இயங்குகிறது

HolyLFS06 (Tier 0) - இயங்குகிறது

Holyoke Tier 2 NFS (new) - இயங்குகிறது

Holyoke Specialty Storage - இயங்குகிறது

holECS - இயங்குகிறது

Isilon Storage Boston (Tier 1) - இயங்குகிறது

BosLFS02 (Tier 0) - இயங்குகிறது

Boston Tier 2 NFS (new) - இயங்குகிறது

CEPH Storage Boston (Tier 2) - இயங்குகிறது

Boston Specialty Storage - இயங்குகிறது

bosECS - இயங்குகிறது

Samba Cluster - இயங்குகிறது

Globus Data Transfer - இயங்குகிறது

அறிவிப்பு வரலாறு

செப். 2025

holylfs05 issues
  • தீர்க்கப்பட்டது
    தீர்க்கப்பட்டது

    holylfs05 is back online. Thank you for your patience.

  • புதுப்பிப்பு
    புதுப்பிப்பு

    holylfs05 is undergoing filesystem checks. Due to the size of the system, this process will take the rest of the weekend at a minimum.

    No ETA at this time.

    We are continuing to work on a fix for this incident. Our sincere apologies for the unexpected disruption.

  • அடையாளம் காணப்பட்டது
    அடையாளம் காணப்பட்டது

    holylfs05 will be inaccessible for an extended period of time while our staff continues to troubleshoot the underlying cause.

    We are continuing to work on a fix for this incident.

  • விசாரிக்கப்படுகிறது
    விசாரிக்கப்படுகிறது

    Writing to holylfs05 may result in errors.

    We are currently investigating this incident.

ஆக. 2025

Shutdown nodes in 8A14, 8A16 and 8A18 - Cooling Leak
  • தீர்க்கப்பட்டது
    தீர்க்கப்பட்டது

    Thanks to staff that made multiple datacenter visits, the leak has been addressed and all systems are back up and running.

    This incident has been resolved.

  • கண்காணிக்கப்படுகிறது
    கண்காணிக்கப்படுகிறது

    8a14 and 8a18 are back online, 8a16 is still down

    That includes mweber_gpu and mweber_compute being back up and seas_gpu still partially down

  • புதுப்பிப்பு
    புதுப்பிப்பு

    Power and water is shutdown to these racks and the vendor is working to send someone in next working day to investigate. Partition totally down are mweber_compute, mweber_gpu, seas_gpu and seas_compute.

  • அடையாளம் காணப்பட்டது
    அடையாளம் காணப்பட்டது

    Row 8A18 (row 8A rack18) will also be shut down.

  • விசாரிக்கப்படுகிறது
    விசாரிக்கப்படுகிறது

    MGHPCC found a leak in 8A14 or 8A16 racks and asked us to shutdown those nodes. We are working with the vendor to fix the issue ASAP.

SMB access to shares on the FASRC samba cluster)
  • தீர்க்கப்பட்டது
    தீர்க்கப்பட்டது

    SMB access has been restored. Please disconnect and retry if you have a failed mapped drive. If you still cannot connect to a share, please contact rchelp@rc.fas.harvard.edu and let us know your username and exactly which share you are attempting to map.

  • அடையாளம் காணப்பட்டது
    அடையாளம் காணப்பட்டது

    We are continuing to work on a fix for this incident. No ETA.

  • விசாரிக்கப்படுகிறது
    விசாரிக்கப்படுகிறது

    Drive mapping to some shares may fail if those shares use the Samba Cluster. This includes but is not limited to share paths that begin with \\smbip.

    Known affected shares:

    anderson_lab

    arlotta_lab

    bellono_lab

    bertoldi_lab c

    apellini_lab

    dasch14

    dasch15

    dasch16

    denic_lab

    dobbie_lab

    engert_lab

    ferreira_lab

    fortune_lab

    friedman_lab

    girguis_lab

    grad_lab

    hausmann_lab

    hays_lab

    hbs_liran

    hbs_rcs huh

    illumina

    jessicacohen_lab

    lichtman_boslfs02

    mallet_lab

    mason_lab

    mckinley_lab

    mcz

    mitrano_lab

    moorcroftfs5

    murraylab

    nmr_large

    nmr_small

    novitsky_lab

    pooling

    qbrc_center

    ramachandran_lab

    schnapp_lab

    schrag_lab

    srivastava_lab

    whited_lab

    yau2_lab

ஜூலை 2025

FASRC Monthly maintenance July 7, 2025 9AM-1PM
  • முடிந்தது
    ஜூலை 07, 2025 இல் பிற்பகல் 5:00
    முடிந்தது
    ஜூலை 07, 2025 இல் பிற்பகல் 5:00
    Maintenance has completed successfully
  • முன்னேற்றத்தில் உள்ளது
    ஜூலை 07, 2025 இல் பிற்பகல் 1:00
    முன்னேற்றத்தில் உள்ளது
    ஜூலை 07, 2025 இல் பிற்பகல் 1:00
    Maintenance is now in progress
  • திட்டமிடப்பட்டது
    ஜூலை 07, 2025 இல் பிற்பகல் 1:00
    திட்டமிடப்பட்டது
    ஜூலை 07, 2025 இல் பிற்பகல் 1:00

    FASRC monthly maintenance will take place Monday July 7th, 2025 from 9am-1pm

    NOTICES

    • ​New Quota tool available (/usr/local/sbin/quota) - Works on all filesystem types (home directory, lustre, isilon, netscratch, etc.)
      Type quota -h to see the full instructions for usage o visit the usage doc.

    • Training: Upcoming training from FASRC and other sources can be found on our Training Calendar. at https://www.rc.fas.harvard.edu/upcoming-training/

    • Status Page: You can subscribe to our status to receive notifications of maintenance, incidents, and their resolution at https://status.rc.fas.harvard.edu/ (click Get Updates for options).

    • Upcoming holidays:​ Juneteenth - ​T​hur. June 19​ / Independence Day - Fri​. July 4

    MAINTENANCE TASKS
    Cannon cluster will be paused during this maintenance?: YES
    FASSE cluster will be paused during this maintenance?: YES

    • Slurm Upgrade to 24.11.5

      • Audience: All cluster users

      • Impact: Jobs and the scheduler will be paused during this upgrade

    • Login node ​OS ​upgrades

      • Audience: Anyone logged into a FASRC Cannon or FASSE login node

      • Impact: All login nodes will ​upgraded ​and unavailable during this maintenance window

    • ​Start of cluster OS upgrades - July 7 -10

      • Audience: All cluster users

      • Impact: Over 4 days, July 7 through 10, we will upgrade the OS on 25% of the cluster each day. During that time, total capacity will be reduced across the cluster by 1/4 each day. This will require draining each sub-set of nodes ahead of time. 

    • Netscratch cleanup ( https://docs.rc.fas.harvard.edu/kb/policy-scratch/ )

      • Audience: Cluster users

      • Impact: Files older than 90 days will be removed. Please note that retention cleanup can and does run at any time, not just during the maintenance window.

    Thank you,
    FAS Research Computing
    https://docs.rc.fas.harvard.edu/
    https://www.rc.fas.harvard.edu/

Rolling cluster OS upgrades July 7 - 10
  • முடிந்தது
    ஜூலை 11, 2025 இல் பிற்பகல் 4:02
    முடிந்தது
    ஜூலை 11, 2025 இல் பிற்பகல் 4:02

    All upgrades are complete. A small number of nodes need clean-up, but the cluster is back to normal operation with all nodes running Rocky 8.10. Thanks for your patience.

  • புதுப்பிப்பு
    ஜூலை 07, 2025 இல் பிற்பகல் 1:00
    புதுப்பிப்பு
    ஜூலை 07, 2025 இல் பிற்பகல் 1:00

    Cannon rolling upgrades are in progress. Not all nodes are available.

    https://www.rc.fas.harvard.edu/blog/2025-compute-os-upgrade/

  • முன்னேற்றத்தில் உள்ளது
    ஜூலை 07, 2025 இல் பிற்பகல் 1:00
    முன்னேற்றத்தில் உள்ளது
    ஜூலை 07, 2025 இல் பிற்பகல் 1:00

    UPDATE: 7/7/25 6M FASSE is operational.

    Please be aware that FASSE jobs cannot be launched at this time due to the upgrades.
    We will return all FASSE nodes to normal services as soon as possible.

    https://www.rc.fas.harvard.edu/blog/2025-compute-os-upgrade/

  • திட்டமிடப்பட்டது
    ஜூலை 07, 2025 இல் பிற்பகல் 1:00
    திட்டமிடப்பட்டது
    ஜூலை 07, 2025 இல் பிற்பகல் 1:00

    Cluster OS upgrades - July 7 -10

    • Audience: All cluster users

    • Impact: Over 4 days, July 7 through 10, we will upgrade the OS on 25% of the cluster each day.
      During that time, total capacity will be reduced across the cluster by 1/4 each day.
      This will require draining each sub-set of nodes ahead of time. 

    Work begins during the July 7th maintenance (login nogdes will be upgraded during the 7/7 maintenance window) and will continue through July 10th.

    Additional details and a breakdown of each phase: 2025 Compute OS Upgrade

ஜூலை 2025 வரை செப். 2025

அடுத்து