跳至主要内容

Slurm 指令

請點擊以下分類、文件以了解更多服務詳細資訊。

📄️ scancel

用於取消正在等待中,或運行中的任務或任務集,也可發出任意訊號給運行的任務或任務集相關的所有進程。scancel 用於發出信號或取消特定的任務、任務陣列,或者任務步驟。一組任意數量的任務或任務步驟可以被指定的特徵過濾出來,或者透過空白鍵來區分一整串的任務或任務步驟的ID。如果任務陣列有定義任務ID的話,就僅有該任務以及子任務被刪除,反之沒有定義的話,則所有有相關的任務都會被刪除。

📄️ srun

srun用於提交任務或作為提交任務集中的單一任務。srun有多種選項來指定資源需求,包括:最小和最大節點數,CPU數,是否使用特定節點,以及特定節點的特徵(例如 記憶體大小,硬碟空間,某些必需的功能等)。由Slurm管理的叢集可執行平行運算工作,依序或平行在獨立或共享的節點上運作,運作的任務可以包含多步驟的任務,並可依照預先被分配的節點資源來工作。範例如下:

📄️ strigger

strigger用於設置,取得或查看事件觸發器。事件觸發器包括節點關閉或任務接近其時間限制等事件。這些事件可能導致觸發執行任意腳本,經常用於提醒系統管理者節點故障,或者一個任務運行接近限制時間時,採用特定方式來安全結束特定程序,通常會使用節點清單(nodelist)或任務ID等參數來傳遞至特定程式內。此指令僅提供系統內具管理權限使用者使用,若要使用請洽本系統管理人員。