Queue 與計算資源
台灣杉二號 (命令列介面) 提交 Job 時,可使用的 Queue 如下:
| Queue 名稱 | 最長執行時間(小時) | 高優先權 | 每位用戶最多 可提交計算工作數上限 | 適用計畫 | 節點類型 | 每位用戶最多 可取用 GPU 數上限 |
|---|---|---|---|---|---|---|
| gp1d | 24 | 20 | 各式計畫 | GPU 計算節點 | 40 | |
| gp2d | 48 | 20 | 各式計畫 | GPU 計算節點 | 40 | |
| gp4d | 96 | 20 | 各式計畫 | GPU 計算節點 | 80 | |
| gtest | 0.5 | 5 | 各式計畫 | GPU 計算節點 | 40 | |
| express | 96 | v | 20 | 企業與個人計畫 | GPU 計算節點 | 256 |
信息
- 台灣杉二號皆為 GPU 計算節點,每一節點有 8 GPUs 和 36 CPUs,型號分別為 NVIDIA Tesla V100-SXM2-32GB,及 Intel(R) Xeon(R) Gold 6154 處理器。
- 用戶最多提交 20 個計算工作,所有計算工作加總可使用最多 80 張 GPUs。各 Queue 亦有限制各用戶最多提交計算工作數目的上限。
- 每個計算工作至少指定 1 張 GPU,且不能超過 1 GPU : 4 CPU : 90 GB Memory 比例
- gtest 為測試用 queue,用戶最多提交 5 個計算工作到 gtest 。
- 當用戶在登入節點運行超過 5 分鐘的 GPU process,將會自動清除該用戶所有 process。
- 當用戶在登入節點運行超過 400% CPU usage 的 process,該 process 將會自動被清除。
- 在登入節點當機時,使用
srunandsalloc指令提交 job 可能會造成計算中斷或資料流失,因此建議使用sbatch指令運行大規模計算工作。 - Queue 與節點數量會定期檢討與調整。
- 管理員將會不定期清理登入節點與檔案傳輸節點的 /tmp 目錄以維持系統正常運作,請避免於 /tmp 存放重要資料。
- 若需延長單個 job 的執行時間 (walltime),請洽詢客服人員。