Обзор кластера
Вычислительный кластер состоит из одного головного узла hn1
, 24 вычислительных CPU-узлов c[01-24]
и двух вычислительных GPU-узлов g[01-02]
.
Все узлы объединены высокоскоростной сетью InfiniBand. На всех узлах установлена операционная система Rocky Linux 8.5.
Головной узел
Узел hn1
используется для подготовки и установки задач в очередь.
Вычислительные CPU-узлы
На кластере доступно 24 узла, в каждом из которых установлено 2 процессора по 26 ядер, всего 1248 ядер.
Используйте очередь задач cpu
для запуска задач на CPU-узлах.
Вычислительные GPU-узлы
На кластере есть два узла с графическими ускорителями.
На узле g01
установлены 4 карты Nvidia Tesla V100S.
На узле g02
установлены 8 карт Nvidia GeForce RTX 2080 Ti.
Используйте очередь задач gpu
для запуска задач на GPU-узлах. Обязательно укажите нужный тип карт и их количество с помощью опции --gpus
, например:
# две карты Nvidia Tesla V100S (тип v100)
sbatch --partition=gpu --gpus=v100:2 gpu_job.sh
# четыре карты Nvidia GeForce RTX 2080 Ti (тип rtx)
sbatch --partition=gpu --gpus=rtx:4 gpu_job.sh
Задачи, запущенные без указания опции --gpus
, не будут иметь доступа к графическим ускорителям.