Обзор кластера

Вычислительный кластер состоит из одного головного узла hn1, 24 вычислительных CPU-узлов c[01-24] и двух вычислительных GPU-узлов g[01-02]. Все узлы объединены высокоскоростной сетью InfiniBand. На всех узлах установлена операционная система Rocky Linux 8.5.

Головной узел

Узел hn1 используется для подготовки и установки задач в очередь.

Вычислительные CPU-узлы

На кластере доступно 24 узла, в каждом из которых установлено 2 процессора по 26 ядер, всего 1248 ядер. Используйте очередь задач cpu для запуска задач на CPU-узлах.

Вычислительные GPU-узлы

На кластере есть два узла с графическими ускорителями.

На узле g01 установлены 4 карты Nvidia Tesla V100S. На узле g02 установлены 8 карт Nvidia GeForce RTX 2080 Ti. Используйте очередь задач gpu для запуска задач на GPU-узлах. Обязательно укажите нужный тип карт и их количество с помощью опции --gpus, например:

# две карты Nvidia Tesla V100S (тип v100)
sbatch --partition=gpu --gpus=v100:2 gpu_job.sh

# четыре карты Nvidia GeForce RTX 2080 Ti (тип rtx)
sbatch --partition=gpu --gpus=rtx:4 gpu_job.sh

Задачи, запущенные без указания опции --gpus, не будут иметь доступа к графическим ускорителям.