Вопросы и ответы про работу с разными регионами

Сколько регионов доступно при создании окружений?

Имя региона

Описание региона

Christofari.V100

Окружение будет развернуто на узлах суперкомпьютера Christofari. Для выбора доступны конфигурации, использующие GPU и CPU.

Подробнее про тарификацию см. Тарификация.

Christofari.A100

Окружение будет развернуто на узлах суперкомпьютера Christofari Neo. Для выбора доступны конфигурации, использующие GPU и CPU.

Подробнее про тарификацию см. Тарификация.

Cloud.Region.CPU (CPU)

Окружение будет развернуто на инстансе Advanced. Бесплатных окружений не предусмотрено. Для выбора доступна только конфигурация с CPU. Подробнее про тарификацию см. Тарификация.

Cloud.Region.A100 (GPU Tesla A100)

Для выбора доступны конфигурации, использующие GPU и CPU. Для запуска задач доступна конфигурация, включающая до 4 GPU Tesla A100. Между серверами нет высокоскоростной сети, поэтому задачи можно запускать только до 4 GPU.

Подробнее про тарификацию см. Тарификация.

Сколько регионов доступно при создании деплоев?

Имя региона

Описание региона

Christofari.V100

Деплой будет развернут на узлах суперкомпьютера Christofari. Для выбора доступны конфигурации, использующие GPU и CPU.

Cloud.Region.CPU (CPU)

Деплой будет развернут на инстансе Advanced. Для выбора доступны конфигурации, использующие GPU и CPU или только CPU.

Как запустить задачу на Christofari.A100?

Для запуска задачи на Christofari.A100 нужно:

  • Использовать для обучения образ с версией Cuda не ниже 11.

  • Обратить внимание на то, что у каждого региона свое независимое NFS хранилище. Подробнее см. Работа на разных регионах размещения ресурсов.

  • При запуске задач обучения через client_lib в параметре region нужно указывать конкретный регион. Код модели возможно потребует изменений.

  • Использовать образ, имеющий в названии префикс a100 (например, jupyter-cuda11.0-tf2.4.0-pt1.7.1-gpu-a100).

Быстрый старт для запуска задач на Christofari и Christofari Neo приведен на GitHub.