Подключение по SSH к исполняемой задаче обучения

Существует возможность подключаться к исполняемой в регионе задаче по протоколу SSH. Такое подключение позволяет пользователям оперативно просматривать информацию о задаче, а также выполнять отладку необходимых процессов.

Подключение по SSH осуществляется из терминала Jupyter Notebook/ JupyterLab и возможно при соблюдении следующих условий:

  1. Используется версия Jupyter Notebook не ниже 0.0.65.

  2. Задача обучения отправлена в регион и запустилась. Под уже стартовал. Если задача еще находится в очереди или уже завершилась, подключиться по SSH к ней не получится.

Основные шаги для настройки подключения по SSH приведены ниже.

  1. Подключитесь к Jupyter Server. Как это сделать, описано в разделах Создание нового Jupyter Server и Подключение к существующему Jupyter Server.

  2. В открывшемся Jupyter Notebook/ JupyterLab зайдите в терминал.

    Важно

    Генерация SSH-ключей происходит автоматически при создании Jupyter Server. Пользовательские SSH-ключи будут находиться в рабочем каталоге /home/jovyan/.ssh и называться по имени неймспейса.

  3. В терминале выполните команду

jovyan@test-0:~$ aicloud jobs ssh your_job_id

your_job_id — это идентификатор задачи, отправленной для исполнения в регион (обязательный параметр).

Подключение к конкретному воркер-поду (worker) осуществляется с помощью параметра -w (--worker), с указанием его номера. По умолчанию подключение осуществляется к воркеру 0.

При желании можно вывести справку

jovyan@test-0:~$ aicloud jobs ssh --help
Usage: ssh jobs ssh [OPTIONS] JOB_NAME

  Ssh connection to training job by its name. By default will connect to
  the master process. With --worker (-w) option you can connect to a specific
  worker process

Arguments:
  JOB_NAME  Training_job id (like: lm-mpi-
            job-2d2fd049-a18a-4035-aba6-7a4b6ffbd2f4)  [required]


Options:
  -m, --master          Connect to master process (disabled)
  -w, --worker INTEGER  Connect to specific worker_N
  --help                Show this message and exit.

Обратите внимание на то, что подключение по SSH прервется в момент завершения задачи.