Обучение модели

В данном разделе описана работа с моделями. Рассмотрены следующие вопросы:

  • Обучение моделей напрямую из Jupyter Server, подключенного к GPU, и посредством отправки задач на кластер.

  • Просмотр статистики по использованию Jupyter Server с GPU и по задачам, запущенным на кластере.

  • Использование ресурсов при запуске задач обучения на кластере.

  • Сохранение промежуточных результатов обучения.

  • Установка библиотек из склонированного Git-репозитория.

  • Подключение по SSH к исполняемой на кластере задаче.

  • Обучение модели с использованием библиотеки Horovod.