Задачи обучения

В данном разделе описана работа с моделями и задачами обучения. Рассмотрены следующие вопросы:

  • Обучение моделей напрямую из Jupyter Server, подключенного к GPU, и посредством отправки задач в регион.

  • Просмотр статистики по использованию Jupyter Server с GPU и по задачам, запущенным в регионе.

  • Использование ресурсов при запуске задач обучения в регионе.

  • Сохранение промежуточных результатов обучения.

  • Установка библиотек из склонированного Git-репозитория.

  • Подключение по SSH к исполняемой в регионе задаче.

  • Обучение модели с использованием библиотеки Horovod.

  • Обучение модели с использованием Elastic learning.

  • Советы по оптимизации запуска задач обучения и решению возникающих в ходе обучения проблем.