Сборка кастомного Docker-образа для Inference

Docker registry используется для хранения Docker-образов. Создание кастомного Docker-образа для Inference позволяет развернуть требуемый образ (не используя базовый) в качестве деплоя.

Например, нужен веб-сервер в контейнере, который будет принимать пакеты по порту 8080.

Выполнение этой задачи предполагает:

  1. Подготовку Dockerfile на локальной машине. В качестве базового можно использовать любой образ.

  2. Подготовку репозитория для размещения образа (подробнее см. Сценарии использования).

  3. Сборку образа и отправку его в Docker registry (подробнее см. Начало работы).

Результат создания образа для деплоя:

  • Докер файл (в котором развернут веб-сервер, работающий по порту 8080).

  • Репозиторий в Docker registry с префиксом «deploy-», в который загружен собранный докер файл.

  • Деплой, запущенный на основе докер файла.

Файлы для скачивания

Порядок создания и проверки работоспособности веб-сервера из примера

  1. Соберите докер файл и запустите его (подробнее см. в документации Docker).

  2. Присвойте образу название с префиксом «deploy-», тег и загрузите его в Docker registry (подробнее см. Начало работы), например:

    cr.msk.sbercloud.ru/xxxxxxxxxx-xxxxxxx-xxxxx/deploy-test[:TAG]
    
  3. Создайте деплой из Docker-образа загруженного на предыдущем шаге и запустите его (подробнее см. Сборка образов).

  4. Проверьте корректность функционирования созданного деплоя, создав в разделе Тест API пустой запрос:

    {}
    

    В ответ должно прийти сообщение:

    {
     "message": "Success request to path=/v1/models/{DEPLOY-NAME}:predict"
    }