Вопросы и ответы про Deployments

Как функционирует сервис?

Для использования сервиса необходимы обученная модель (классические ML алгоритмы, нейронные сети) и serving-скрипт на S3 бакете.

Для развертывания модели на сервисе необходимо:

  • Собрать Docker-образ с моделью, используя любой удобный интерфейс (Jupyter Notebook, API, GUI).

  • Развернуть образ на необходимой конфигурации, используя любой удобный интерфейс (Jupyter Notebook, API, GUI).

Для отправки запросов по API к модели (вручную или со стороны автоматизированной системы клиента) необходимо:

Что делать, если возникает проблема с созданием деплоя?

Если возникает проблема с созданием деплоя — выберите 1 pod и после этого проверьте логи на предмет ошибки в serving-скрипте.

Как осуществляется тарификация в рамках сервиса?

Вычислительные ресурсы

Деплой размером 0-2 pods на 2 GPU

Время выполнения операций:

11 минут 25 секунд (округляется до целого числа минут в большую сторону)

Расчет стоимости (в рублях с учетом НДС):

\(0,06 \times 1 \times 2+0,06 \times 2 \times 3=0,48\)

Где:

  • 0,06 — стоимость GPU-секунды с учетом НДС (по тарифу AI-MLSPDPLGPUCNT0N-SS1MS0)

  • 1 или 2 — количество задействованных подов

  • 2 или 3 — время в ходе которого были активными поды

Можно ли разворачивать на сервисе собственные Docker-образы?

Данная возможность появится после реализации нами безопасных контейнеров.

Сколько регионов доступно при создании деплоев?

Имя региона

Описание региона

Christofari.V100

Деплой будет развернут на узлах суперкомпьютера Christofari. Для выбора доступны конфигурации, использующие GPU и CPU.

SR.01 (CPU, V100)

Деплой будет развернут на инстансе SberCloud.Advanced. Для выбора доступны конфигурации, использующие GPU и CPU или только CPU.

Какие существуют способы регулирования расходов?

Можно установить лимит расхода денежных средств, за рамки которого пользователь не сможет выйти в отчетном периоде (все задачи пользователя будут приостановлены).

Для чего подходит сервис?

Сервис позволяет разворачивать модели искусственного интеллекта на базе инфраструктуры SberCloud для дальнейшего обращения к моделям посредством API запросов от автоматизированных систем.