Тарификация

Из чего складывается стоимость использования платформы ML Space

При работе с платформой ML Space оплата осуществляется за фактическое использование вычислительных ресурсов.

Общие сведения о тарификации:

  • Единицы тарификации округляются в большую сторону. При посекундной тарификации округление в большую не осуществляется. Если расчет модели занял 11 минут и 25 секунд, то сумма списания будет за 12 минут. Пример расчета см. Тарификация Environments. Если объем занятой информации на хранилище составил 900 Мб, то сумма списания будет за 1 ГБ. Пример расчета см. Пример расчета стоимости сервиса Data catalog.

  • Если на Deployments не выполняются вычисления — под не активен (минимальное количества подов при создании деплоя установлено 0), тарификация не осуществляется. Например, под отработал 11 секунд, то сумма списания будет за 11 секунд. Пример расчета см. Примеры расчета стоимости сервиса Deployments.

  • В сервисе AutoML тарификация осуществляется по времени работы модели. Если расчет модели занял 11 минут и 25 секунд, то сумма списания будет за 12 минут. Пример расчета см. Примеры расчета стоимости сервиса AutoML.

В зависимости от сервисов используется следующая тарификация:

  • в МБ или ГБ (для сервиса Data Catalog);

  • посекундная (для сервиса Deployments);

  • поминутная (для Environments, AutoML).

В данном разделе описаны общие принципы тарификации ML Space. Конкретные условия и тарифы фиксируются в договоре, заключаемом со SberCloud. Возможны специальные тарифы, в рамках которых к описанным условиям применяются дополнительные ограничения. Тарифицируемые единицы распределены по функциональным модулям продукта ML Space. Подробнее про тарификацию см. тарифы на услуги (страницы 13-14).

Тарификация Data Catalog

Тарифицируемая функциональность

Плановая единица тарификации

Комментарий

Хранилище S3

1 ГБ/месяц

Тарифицируется хранимый объем в ГБ за расчетный период. Объемом хранимых в течение месяца данных считается среднее значение за месяц. Минимальная единица тарификации — 1 ГБ. Счет выставляется в конце месяца по факту потребления. Цены за ГБ в месяц фиксированы и не зависят от количества дней в месяце.

Быстрое хранилище NFS

1 ГБ

Оплачивается объем хранилища сверх бесплатно предоставляемых 10 ГБ на каждый workspace. Тарификация посуточная, списание с лицевого счета производится в 00 часов по московскому времени. Счет выставляется в конце месяца по факту потребления. Тарификация хранимого объема на NFS (сверх бесплатных 10 ГБ) рассчитывается посуточно. Расчет тарифов приведен в разделе Пример расчета стоимости сервиса Data catalog. Для более коротких месяцев цена за день будет выше, для более длинных — ниже. При создании в каждый workspace монтируется NFS-volume с лимитом в 10 ГБ. Пользователь может увеличить лимит через обращение в окне Техподдержки (для создания обращения в техническую поддержку см. Техническая поддержка) в платформе ML Space.

Тарификация Environments

Фактическую стоимость задачи можно посмотреть на вкладке Задачи.

Тарифицируемая функциональность

Eдиница тарификации

Конфигурации

Комментарий

Jupyter Server с GPU

GPU-минута

Минимальная конфигурация: 1 GPU Tesla V100 32 GB, 3 CPU cores, 94 GB RAM.

Остальные конфигурации = минимальная * N, где N= от 2 до 16 (в рамках одного DGX-2).

CPU и RAM на данный момент выделяются пропорционально количеству используемых GPU.

Обратите внимание на то, что конфигурации с возможностью гибкой настройки количества CPU и RAM будут доступны позднее.

Тариф за GPU-минуту зависит от количества аллоцированных GPU:

  • 1-8 GPU — Подробнее про тарификацию см. тарифы на услуги (страницы 13-14) (услуга AI-MLSPENVCHRJOB8N-TS1MS0) и Договор со SberCloud.

  • 9+ GPU — Подробнее про тарификацию см. тарифы на услуги (страницы 13-14) (услуга AI-MLSPENVCHRJOB9N-TS1MS0).

Тарификация ресурсов начинается после изменения статуса Jupyter Server на «Подключен».

Задача на N GPU (методы класса job библиотеки client_lib)

GPU-минута

Минимальная конфигурация: 1 GPU Tesla V100 32 GB, 3 CPU cores, 94 GB RAM.

Остальные конфигурации = минимальная * N, где N= от 2 до 1000).

CPU и RAM на данный момент выделяются пропорционально количеству используемых GPU.

Тарификация начинается в момент старта обучения (задача обучения переходит в статус «Running»). Тариф за GPU-минуту зависит от количества аллоцированных GPU:

  • 1-8 GPU — Подробнее про тарификацию см. тарифы на услуги (страницы 13-14) (услуга AI-MLSPENVCHRJOB8N-TS1MS0) и Договор со SberCloud.

  • 9+ GPU — Подробнее про тарификацию см. тарифы на услуги (страницы 13-14) (услуга AI-MLSPENVCHRJOB9N-TS1MS0).

Задача AutoML на N GPU (методы класса job библиотеки client_lib)

GPU-минута

Минимальная конфигурация: 1 GPU Tesla V100 32 GB, 3 CPU cores, 94 GB RAM.

Остальные конфигурации = минимальная * N, где N= от 2 до 1000).

CPU и RAM на данный момент выделяются пропорционально количеству используемых GPU.

Тарификация начинается в момент старта обучения (задача обучения переходит в статус «Running»). Тариф за GPU-минуту зависит от количества GPU:

  • 1-8 GPU — Подробнее про тарификацию см. тарифы на услуги (страницы 13-14) (услуга AI-MLSPENVCHRJOB8N-TS1MS0) и Договор со SberCloud.

  • 9+ GPU — Подробнее про тарификацию см. тарифы на услуги (страницы 13-14) (услуга AI-MLSPENVCHRJOB9N-TS1MS0).

Jupyter со Spark

СPU-минута

  • Spark на CPU (cpu-ai-small, 4vCPU, 16 GB)

  • Spark на CPU (cpu-ai-middle, 8vCPU, 32 GB)

  • Spark на CPU (cpu-ai-large, 12 vCPU, 48 GB)

  • Spark на CPU (cpu-ai-giant, 24 vCPU, 96 GB)

Аллоцируемые ресурсы Driver и Executor тарифицируются с момента создания Jupyter Server со Spark (после изменения статуса на «Подключен»). Таким образом, тарификация использования кластера Spark идет с момента, когда все заказанные узлы доступны пользователю.

Кластер Spark тарифицируется все время существования до остановки кластера. В рамках кластера тарифицируется как использование ресурсов, на которых запущен Spark Driver, так и ресурсов, на которых выполняются Spark Executor-ы, стоимость использования которых вычисляется как стоимость использования одного Spark Executor заданной конфигурации * Количество Executor.

Тариф на CPU-минуту зависит от количества аллоцированных CPU. Подробнее про тарификацию см. тарифы на услуги (страницы 13-14).

Услуги:

  • AI-MLSPSPACPUSMALN-TS1MS0

  • AI-MLSPSPACPUMIDDN-TS1MS0

  • AI-MLSPSPACPULARGN-TS1MS0

  • AI-MLSPSPACPUGIANN-TS1MS0

Тарификация Intel® oneAPI

Для физических лиц услуга Intel® oneAPI предоставляется бесплатно.

Для юридических лиц тарификация конфигураций осуществляется в соответствии с условиями договора, по следующим SKU:

Конфигурация

Тариф

CPU — 2, 16 Гб оперативной памяти.

AI-MLSPIOACPUMEISN-TS1MS0

CPU — 16, 128 Гб оперативной памяти.

AI-MLSPIOACPUMEIMN-TS1MS0

CPU — 60, 512 Гб оперативной памяти.

AI-MLSPIOACPUMEIGN-TS1MS0

CPU — 8, GPU — 1.

AI-MLSPIOAGPUMEIUN-TS1MS0

Тарификация Deployments

Тарифицируемая функциональность

Конфигурации

Комментарий

Inference на GPU

Минимальная конфигурация: 1 GPU Tesla V100 32 GB, 3 CPU cores, 94 GB RAM. Остальные конфигурации = минимальная * N * P, где: N — количество экземпляров конфигурации 1 GPU Tesla V100 32 GB, 3 CPU cores, 94 GB RAM, на которых запускается микросервис. N = от 1 до 16, P — количество pods для горизонтального масштабирования экземпляров микросервиса. Количество pods может динамически изменяться в процессе эксплуатации деплоя. Минимальное количество pods изменяется в интервале от 0 до 100, максимальное — от 1 до 100. Подробнее про тарификацию см. тарифы на услуги (страницы 13-14).

Услуга: AI-MLSPDPLGPUCNT0N-SS1MS0

При задании количества pods = 0 их запуск производится в момент получения запроса к API сервиса. При отсутствии запросов к модели активные pods будут отсутствовать, тарификация не осуществляется.

При задании минимального количества pods (не равного нулю) всегда будет запущено минимальное количество pods, таким образом, тарифицируется время их постоянной работы.

При увеличении количества запущенных pods в случае масштабирования, тарификация осуществляется в соответствии с количеством запущенных pods.

Обратите внимание на то, что если в коде пользователя ошибка, деплой модели упадет с ошибкой. При этом pod с моделью не будет остановлен, и тарификация будет идти до момента удаления деплоя пользователем. Эту ситуацию можно отследить в логах.

Inference на CPU (тарификация планируется позже)

Минимальная конфигурация (на выбор):

  • cpu-ai-small - 4 vCPU, 16 GB RAM

  • cpu-ai-middle - 8 vCPU, 32 GB RAM

  • cpu-ai-large - 12 vCPU, 48 GB RAM

  • cpu-ai-giant - 24 vCPU, 96 GB RAM

Остальные конфигурации = минимальная * N * P, где: N — количество экземпляров конфигурации, на которых запускается микросервис, P — количество pods для горизонтального масштабирования экземпляров микросервиса. Количество pods может динамически изменяться в процессе эксплуатации деплоя. Минимальное количество pods изменяется в интервале от 0 до 100, максимальное — от 1 до 100.

Тарификация осуществляется посекундно. Подробнее про тарификацию см. тарифы на услуги (страницы 13-14).

Услуги:

  • AI-MLSPDPLCPUML01N-SS1MS0

  • AI-MLSPDPLCPUID01N-SS1MS0

  • AI-MLSPDPLCPUAR01N-SS1MS0

  • AI-MLSPDPLCPUIA01N-SS1MS0

Тарификация осуществляется за время работы pods.

При задании количества pods = 0 их запуск производится в момент получения запроса к API сервиса. При отсутствии запросов к модели активные pods будут отсутствовать, тарификация не осуществляется.

При задании минимального количества pods (не равного нулю) всегда будет запущено минимальное количество pods, таким образом, тарифицируется время их постоянной работы.

При увеличении количества запущенных pods в случае масштабирования, тарификация осуществляется в соответствии с количеством запущенных pods.

Обратите внимание на то, что если в коде пользователя ошибка, деплой модели упадет с ошибкой. При этом pods с моделью не будет остановлен, и тарификация будет идти до момента удаления деплоя пользователем. Эту ситуацию можно отследить в логах.

Пример расчета стоимости сервиса Data catalog

Data catalog

Для хранилища S3

Дата

Объем

Расчет

Количество дней хранения

01.01.2021

0,9 ГБ (округляем до 1 ГБ при расчете)

\(1,2 \times 1 \div 31 = 0,039\) (за день)

31

15.01.2021

15 ГБ

\(1,2 \times 15 \div 31 = 0,581\) (за день)

16

31.01.2021

119,6 ГБ (округляем до 120 ГБ при расчете)

\(1,2 \times 120 \div 31 = 4,645\) (за день)

1

Итоговая сумма за месяц: \((1,2 \times 120 \div 31) \times 31 + (1,2 \times 15 \div 31) \times 16 + (1,2 \times 120 \div 31) \times 1 = 15,15\).

Где:

1,2 — стоимость 1 ГБ (по тарифу AI-MLSPST3NNNSIZEN-MS1MS0)

Для хранилища NFS

Дата

Объем

Расчет

Количество дней хранения

01.01.2021

10 ГБ (бесплатный объем)

Бесплатный объем

31

15.01.2021

15 ГБ

\(20 \times 15 \div 31 = 9,677\) (за день)

16

31.01.2021

119,6 ГБ (округляем до 120 ГБ при расчете)

\(20 \times 120 \div 31 = 77,419\) (за день)

1

Итоговая сумма за месяц: \((20 \times 15 \div 31) \times 16 + (20 \times 120 \div 31) \times 1 = 104,096\).

Где:

20 — стоимость 1 ГБ, свыше бесплатных 10 ГБ (по тарифу AI-MLSPNFSNNNSIZEN-MS1MS0).

Подробнее про тарификацию см. тарифы на услуги (страницы 13-14).

Примеры расчета стоимости сервиса Еnvironments

Еnvironments

Jupyter Server с 8 GPU
Вычислительные ресурсы:

Jupyter Server с GPU (на 8 GPU).

Время выполнения операций:

11 минут 25 секунд (округляется до целого числа минут в большую сторону).

Расчет стоимости (в рублях с учетом НДС):

\(3 \times 8 \times 12=288\)

Где:

  • 3 — стоимость GPU-минуты с учетом НДС (по тарифу AI-MLSPENVCHRJOB8N-TS1MS0).

  • 8 — количество GPU-ядер.

  • 12 — количество минут, которые проработала задача.

Jupyter Server с 10 GPU
Вычислительные ресурсы:

Jupyter Server с 10 GPU.

Время выполнения операций:

11 минут 25 секунд (округляется до целого числа минут в большую сторону).

Расчет стоимости (в рублях с учетом НДС):

\(15 \times 10 \times 12=1800\)

Где:

  • 15 — стоимость GPU-минуты с учетом НДС (по тарифу AI-MLSPENVCHRJOB9N-TS1MS0).

  • 10 — количество GPU-ядер.

  • 12 — количество минут, которые проработала задача.

Jupyter со Spark с CPU (окружение)
Вычислительные ресурсы
Jupyter со Spark с CPU (окружение) состоит из двух частей
  • Ресурсы Driver (cpu-ai-small (4 vCPU, 16 GB));

  • ресурсы Executor (cpu-ai-middle (8 vCPU, 32 GB)), количество Executor — 2.

Время выполнения операций

11 минут 25 секунд (округляется до целого числа минут в большую сторону)

Расчет стоимости (в рублях с учетом НДС):

\((0,14+0,29 \times 2) \times 12=8,64\)

Где:

  • 0,14 — стоимость CPU-минуты с учетом НДС (по тарифу AI-MLSPENVCPUENLSN-TS1MS0).

  • 0,24 — стоимость CPU-минуты с учетом НДС (по тарифу AI-MLSPENVCPUENLMN-TS1MS0).

  • 2 — количество Executor.

  • 12 — количество минут, которые проработала задача.

Задача на 2 GPU (методы класса job библиотеки client_lib)
Вычислительные ресурсы:

Задача на 2 GPU (методы класса job библиотеки client_lib).

Время выполнения операций:

11 минут 25 секунд (округляется до целого числа минут в большую сторону).

Расчет стоимости (в рублях с учетом НДС):

\(3 \times 2 \times 12=72\)

Где:

  • 3 — стоимость GPU-минуты с учетом НДС (по тарифу AI-MLSPENVCHRJOB8N-TS1MS0).

  • 2 — количество GPU-ядер.

  • 12 — количество минут, которые проработала задача.

Задача AutoML на 2 GPU (методы класса job библиотеки client_lib)
Вычислительные ресурсы:

Задача на 2 GPU (методы класса job библиотеки client_lib).

Время выполнения операций:

11 минут 25 секунд (округляется до целого числа минут в большую сторону).

Расчет стоимости (в рублях с учетом НДС):

\(3 \times 2 \times 12=72\)

Где:

  • 3 — стоимость GPU-минуты с учетом НДС (по тарифу AI-MLSPENVCHRJOB8N-TS1MS0).

  • 2 — количество GPU-ядер.

  • 12 — количество минут, которые проработала задача.

Подробнее про тарификацию см. тарифы на услуги (страницы 13-14).

Примеры расчета стоимости сервиса Deployments

Deployments

Деплой размером 0-2 pods на 2 GPU
Вычислительные ресурсы:

деплой размером 0-2 pods на 2 GPU.

Время выполнения операций:

11 минут 25 секунд (округляется до целого числа минут в большую сторону).

Расчет стоимости (в рублях с учетом НДС):

\(0,06 \times 1 \times 2+0,06 \times 2 \times 3=0,48\)

Где:

  • 0,06 — стоимость GPU-секунды с учетом НДС (по тарифу AI-MLSPDPLGPUCNT0N-SS1MS0).

  • 1 или 2 — количество задействованных pods.

  • 2 или 3 — время в ходе которого были активными pods.

Деплой размером 1-4 pods на 4 GPU
Вычислительные ресурсы:

деплой размером 1-4 pods на 4 GPU.

Время выполнения операций:

60 минут 00 секунд.

Расчет стоимости (в рублях с учетом НДС):

\((1 \times 2700+2 \times 600+3 \times 300) \times 4 \times 0,06=1152\)

Где:

  • 0,06 — стоимость GPU-секунды с учетом НДС (по тарифу AI-MLSPDPLGPUCNT0N-SS1MS0).

  • 4 — количество GPU на один pod.

  • 1, 2, 3 — количество задействованных pods.

  • 2700, 600, 300 секунд — время, в ходе которого были активными pods.

Примечание

Часть запросов поступала последовательно и была обработана постоянно активным первым pod. Часть запросов поступала параллельно и вызвала автомасштабирование до двух, а затем - до трёх pods, так, как показано на рисунке.

../_images/s__depl-tarif-logick.png

Подробнее про тарификацию см. тарифы на услуги (страницы 13-14).

Примеры расчета стоимости сервиса AutoML

AutoML

Задача AutoML на 3 GPU
Вычислительные ресурсы:

3 GPU для задачи AutoML

Время выполнения операций:

11 минут 25 секунд (округляется до целого числа минут в большую сторону).

Расчет стоимости (в рублях с учетом НДС):

\(3 \times 12 \times 3=108\)

Где:

  • 3 — стоимость GPU-минуты с учетом НДС (по тарифу AI-MLSPAMLCHRAML8N-TS1MS0).

  • 12 — количество минут, которые проработала задача.

  • 3 — количество GPU-ядер.

Задача AutoML на 10 GPU
Вычислительные ресурсы:

10 GPU для задачи AutoML

Время выполнения операций:

11 минут 25 секунд (округляется до целого числа минут в большую сторону).

Расчет стоимости (в рублях с учетом НДС):

\(15 \times 12 \times 10=1800\)

Где:

  • 15 — стоимость GPU-минуты с учетом НДС (по тарифу AI-MLSPAMLCHRAML9N-TS1MS0).

  • 12 — количество минут, которые проработала задача.

  • 10 — количество GPU-ядер.

Подробнее про тарификацию см. тарифы на услуги (страницы 13-14).