Тарификация

Тарификация Data Catalog
Пример расчета стоимости Data Catalog
Тарификация Environments
Примеры расчета стоимости Еnvironments
Тарификация Deployments
Примеры расчета стоимости Deployments
- Deployments

При работе с платформой ML Space оплата осуществляется за фактическое использование вычислительных ресурсов.

Примечание

Единицы тарификации округляются в большую сторону (Environments, Data Catalog). Тарификация Environments. Если объем занятой информации на хранилище составил 900 МБ, то сумма списания будет за 1 ГБ. Пример расчета стоимости Data Catalog.
Если на Deployments не выполняются вычисления — экземпляры деплоя не активны (минимальное количество экземпляров при создании деплоя установлено 0), тарификация не осуществляется. При посекундной тарификации округление в большую не осуществляется. Например, экземпляр отработал 11 секунд, тогда сумма списания будет начислена на эти 11 секунд. Примеры расчета стоимости Deployments.

В зависимости от модулей используется следующая тарификация:

в МБ или ГБ (для Data Catalog);
посекундная (для Deployments);
поминутная (для Environments).

Конкретные условия и тарифы фиксируются в договоре, заключаемом с Cloud.ru. Возможны специальные тарифы, в рамках которых к описанным условиям применяются дополнительные ограничения.

Тарификация Data Catalog 

Тарифицируемая функциональность	Единица тарификации	Комментарий
Хранилище S3	1 ГБ/месяц	Тарифицируется хранимый объем в ГБ за расчетный период. Объемом хранимых в течение месяца данных считается среднее значение за месяц. Минимальная единица тарификации — 1 ГБ. Счет выставляется в конце месяца по факту потребления. Цены за ГБ в месяц фиксированы и не зависят от количества дней в месяце.
Быстрое хранилище NFS	1 ГБ	Оплачивается объем хранилища сверх бесплатно предоставляемых 10 ГБ на каждый воркспейс. Тарификация посуточная, списание с лицевого счета производится в 00 часов по московскому времени. Счет выставляется в конце месяца по факту потребления. Тарификация хранимого объема на NFS (сверх бесплатных 10 ГБ) рассчитывается посуточно. Расчет тарифов приведен в разделе Пример расчета стоимости Data Catalog. Для коротких месяцев цена за день будет выше, для длинных — ниже. При создании в каждый воркспейс монтируется NFS-хранилище с лимитом в 10 ГБ. Возможно увеличить лимит самостоятельно или через обращение в техническую поддержку.

Пример расчета стоимости Data Catalog 

Data Catalog

Для хранилища S3

Дата

Объем

Расчет

Количество дней хранения

01.01.2021

0,9 ГБ (округляем до 1 ГБ при расчете)

\(1,2 \times 1 \div 31 = 0,039\) (за день)

31

15.01.2021

15 ГБ

\(1,2 \times 15 \div 31 = 0,581\) (за день)

16

31.01.2021

119,6 ГБ (округляем до 120 ГБ при расчете)

\(1,2 \times 120 \div 31 = 4,645\) (за день)

1

Итоговая сумма за месяц: \((1,2 \times 120 \div 31) \times 31 + (1,2 \times 15 \div 31) \times 16 + (1,2 \times 120 \div 31) \times 1 = 15,15\).

Где:

1,2 — стоимость 1 ГБ в примере.

Для хранилища NFS

Дата

Объем

Расчет

Количество дней хранения

01.01.2021

10 ГБ (бесплатный объем)

Бесплатный объем

31

15.01.2021

15 ГБ

\(20 \times 15 \div 31 = 9,677\) (за день)

16

31.01.2021

119,6 ГБ (округляем до 120 ГБ при расчете)

\(20 \times 120 \div 31 = 77,419\) (за день)

1

Итоговая сумма за месяц: \((20 \times 15 \div 31) \times 16 + (20 \times 120 \div 31) \times 1 = 104,096\).

Где:

20 — стоимость 1 ГБ, свыше бесплатных 10 ГБ в примере.

Тарификация Environments 

Фактическую стоимость задачи можно посмотреть на вкладке Задачи и окружения.

Тарифицируемая функциональность

Единица тарификации

Конфигурации

Комментарий

Jupyter Server с GPU

GPU-минута

Минимальная конфигурация: 1 GPU Tesla V100 32 GB, 3 CPU cores, 94 GB RAM.

Остальные конфигурации = минимальная * N, где N= от 2 до 16 (в рамках одного DGX-2).

CPU и RAM на данный момент выделяются пропорционально количеству используемых GPU.

Обратите внимание на то, что конфигурации с возможностью гибкой настройки количества CPU и RAM будут доступны позднее.

Тариф за GPU-минуту зависит от количества аллоцированных GPU:

1-8 GPU — Тарифы на услуги и Договор с Cloud.ru.

9+ GPU — Тарифы на услуги.

Тарификация ресурсов начинается после изменения статуса Jupyter Server на «Подключен».

Задача на N GPU

GPU-минута

Минимальная конфигурация: 1 GPU Tesla V100 32 GB, 3 CPU cores, 94 GB RAM.

Остальные конфигурации = минимальная * N, где N= от 2 до 1000.

CPU и RAM на данный момент выделяются пропорционально количеству используемых GPU.

Тарификация начинается в момент старта обучения, когда задача переходит в статус «Running». Тариф за GPU-минуту зависит от количества аллоцированных GPU:

1-8 GPU — Тарифы на услуги и Договор с Cloud.ru.

9+ GPU — Тарифы на услуги.

Jupyter со Spark

СPU-минута

Spark на CPU (cpu-ai-small, 4vCPU, 16 GB)
Spark на CPU (cpu-ai-middle, 8vCPU, 32 GB)
Spark на CPU (cpu-ai-large, 12 vCPU, 48 GB)
Spark на CPU (cpu-ai-giant, 24 vCPU, 96 GB)

Аллоцируемые ресурсы Driver и Executor тарифицируются с момента создания Jupyter Server со Spark, то есть после изменения статуса на «Подключен». Таким образом, тарификация использования Spark идет с момента, когда все заказанные узлы доступны пользователю.

Сервер с доступом к Spark тарифицируется все время существования до остановки. Тарифицируется как использование ресурсов, на которых запущен Spark Driver, так и ресурсов, на которых выполняются Spark Executor-ы, стоимость использования которых вычисляется как стоимость использования одного Spark Executor заданной конфигурации * Количество Executor.

Тариф на CPU-минуту зависит от количества аллоцированных CPU.

Примеры расчета стоимости Еnvironments 

Jupyter Server с 8 GPU

Вычислительные ресурсы:

Jupyter Server с GPU (на 8 GPU).

Время выполнения операций:

11 минут 25 секунд (округляется до целого числа минут в большую сторону).

Расчет стоимости (в рублях с учетом НДС):

\(3 \times 8 \times 12=288\)

Где:

3 — стоимость GPU-минуты с учетом НДС в примере.
8 — количество GPU-ядер.
12 — количество минут, которые проработала задача.

Jupyter Server с 10 GPU

Вычислительные ресурсы:

Jupyter Server с 10 GPU.

Время выполнения операций:

11 минут 25 секунд (округляется до целого числа минут в большую сторону).

Расчет стоимости (в рублях с учетом НДС):

\(15 \times 10 \times 12=1800\)

Где:

15 — стоимость GPU-минуты с учетом НДС в примере.
10 — количество GPU-ядер.
12 — количество минут, которые проработала задача.

Jupyter со Spark с CPU (окружение)

Вычислительные ресурсы

Jupyter со Spark с CPU (окружение) состоит из двух частей

Ресурсы Driver — cpu-ai-small (4 vCPU, 16 GB);
ресурсы Executor (2 единицы) — cpu-ai-middle (8 vCPU, 32 GB).

Время выполнения операций

11 минут 25 секунд (округляется до целого числа минут в большую сторону)

Расчет стоимости (в рублях с учетом НДС):

\((0,14+0,29 \times 2) \times 12=8,64\)

Где:

0,14 — стоимость CPU-минуты с учетом НДС (по тарифу).
0,29 — стоимость CPU-минуты с учетом НДС (по тарифу).
2 — количество Executor.
12 — количество минут, которые проработала задача.

Задача на 2 GPU

Вычислительные ресурсы:

Задача на 2 GPU.

Время выполнения операций:

11 минут 25 секунд (округляется до целого числа минут в большую сторону).

Расчет стоимости (в рублях с учетом НДС):

\(3 \times 2 \times 12=72\)

Где:

3 — стоимость GPU-минуты с учетом НДС в примере.
2 — количество GPU-ядер.
12 — количество минут, которые проработала задача.

Тарификация Deployments 

Тарифицируемая функциональность

Конфигурации (instance_type)

Комментарий

Inference на GPU

Минимальная конфигурация: 1 GPU Tesla V100 32 GB, 3 CPU cores, 94 GB RAM. Остальные конфигурации = минимальная * N * P, где: N — количество экземпляров конфигурации 1 GPU Tesla V100 32 GB, 3 CPU cores, 94 GB RAM, на которых запускается микросервис. N = от 1 до 16, P — минимальное и максимальное количество экземпляров для масштабирования экземпляров микросервиса и количество GPU, которые будут использоваться сервисом. Минимальное количество экземпляров изменяется в интервале от 0 до 100, максимальное — от 1 до 100.

При задании количества экземпляров деплоя равным нулю их запуск производится в момент получения запроса к API сервиса. При отсутствии запросов к модели активные экземпляры деплоя будут отсутствовать, тарификация не осуществляется.

При задании минимального количества экземпляров деплоя (не равного нулю) всегда будет запущено минимальное количество экземпляров, таким образом, тарифицируется время их постоянной работы.

Обратите внимание на то, что если в коде пользователя ошибка, деплой модели упадет с ошибкой. При этом экземпляр с моделью не будет остановлен, и тарификация будет идти до момента удаления деплоя пользователем. Эту ситуацию можно отследить в логах.

Inference на CPU (тарификация планируется позже)

Минимальная конфигурация (на выбор):

cpu-ai-small - 4 vCPU, 16 GB RAM
cpu-ai-middle - 8 vCPU, 32 GB RAM
cpu-ai-large - 12 vCPU, 48 GB RAM
cpu-ai-giant - 24 vCPU, 96 GB RAM

Остальные конфигурации = минимальная * N * P, где: N — количество экземпляров конфигурации, на которых запускается микросервис, P — минимальное и максимальное количество экземпляров для масштабирования экземпляров микросервиса и количество GPU, которые будут использоваться сервисом. Минимальное количество экземпляров изменяется в интервале от 0 до 100, максимальное — от 1 до 100.

Тарификация — посекундная.

Тарификация осуществляется за время работы экземпляров деплоя.

При задании количества экземпляров деплоя равным нулю их запуск производится в момент получения запроса к API сервиса. При отсутствии запросов к модели активные экземпляры деплоя будут отсутствовать, тарификация не осуществляется.

При задании минимального количества экземпляров деплоя (не равного нулю) всегда будет запущено минимальное количество экземпляров, таким образом, тарифицируется время их постоянной работы.

Обратите внимание на то, что если в коде пользователя ошибка, деплой модели упадет с ошибкой. При этом экземпляр с моделью не будет остановлен, и тарификация будет идти до момента удаления деплоя пользователем. Эту ситуацию можно отследить в логах.

Примеры расчета стоимости Deployments 

Примечание

Если первое значение в поле Количество экземпляров равно нулю, при отсутствии обращений к деплою произойдет его гибернация. Время выхода из гибернации составляет до пяти минут при наличии свободных ресурсов в регионе размещения.
Особенностью работы автоскейлинга при уменьшении количества экземпляров деплоя является остановка ресурсов, которая занимает 5-10 минут. Время остановки тарифицируется.

Deployments 

Деплой размером 1-4 пода на 5 GPU

Вычислительные ресурсы:

деплой размером 1-4 пода на 5 GPU.

Время жизни деплоя:

600 секунд

Время жизни экземпляров деплоя:

Экземпляр 1 = 600 секунд (время жизни первого пода равно времени жизни деплоя). Экземпляр 2 = 200 секунд. Экземпляр 3 = 400 секунд. Экземпляр 4 = 550 секунд.

Расчет стоимости (в рублях):

\((600 + 200 + 400 + 550) \times 5 \times 0,06 = 525\) Где:

0,06 — стоимость GPU-секунды.
5 — количество GPU на один экземпляр деплоя.

См.также

Тарификация

Тарификация Data Catalog

Пример расчета стоимости Data Catalog

Тарификация Environments

Примеры расчета стоимости Еnvironments

Тарификация Deployments

Примеры расчета стоимости Deployments

Deployments

Была ли статья полезной?

Тарификация Data Catalog 

Пример расчета стоимости Data Catalog 

Тарификация Environments 

Примеры расчета стоимости Еnvironments 

Тарификация Deployments 

Примеры расчета стоимости Deployments 

Deployments 