Вопросы и ответы про AI Marketplace

Что включает в себя AI Services?

AI Services включает в себя разнообразный набор сервисов машинного обучения с широкой подборкой обученных моделей, которые можно интегрировать в приложения, веб-сервисы.

Что такое DataHub?

DataHub — маркетплейс артефактов (датасеты, модели, контейнеры) для глубокого и машинного обучения на платформе ML Space. На данный момент представлен юридически чистый партнерский контент по модели freemium.

Что такое ruGPT-3?

ruGPT-3 — это нейросеть, обученная более чем на 600 ГБ открытых данных: Википедии, художественной литературе, диалогах, программном коде. Нейросеть предназначена для продолжения фразы пользователя, или «затравки», в виде программного кода, текстов на русском и частично на английском языках. Модели ruGPT-3 это:

  • 760 млн параметров (ruGPT-3 Large).

  • 1.3 млрд параметров (ruGPT-3 XL).

  • 13 млрд параметров (ruGPT-3 13B).

Для чего можно использовать ruGPT-3?

Нейросеть позволяет пользователям решать следующие бизнес-задачи:

  1. Cоздание рекомендательных систем (рекомендации фильмов, музыки и т.д.).

  2. Генерация отзывов (например, для бытовой техники, гаджетов и т.д.).

  3. Cоздание вопросно-ответной системы для русского StackOverflow.

  4. Создание диалоговых систем (например, консультант у провайдера).

Более подробно с моделями можно познакомиться на Github. Примеры использования API приведены в разделе Обучающие материалы. Для тестирования модели можно перейти по следующей ссылке.

Как развернуть модель ruGPT-3 на сервисе Deployments?

Модель ruGPT-3 (13 миллиардов параметров) можно развернуть на сервисе Deployments. Для этого:

  1. Нажать кнопку Создать деплой на карточке модели.

  2. Задать необходимое количество pods.

  3. Нажать кнопку Создать деплой. Деплой будет создан автоматически.

Какие еще модели обучались или можно обучить на Christofari?

Датасет Golos — это размеченный вручную набор речевых данных на русском языке, включающий 1240 часов аудиоданных, а также обученную на них модель распознавания речи, которая показывает точность, сравнимую с человеческой. Датасет доступен к добавлению на бакет S3 (см. Обзор хранилища (Файловый менеджер)).