Вопросы и ответы про AI Marketplace
Вопросы в этом разделе
Что включает в себя AI Services?
AI Services включает в себя разнообразный набор сервисов машинного обучения с широкой подборкой обученных моделей, которые можно интегрировать в приложения, веб-сервисы.
Что такое DataHub?
DataHub — маркетплейс артефактов (датасеты, модели, контейнеры) для глубокого и машинного обучения на платформе ML Space. На данный момент представлен юридически чистый партнерский контент по модели freemium.
Что такое ruGPT-3?
ruGPT-3 — это нейросеть, обученная более чем на 600 ГБ открытых данных: Википедии, художественной литературе, диалогах, программном коде. Нейросеть предназначена для продолжения фразы пользователя, или «затравки», в виде программного кода, текстов на русском и частично на английском языках. Модели ruGPT-3 это:
760 млн параметров (ruGPT-3 Large).
1.3 млрд параметров (ruGPT-3 XL).
13 млрд параметров (ruGPT-3 13B).
Для чего можно использовать ruGPT-3?
Нейросеть позволяет пользователям решать следующие бизнес-задачи:
Cоздание рекомендательных систем (рекомендации фильмов, музыки и т.д.).
Генерация отзывов (например, для бытовой техники, гаджетов и т.д.).
Cоздание вопросно-ответной системы для русского StackOverflow.
Создание диалоговых систем (например, консультант у провайдера).
Более подробно с моделями можно познакомиться на Github. Примеры использования API приведены в разделе Обучающие материалы. Для тестирования модели можно перейти по следующей ссылке.
Как развернуть модель ruGPT-3 на сервисе Deployments?
Модель ruGPT-3 (13 миллиардов параметров) можно развернуть на сервисе Deployments. Для этого:
Нажать кнопку Создать деплой на карточке модели.
Задать необходимое количество
pods
.Нажать кнопку Создать деплой. Деплой будет создан автоматически.
Какие еще модели обучались или можно обучить на Christofari?
Датасет Golos — это размеченный вручную набор речевых данных на русском языке, включающий 1240 часов аудиоданных, а также обученную на них модель распознавания речи, которая показывает точность, сравнимую с человеческой. Датасет доступен к добавлению на бакет S3 (см. Загрузка и хранение данных).