Устранение неполадок при обучении сервисов
Если во время обучения сервиса произошла ошибка, изучите логи обучения. Они находятся на вкладке История событий на странице вашего сервиса:

При разборе ошибок обучения, прежде всего, обратите внимание на сообщения с меткой ERROR, особенно те, которые начинаются с Error processing FIT request. Из них вы можете узнать причину проблемы. Например, сообщение Error processing FIT request: Instance was removed указывает на то, что сервис не смог обучиться, потому что активный инстанс был остановлен.
Содержание
- Ошибки некомпозитных сервисов
- Некорректный формат датасета
- Повышенное потребление ресурсов обучаемым сервисом
- Повышенное потребление ресурсов другими сервисами
- Обучение зависло в состоянии WAIT_FOR_START
- Ошибка конфигурации сервиса
- Внутренняя ошибка сервиса
- Внутренняя ошибка Caila
- Ошибки композитных сервисов
- Недоступность публичного сервиса
- Ошибки при запуске производных сервисов
Ошибки некомпозитных сервисов
Некорректный ф ормат датасета
При обучении передается датасет с некорректным содержимым, либо формат датасета не соответствует тому, что ожидает сервис.
Диагностика
Сообщение об ошибке указывает на то, что сервис не смог преобразовать датасет к требуемому типу, либо на наличие неожиданного символа при парсинге датасета (например, если он в формате JSON).
Рекомендации
- Исправьте датасет, следуя подсказкам в тексте ошибки.
- Выполните обучение на другом датасете, желательно меньшего размера.
- Проверьте, что тип датасета, который вы передаете при обучении, совместим с тем, что ожидает сервис.
Повышенное потребление ресурсов обучаемым сервисом
Сервисы потребляют разное количество ресурсов при обучении на датасетах разных размеров. Если превышены установленные лимиты, обучение автоматически прерывается.
Диагностика
- В истории событий есть сообщение Error processing FIT request: Instance was removed или Instance closed connection, но отсутствует сообщение Instance <instance_id> was evicted within <scope> scope.
- На вкладке Диагностика в списке событий указано, что потребление памяти инстанса, который участвует в обучении, достигло значения Максимальный лимит ресурсов, или что он был вытеснен.
- Обучение проходит успешно на маленьком датасете, но не проходит на большом.
Рекомендации
Увеличьте лимиты ресурсов для сервиса. Обычно быстрее всего заканчиваются лимиты на память и место на диске.