Обнаружение дрейфа

Погорелов Петр — ML Engineer

Прямое измерение Model Drift

  • Позволяет измерить дрейф модели напрямую.
  • Выполняется с помощью замера offline метрики (Precision, Recall, AUC-ROC, RMSE, …).
  • Требует оперативного получения разметки целевой величины (не всегда доступно).

Косвенное измерение Model Drift

  • Позволяет измерить дрейф модели по косвенным признакам.
  • Опирается на изменение распределения целевой величины / описательных признаков.

Обнаружение. Статистики.

Обнаружение. Статистические тесты.

Постановка:

  • Нулевая гипотеза (H0): Распределения source и target - не отличаются.
  • Альтернативная гипотеза (H1): Распределения source и target - отличаются.

Статистические тесты

  1. Непрерывные величины: тесты Смирнова-Колмогорова и Андерсена Дарлинга, бутстрап.
  2. Категориальные величины: тест Хи-квадрат.
  3. Векторные величины: тесты на базе Maximum Mean Discrepancy, Least-Squares Density Difference.

Сезонность

Пакетный и поточный мониторинг

Поточный (стримовый) мониторинг качества дрейфа

Плюсы:

  • Предоставляет оперативные данные (дрейф рассчитывается в реальном времени).
  • Позволяет настроить оперативную систему оповещений / триггеров.

Минусы:

  • Затруднительно мониторить Concept Drift, даже если целевая величина доступна в логах.
  • Технически сложно реализовать.
  • В случае сбоя потокового сервиса мониторинга, могут некорректно отработать оповещения / триггеры.
  • Чувствительность к выбросам.

Пакетный (батчевый) мониторинг качества дрейфа

Плюсы:

  • Низкая чувствительность к выбросам.
  • Позволяет строить более-сложные алгоритмы расчета метрик.
  • При наличии целевой величины в логах - можно мониторить Concept Drift.
  • Технически просто реализовать.

Минусы:

  • Не применимо для бизнес-сценариев, когда важно оперативно реагировать на деградацию модели.