Типы дрейфа

Погорелов Петр — ML Engineer

Model Drift

С течением времени распределение случайных величин (целевая величина, описательные признаки) - может меняться. На картинке ниже представлено распределение одной случайной величины в разные моменты времени (при обучении модели и спустя 14 дней после развертывания в проде).

Model Drift на примере моделирования ВВП РФ

Типы Model Drift’a

Data Drift

Совместное распределение: \(P(X, Y) = P(X)P(Y|X) = P(Y)P(X|Y)\)

  • Covariate Shift: \(P(X)\) \(P(Y|X)\)
  • Label Shift1: \(P(Y)\) \(P(X|Y)\)

Пример Covariate Shift (1)

Пример Covariate Shift (2)

Concept Drift

Совместное распределение: \(P(X, Y) = P(X)P(Y|X) = P(Y)P(X|Y)\)

  • Concept Drift: \(P(Y|X)\)

Пример Concent Drift

Изменение описательных признаков и целевой величины

  • Изменение целевой величины
    • \(\{POSITIVE, NEGATIVE\} -> \{POSITIVE, NEGATIVE, NEUTRAL\}\)
  • Изменение признаков
    • city = Moscow Msk
    • year_of_birth = 1982 82
  • Удаление старых признаков
  • Добавление новых признаков

Решение: валидация схемы с помощью Marshmallow, Pydantic.

Пример использование Pydantic для валидации входных данных