A feature store is a data platform that supports the development and operation of ML systems by managing the storage and efficient querying of feature data. Feature store (…) supports a multitude of write and read workloads, including batch and streaming writes (…).
Customizable operational data system that re-uses existing infrastructure to manage and serve ML features to realtime models
Amazon SageMaker:
Storage and data management layer (…) serves as the single source of truth to store, retrieve, remove, track, share, discover, and control access to features.
(больше зависят от вендора)
Feature Store Architecture (can be):
Для хранения сырых данных лучше использовать отдельное хранилище с высокой надежностью.
Концепт семантического объединения данных.
Функции преобразования данных.
Концепт переиспользования данных.
Основная идея: не делать model transformations в feature pipeline
Искажение между обработкой (форматом) реальных данных, приходящих с запросом и обработкой (форматом) исторических данных.
Концепт актуальности/свежести данных.
Feature Store - полезный элемент ML инфраструктуры, который поможет быстро и централизованно обрабатывать сырые данные и упростит работу ML-команды.