Hopsworks:
A feature store is a data platform that supports the development and operation of ML systems by managing the storage and efficient querying of feature data. Feature store (…) supports a multitude of write and read workloads, including batch and streaming writes (…).
Feast:
Customizable operational data system that re-uses existing infrastructure to manage and serve ML features to realtime models
Amazon SageMaker:
Storage and data management layer (…) serves as the single source of truth to store, retrieve, remove, track, share, discover, and control access to features.
hopsworks:
(больше зависят от вендора)
Feature Store Architecture (can be):
Для хранения сырых данных лучше использовать отдельное хранилище с высокой надежностью.
Концепт семантического объединения данных.
Функции преобразования данных.
Концепт переиспользования данных.
Основная идея: не делать model transformations в feature pipeline
Искажение между обработкой (форматом) реальных данных, приходящих с запросом и обработкой (форматом) исторических данных.
Концепт актуальности/свежести данных.
Feature Store - полезный элемент ML инфраструктуры, который поможет быстро и централизованно обрабатывать сырые данные и упростит работу ML-команды.