Это модель для задач классификации и регрессии, которая может работать в zero-shot режиме: без отдельного обучения под каждый новый датасет. Идея в том, чтобы упростить классический табличный ML, где обычно приходится вручную подбирать признаки, настраивать модели и отдельно обучать XGBoost, Random Forest или другие алгоритмы. TabFM работает через in-context learning: получает примеры строк, видит структуру таблицы и сразу делает прогноз для новых данных. Google обучала модель на сотнях миллионов синтетических таблиц, чтобы она лучше понимала разные типы колонок, связей и задач. Самое интересное - TabFM появится в BigQuery ML. Это значит, что прогнозы можно будет запускать прямо через SQL с AI.PREDICT. Табличный ML становится ближе к формату: загрузил данные, написал запрос, получил прогноз. https://research.google/blog/introducing-tabfm-a-zero-shot-foundation-model-for-tabular-data/
⚡️ Google представила TabFM - foundation model для табличных данных
ВчераВчера
25
~1 мин