Найти в Дзене
Машинное обучение

⚡️ Google представила Groundsource: систему, которая превращает новости в данные с помощью Gemini

Google Research показала новую технологию Groundsource, которая превращает обычные новостные статьи в структурированные датасеты. Идея простая, но мощная: в мире публикуются миллионы новостей о событиях, катастрофах и происшествиях, но эти данные неструктурированы и плохо подходят для анализа. Groundsource решает эту проблему. Как это работает: 1. Gemini анализирует миллионы новостных статей 2. AI извлекает ключевые факты - место, время и тип события 3. Эти данные превращаются в структурированный датасет Первый датасет уже создан, он содержит 2.6 млн исторических случаев внезапных наводнений в 150+ странах. Ученые долго сталкивались с проблемой - для многих природных катастроф просто нет исторических данных, чтобы обучать модели. Google решила проблему неожиданным способом - использовать новостные статьи как источник данных. На основе Groundsource уже обучена модель, которая может предсказывать flash-flood наводнения до 24 часов заранее. Прогнозы публикуются в сервисе Flood Hu

⚡️ Google представила Groundsource: систему, которая превращает новости в данные с помощью Gemini

Google Research показала новую технологию Groundsource, которая превращает обычные новостные статьи в структурированные датасеты.

Идея простая, но мощная:

в мире публикуются миллионы новостей о событиях, катастрофах и происшествиях, но эти данные неструктурированы и плохо подходят для анализа.

Groundsource решает эту проблему.

Как это работает:

1. Gemini анализирует миллионы новостных статей

2. AI извлекает ключевые факты - место, время и тип события

3. Эти данные превращаются в структурированный датасет

Первый датасет уже создан,

он содержит 2.6 млн исторических случаев внезапных наводнений в 150+ странах.

Ученые долго сталкивались с проблемой - для многих природных катастроф просто нет исторических данных, чтобы обучать модели.

Google решила проблему неожиданным способом -

использовать новостные статьи как источник данных.

На основе Groundsource уже обучена модель, которая может предсказывать flash-flood наводнения до 24 часов заранее.

Прогнозы публикуются в сервисе Flood Hub, где власти и службы реагирования могут видеть зоны риска.

Что это значит для AI:

LLM начинают использоваться не только для генерации текста, а для создания новых датасетов из неструктурированной информации.

Фактически AI превращает интернет-тексты в машиночитаемые данные.

Это открывает огромные возможности:

• климат и природные катастрофы

• экономика

• медицина

• геополитика

• анализ событий в реальном времени

Следующий шаг: LLM смогут автоматически превращать любые текстовые источники в обучающие данные для ML-моделей.

https://research.google/blog/introducing-groundsource-turning-news-reports-into-data-with-gemini/

-2