Поиск данных, которые необходимы для вашей задачи, может занимать много времени. Существует несколько платформ для обмена данными, которые предоставляют широкий спектр наборов данных, но они не содержат в себя наборы данных для конкретных областей исследований. Вот почему я создал список репозиториев данных, которые могут вам помочь найти любой набор данных без поиска в Интернете. Один репозиторий данных состоит из нескольких наборов данных для исследования всей области.
Коллекция репозиториев данных разделена на 2 части, которые входят в состав 20 категорий, основанных на различных типах. Большинство источников данных, находящихся ниже, бесплатны. На сбор репозиториев, в хорошем качестве и легко загружаются, у меня ушло более 2-х недель.
Сельское хозяйство
В этой категории наборы данных в основном связаны с мониторингом урожая, индексами дистанционного зондирования, размером зерна, геохимией, анализом почвы и отложений. Наборы данных в основном представлен в табличной форме, но вы также можете найти визуальные данные для мониторинга посевов и обнаружения сорняков на полях.
Аудио
Аудио-репозитории богаты и могут использоваться для автоматического распознавания речи, преобразования текста в речь, классификации песен, обнаружения эмоций, перевода и многих других задач НЛП. Это золотая жила для любых начинающих кодеров или компаний среднего размера для разработки современных решений.
Биология
Категория биологии в основном состоит из даных о клетках, раковых клетках, типов геномов, генов и структуры белков. Вы можете использовать их для создания новых штаммов вирусов или придумать спасительные лекарства)) Большинство наборов данных предназначены для исследовательских целей и могут быть легко загружены в ваши модели.
Климат
Эти репозитории содержат спутниковые изображения, временные ряды данных о ветрах и температуре, историю погоды и пространственные климатические данные. Вы можете использовать наборы данных для прогнозирования погоды, отслеживания последствий глобального потепления и обнаружения стихийных бедствий.
Компьютерное зрение
Компьютерное зрение пользуется большим спросом. Компании разрабатывают всевозможные решения для улучшения текущих алгоритмов или создания новых , таких как управление складом, беспилотные автомобили, распознавание лиц, генеративное искусство и роботы.
Экономика
Данные мировой экономики состоят из торговой статистики, индекса человеческого развития, геопространственных данных о запасах продовольствия и макроэкономических данных. Вы можете использовать их для анализа текущего торгового дефицита и прогнозирования развития стран.
Образование
В образовательной категории вы можете найти данные об оценках учащихся, табелях успеваемости, успеваемости в колледже, количестве выпускников и опросах, заполненных отдельными учащимися, директорами школ и родителями.
Энергия
Категория энергии содержит данные о глобальном энергопотреблением, данными с интеллектуальных счетчиков, данные из различных мощностей производства энергии электростанцией. Мы можем использовать их для разработки стратегии внедрения возобновляемых источников энергии, экономии затрат на электроэнергию и разработку плана удовлетворения высокого спроса на глобальное потребление энергии.
Финансы
В этом разделе можно найти данные о долгах, банковскую статистику, ВВП, курс валют, потребительские цены и многое другое. Финансы являются основой современной экономики, и для создания стабильной экономики мы можем использовать эти данные для прогнозирования следующего финансового кризиса, выявления преступлений и прогнозирования цен на акции.
Правительство
Вы можете найти здесь правительственные данные по любой стране, штату или даже округу. Многие правительственные чиновники способствуют справедливости и инклюзивности, делясь данными с общественностью. Наиболее известные наборы данных получены из США, Индии, Канады, Новой Зеландии и ООН. Эти данные содержат все виды информации от преступности до продовольственной безопасности.