Data Quality 101 (https://acl.gov/sites/default/files/programs/2020-12/DataQ101_11.20.20_508.pdf) гласит, что объем имеющихся данных ничтожен по сравнению с их качеством. В нашем распоряжении может быть почти бесконечное количество данных, но будет практически невозможно извлечь из них какую-либо полезную информацию, а тем более сделать какие-либо выводы и прогнозы на их основе, эти данные - мусор. В условиях стремительного роста количества фейков и данных, сформированных с помощью ИИ, качество тех данных, которые люди обрабатывают и на которые полагаются, становится все более острой проблемой.
Поскольку качество данных является ключом к составлению прогнозов на основе их анализа и выступает как база для алгоритмов машинного обучения, способных к адекватной работе, отправной точкой для отделения мусорных данных от качественных данных является человеческий разум. Вот почему конференции проводятся каждый год на постоянной основе для изучения расширяющихся границ управления данными и изучения новых открытий в этой динамичной области исследований.
Конференции являются важным местом в любом научном сообществе, поскольку они выступают в качестве центров деятельности, где происходит обмен идеями и представляются новые продукты. Подобные мероприятия не только продвигают ИТ-решения вперед, но и выступают площадкой для общения консультантов, аналитиков, методистов и ученых, что приводит к сотрудничеству и координации действий.
Если мы посмотрим на количество мероприятий такого типа, связанных с управлением данными и качеством данных, происходящих по всему миру, мы увидим, что более 80% из них организуются в Соединенных Штатах, в городах, которые являются лидерами научно-технического прогресса, и в качестве штаб-квартир для компаний и стартапов, работающих в этих областях. Эти площадки привлекают лучших из лучших в этой области. Вот несколько самых интересных конференций, которые прошли в 2023 году:
- Конференция по управлению основными данными и управлению данными, 9–12 мая 2023 г., Лондон, Великобритания.
- Конференция по управлению данными и качеству информации, 5–9 июня 2023 г., Сан-Диего, США.
- Snowflake Summit 26-29 июня 2023 г. в Лас-Вегасе, США.
- Databricks Summit, 26-29 июня 2023 г., Сан-Франциско, США.
Остальные 20% таких мероприятий организуются в Европе и странах Юго-Восточной Азии, таких как Таиланд и Сингапур. Существует большая вероятность того, что эти страны выступят в качестве принимающих стран из-за их более высокой привлекательности как более доступных направлений из-за ограничений на поездки различного характера.
Все эти неопровержимые доказательства, указывающие на высокую степень развития дискуссий о качестве данных на Западе, приводят к парадоксальному в отношении Российской Федерации выводу. В России работают сотни уважаемых и высококвалифицированных специалистов по анализу данных и интеллектуальному анализу данных, но в стране почти нет отраслевых конференций по данной тематике.
Такое печальное положение дел не только отделяет российских ученых от их коллег и от бесценных дискуссий и тем, обсуждаемых на таких мероприятиях, но и служит мощным стимулом для таких ученых мигрировать и обосноваться за границей, ослабляя национальный потенциал в этой жизненно важной отрасли.
Если технологии искусственного интеллекта будут активно развиваться в России, то необходимо организовывать много больше конференции по качеству данных для создания базы знаний в отраслях и поощрения местных экспертов и разработчиков.
Если вы когда-либо посещали подобные мероприятия, поделитесь своими мыслями и впечатлениями о них в комментариях. Не стесняйтесь сказать, если ваши ожидания не оправдались.