Недавно мы рассказывали об обновлениях, которые получил один наш формат выгрузки, но на деле их больше! Платформа Oprosso предлагает исследователям выбор из нескольких вариантов, каждый из которых предназначен для разных задач, имеет различные структуры выгруженных файлов, работа с которыми может вестись как при помощи специализированного программного обеспечения, так и без него. В этой статье поговорим сразу о трех самых популярных в исследовательском мире форматах – Excel, CSV и SPSS.
Excel
Формат Excel представляет собой тип файла, используемый в программах для работы с электронными таблицами, наиболее известной из которых является Microsoft Excel. Этот формат позволяет пользователям создавать, редактировать и анализировать данные в табличном виде, что облегчает восприятие информации. Среди вариантов выгрузки в функционале Oprosso формат Excel позволяет быстро получить большой объем данных, который при этом будет удобно впоследствии обработать вручную. Важно помнить, что этот формат не предназначен для интеграции в другие системы!
Ключевая особенность Excel-выгрузки в том, что данные хранятся вместе с атрибутами, влияющими на их представление, такими как ширина и объединение ячеек, размер шрифта, заголовков и другие параметры.
Работа с данными непосредственно в файле выгрузки стала намного удобнее благодаря нововведениям, о которых мы подробно упоминали в статье. Кроме того, с момента публикации статьи выгрузка в формате Excel успела получить дополнительные, не менее важные обновления:
- Для всех типов исследований процесс выгрузки значительно ускорился.
- Объемные исследования также будут выгружаться значительно быстрее. Так, например, файл в 3000 колонок и 5000 результатов будет генерироваться примерно три минуты, а файл в 300 колонок и 300 000 результатов – 4-5 минут.
- Вес формируемых файлов уменьшился. Это позволит обойти неявное ограничение программного обеспечения на открытие файлов слишком большого размера. Именно по этой причине файлы такого размера (более 50 тысяч результатов, более 500 колонок) формируются без применения стилей в теле таблицы.
Функционал формирования выгрузки тоже получил изменения. Поле EXCEL состоит из трех разделов: «Выгружаемые данные» (включение в выгрузку нужных вопросов и параметров), «Фильтры» (использование различных условий или групп условий, чтобы в выгрузку попали только определенные результаты) и «Дополнительные настройки», которые позволяют добавить в выгрузку дополнительную информацию из результатов исследования.
CSV
CSV (Comma-Separated Values) – формат текстового файла, используемый для хранения табличных данных, где данные хранятся построчно, а значения в строках разделены запятыми (или другим разделителем). Кроме этой ключевой особенности формат отличает:
- возможность хранения любых объемов данных
- отсутствие форматирования, то есть невозможность применить какие-либо стили к данным внутри файла
Формат CSV легко открывается с помощью программ, которые поддерживают табличные данные, при этом он совершенно не приспособлен для ручной обработки. Для работы с ним подходят, например, языки программирования (Python, R или любые другие на выбор специалиста), язык SQL (через загрузку данных в БД) и BI-системы. С помощью этих программ можно быстро настроить несложную автоматизацию для передачи и обработки данных, не прибегая к использованию API, который требует ресурсов другого порядка.
Раздел для формирования выгрузки в формате CSV в функционале Oprosso схож с форматом EXCEL. Здесь находятся такие же разделы «Выгружаемые данные», «Фильтры» и «Дополнительные настройки».
SPSS
SPSS (Statistical Package for the Social Sciences) – это специализированное программное обеспечение для статистической обработки данных. По сравнению с вышеперечисленными форматами выгрузок SPSS имеет два серьезных преимущества:
- Облегчение процесса подготовки сложного анализа данных. Многофакторный дисперсионный анализ со множеством зависимых переменных можно провести и в Excel, но с помощью формата SPSS это станет в разы проще – нужно сделать лишь несколько кликов. Простота подготовки касается и других статистических методов, включая регрессионный анализ, анализ временных рядов и так далее.
- Скорость анализа данных. Для формата SPSS нет разницы, какого объема документ – анализ данных пройдет одинаково быстро и для исследования с десятками тысяч результатов, и для исследования в сотни тысяч результатов.
Формирование выгрузки в формате SPSS в функционале Oprosso позволяет настроить выгружаемые данные – вопросы и параметры, – а также применить к данным фильтры и составить сложные условия с использованием операторов «И» и «ИЛИ».
Подведем итог
- Excel – это формат, который идеально подходит для ручной обработки данных и не подходит для встраивания в BI-системы. Он поддерживает большие объемы данных, но с определенным ограничением – до 1 048 576 строк и 16 384 колонок для одного листа. Формат чувствителен к продуктовым изменениям и может менять свою структуру в соответствии с обновлениями на платформе.
- CSV будет полезен для проведения несложных автоматизаций и интеграций с другими программами, если нет возможности использовать API. Позволяет хранить неограниченное количество данных, но плохо подходит для ручной обработки.
- SPSS дает возможность быстро провести сложный анализ данных с использованием разнообразных статистических методик, но требует соответствующих навыков и программного обеспечения.
Каждый из форматов имеет собственные особенности, но все они - самые распространенные в своем «классе», что определило их включение в функционал Oprosso. Попробуйте каждый из них, чтобы найти оптимальный вариант для своих задач и возможностей, а если у вас еще нет доступа к функционалу Oprosso, оставляйте заявку на демонстрацию с помощью формы обратной связи!