XXI век стал веком больших и очень больших данных. Xранящиеся объёмы информации, а также мощности простого современного смартфона многократно превосходят эти параметры старых суперкомпьютеров. В итоге сталкиваться с такими данными приходится каждому из нас, в том числе при решении самых бытовых вопросов.
Занимаясь, например, планированием своей #диеты - в частности, источниками витаминов или минералов среди продуктов, мы можем нагуглить довольно подробные и очень информативные #таблицы . В них будет множество строчек, соответствующих определенным продуктам питания, и немногим меньше столбцов, характеризующих содержание витаминов, минералов, белков, жирных кислот определенного типа и так далее.
Такое богатство информации впечатляет и может быть очень полезным. Но может и создать впечатление избыточной сложности. К счастью, помимо больших данных сейчас доступны и методы их анализа. Я предлагаю рассмотреть один из самых простых, позволяющихй визуализировать объёмные данные на плоскости выделяя из них наиболее существенные характеристики.
Этот метод - анализ главных компонент (principal component analysis, PCA). Не вдаваясь в подробности, можно сказать: PCA проецирует большие сложно организованные данные на одну плоскость, на который можно изобразить и интересующие нас целевые параметры объектов, и сами эти объекты.
Для примера я взял огромную сводную таблицу с множеством характеристик фруктов, овощей, круп и многих других их продуктов питания. Полностью её можно увидеть здесь
далее я выбрал несколько самых показательных фруктов и овощей, а также и наиболее важных витаминов. Руководствовался я при этом также отсутствием незаполненных строчек и столбцов. В результате получилась гораздо более читаемая и компактные таблицa. Но и такую беглым взором понять довольно сложно.
Как же она будет выглядеть после анализа главных компонент?
Стремясь показать наиболее важные различия между объектами, этот метод оказывает свойства объектов (#фрукты и овощи ) в виде стрелок. В нашем случае каждая стрелка них соответствует определенному витамину. Вокруг каждой стрелки могут оказаться те объекты- #овощи или фрукты, для которых характерно повышенное, сравнению с остальным набором, содержание этого витаминa.
Как читать график?
Для того, чтобы узнать, какие #витамины содержатся в интересующем нас плодe, его следует прежде всего отыскать на на плоскости. Если он, как, скажем, капуста белокочанная, находится в центре, вблизи нуля - это значит, содержание различных витаминов в нём среднее. Иными словами, их количесво в сравнении с другими плодами умеренное. А вот если фрукт/овощ находится далеко от начала координат - он является выдающимся по содержанию того витаминa, который обозначен стрелкой или стрелками поблизости.
Такие овощи или фрукты содержит в себе преимущественно один определенный #витамин - в больших, чем остальные. количествах. Их употребление может быть целесообразно, скажем, в случае если определенные витамины необходимо получать с пищей отдельно, как, например, B1 и B2 или B1 и #B12 . С другой стороны, график также может помочь подобрать нужные сочетания витаминов из разных источников.
Читайте также о пользе куркумы и куркумина