Есть ощущение, что надо внести ясность с понятия в заголовке. В науке вообще похожие понятия в разных областях могут означать немного разные вещи. Есть вот классическая термодинамика, в которой, во-первых, нет частиц, там просто цельное нечто (газ, жидкость, тело), по аналогии с механикой сплошной среды (где частиц тоже нет); а во-вторых, она всё-таки равновесная. Как говорят, пока Вы живы, температуры у Вас нет: ведь Вы не в равновесии со средой.
Но есть статистическая физика, и там температура есть: это средняя энергия частиц, выраженная в кельвинах (просто умножением на константу перехода).
При этом одну и ту же среднюю энергию можно иметь очень по-разному. Может, все частицы имеют строго эту энергию; может, половина имеет энергию вдвое выше, а вторая половина покоится; или энергии распределены нормально; или нормально распределены скорости; и так далее.
Разные ансамбли с одной и той же температурой различаются своей частотой. Скажем, конфигурация, когда все частицы имеют одну и ту же энергию, одна-единственная.
Можно перейти от частиц к картам. В бридже используют простую систему оценки: туз 4 очка, король 3, дама 2, валет 1, остальные карты нули. Сколько может быть раскладов с 10 очками? Много. Два туза и дама, два туза и два валета, три короля и валет, , туз-король-двама-валет в одной масти и больше ничего стоящего; ну и далее. Не считая ещё мелких карт. Раскладов же с 40 очками нет, а вот 37 может быть: надо иметь на руках все старшие карты, кроме трёх валетов, то есть вариантов всего 4: по числу возможных валетов на руках. Вариантов с нулём очков несколько больше: столько, сколько есть вариантов выбрать 13 карт из 36 "мелких", то есть порядка двух миллиардов (но вообще всех раскладов раз в 30 больше).
Аналогично с раскладом. 13 карт одной масти это всего четыре варианта. А раскладов 4-3-3-3 очень много и большинство из них однотипны до неразличимости с точки зрения игры в бридж.
Таким образом, плохо различимые микросостояния дают одно и то же макросостояние, и число (или функция от числа, не суть) этих микро- и есть энтропия.
Мера беспорядка, если угодно. Упорядоченных состояний всегда мало, неупорядоченных много больше, поэтому случайно выставить книги по алфавиту, толщине или теме весьма маловероятно, а вот перепутать куда более, поэтому в хаотичном процессе выигрывает беспорядок.
Именно поэтому популярны энтропийные распределения вероятностей - равномерное, нормальное, экспоненциальное - те, которые доставляют максимум энтропии при тех или иных ограничениях.
Это всё не означает непременного роста разупорядоченности, конечно. Как раз наоборот: очень часто упорядоченность растёт самопроизвольно - в тех случаях, когда есть разница между микросостояниями. Когда мы отбираем энергию у молекул воды, вода замерзает - кристаллизуется, и упорядоченность возрастает. Просто потому, что энергетически выгодно такое пространственное расположение частиц. Бывают аморфные состояния, когда частицы "не успевают" выстроиться в кристалл, но если им позволить, то они это сделают, вопрос только в том, что стекло обычно аморфное, лёд обычно кристаллический, а железо может быть и таким, и другим, но кристалл чаще. То есть "все" состояния возможны, но какие-то более вероятны и даже более выгодны энергетически, то есть возникают (точнее, становятся заметны) силы, которые этот порядок формируют.
Информация это обратная сторона энтропии. Ошибка думать, что информация исчезает, если нет того, кто её получает. Если исчезнут все люди, информация в книгах сохранится. Эволюционировавшие кошки, инопланетяне, кто угодно, нашедшие книги, смогут расшифровать язык и прочесть их.
Тут стоит посмотреть на две вещи: сжатие данных и шифрование.
Как сжимают текст? Буквы, скажем, используются неодинаково часто: в английском тексте e встречается намного чаще z, а пробел чаще восклицательного знака. При этом оба символа занимают один байт (хотя всего 7 бит используется, то есть для английского текста можно легко отжать 12.5%). Частые символы можно закодировать более короткими сериями бит, а редкие длинными. При этом мы выигрываем на каждой е, но проигрываем на каждой z; однако выигрываем мы чаще.
Идеально сжатый текст представлен "символами", байтами, которые встречаются одинаково часто, и которые нельзя предсказать лучше, чем вот с этой одной на всех вероятностью. Белый шум. Максимальная энтропия: перестановка байт или замена одних другими случайно - не меняет вид текста, он остаётся таким же белым шумом. Кстати, такой формат очень подвержен ошибкам. И расшифровке не поддаётся, если неизвестен алгоритм.
И да, шифр тоже должен быть максимально энтропиен, чтобы ничто не указывало. Хорошо зашифрованный текст вот:
-ÑS½'^V ^Oûò^Bú æÒëø"Ã1[^?^\¸<89>©²°ñû,^EÞñiëÇí^Lø^?Ô^X<88>`lpøÃA^W ^Qð¼<9c>;r<9f>ñ^]9a>"´nÑý]¨Üx¨¾|^Û^W«¹M^KX^H^_;Ä^[L;^ExÜHO^W/{ Ç<99>:<90>v^Z^Ló<81>^YiF<9d>n»<96>91>#$WÐþÇo<95>¼Ù^H<8b>mI2<9a>Ñ4bMÈ<9f>ç<82>^CØ<8d>^F<89>Õê5^CÕ
Плохо зашифрованный (другой текст) вот:
Guvf grkg vf rapelcgrq ol n flzcyr ebg13 zrgubq.
Даже не зная алгоритма и языка, Вы можете расшифровать текст.
И вот тут возникает "вилка". С одной стороны, высокоэнтропийный "текст", то есть белый шум (равновероятный поток непредсказуемых символов) информации не несёт. С другой стороны, это может быть зашифрованный или сжатый текст, который информацию содержит. И вот тут всё зависит от знания алгоритма. А ошибка в одном байте приведёт не к опечатке в одной букве, а испортит текст полностью, до полной невосстановимости. Глядя на кашу из символов, мы никогда не знаем: это белый шум или кто-то в этом может разобраться. Вот выше вполне себе текст, хотя это не очевидно.
С другой стороны, низкоэнтропийный текст может никакой информации не нести, если он сгенерирован случайно по заданному распределению: ну вот 00000000001000 - тут много нулей, так что энтропия низкая, но что толку - это случайный массив двоичных цифр, просто нуль выпадал чаще, так задумано. Но если это не результат чьих-то осознанных усилий, то появиться случайно он не мог; точнее, это маловероятно. Слово йцуцкц могло появиться случайно, но три ц подряд через одну букву это вряд ли случайность. Если текст длиннее и замены букв те же, то расшифровка труда не составит. При более хитром алгоритме может быть всё сложнее, но в целом связь между трудностью доступа к информации или даже её наличию и энтропией имеется.
Конечно, можно вообразить себе язык, в котором все символы одинаково значащие и, следовательно, равновероятны (ведь частый символ даёт мало информации - ну что Вы узнали, если в слове есть е?, а редкий даёт много информации: если в слове три ц, то до угадывания слова "цистерцианец" уже недалеко). Таким языком являются цифры. Столбец чисел содержит информацию, хотя цифры могут быть (хотя не обязаны) распределены равномерно. Но информация извлекаема (или вообще "есть"), если Вы знаете, что это за числа. Если у Вас просто файл с числами, они не дают Вам ничего: информации нет. Её можно извлечь, только отыскивая знакомые паттерны. То есть, опять-таки, структуры, то есть - низкую энтропию.