Найти тему
LeColoboqueJournal

Интеллект-стек – 6. Физика – Многоуровневое наведение внимания

шары ньютона
шары ньютона

Раздел “6. Физика” курса “Интеллект-стек” содержит подразделы:
– Многоуровневое наведение внимания
– Учим физическому мышлению на среднем уровне формальности, а не «разделам физики»
– Теория информации как часть физики
– Универсальные вычислители/компьютеры как часть физики

Вот содержание первого подраздела, “Многоуровневое наведение внимания”.

Хорошо бы учить людей дисциплинам интеллект-стека (в том числе физике как описанию поведения физического мира, этим занимается роль «физик») не просто демонстрацией примеров с надеждой на то, что люди как-то сами из примеров обобщат положения этих дисциплин. Например, можно рассказать студентам о сотне достижений каждой из трансдисциплин, в том числе современной и не очень современной физики, как это делается в современных учебниках физики [1], в надежде, что на этих примерах удастся передать мышление в ситуациях исследования, когда достижений в какой-то ситуации ещё нет, и нужно эти достижения сделать самому. Хорошо бы прямо учить мышлению, которое предполагается каждой дисциплиной, чтобы понять способ, которым в той или иной науке делаются эти достижения. Для физики это означает учить физическому мышлению. Оно заключается в том, чтобы для самых разных явлений природы догадываться о физических законах, которые формулируются в объектах, задаваемых разными принципами-аксиомами (формулировки аксиом предполагают наличие объектов, в терминах которых они сформулированы — то есть наличие «доаксиоматического» онтологического уровня! На формулировку правила-аксиомы может уйти 5% усилий, а 95% на определение объектов, участвующих в определении правила), причём добиваться математического выражения этих законов, чтобы можно было не только «умозрительно порассуждать» (этим занимается философия, и её нет в интеллект-стеке, он весь направлен на «порассуждать, а затем проверить измерениями/«не только мысленными экспериментами», это линия естественных наук), но и «посчитать», то есть вычислить какое-то предсказание на основе этих объясняющих мир законов, а затем сравнить предсказание с наблюдаемыми в эксперименте результатами измерений.

Тем самым физику можно было бы разделить на
основы физики (как и «основы математики»: какие математические объекты можно положить в основание физики — теория струн, теория нейронов Ванчурина, теория вычислительных графов Wolfram, теория создателей Deutsch, это уровень аксиом физики (доаксиоматический уровень — какие мельчайшие физические объекты существуют в физическом мире/реальности, какие математические объекты лучше всего отражают их поведение, и аксиоматический уровень — какие на них накладываются ограничения типа принципа сохранения энергии или принципов симметрии),
чистую физику (что-то типа физики электромагнитных явлений, квантовой механики, физики частиц и т.д. — предложение новых математических объектов, которые строятся из объектов, предлагаемых аксиомами, и которые могут выражать свойства самых разных физических систем — уровень законов физики, где ищутся эти законы и объяснительные математические модели для их выражения) и
прикладную физику, нужную для построения численных моделей каких-то конкретных феноменов, происходящих в самых разных системах, создаваемых в самых разных инженериях (или изучаемых для каких-то инженерных целей).

Тем самым изложение чистой физики из традиционных учебников оказывается просто каким-то «физическим кругозором», но:
– Оторвано от понимания роли математики, ибо плохо обсуждаются основы физики
– Оторвано от прикладной физики, ибо нет опыта моделирования физических систем
– Не очень понятно, какого поколения физики это обучение (изучается главным образом ньютоновская механика, даже работу GPS-систем на ней не объяснишь, работу современных транзисторов не объяснишь, современную космологию с её квазарами и сверхновыми не объяснишь, работу квантовых компьютеров не объяснишь)
– Термодинамика вроде как даётся во всех курсах, и признаётся, что это основа физики, но по факту никаких знаний о ней не остаётся, и это знание оторвано от всего остального корпуса физических знаний
– Эмерджентность не обсуждается, поэтому плохо понятно, зачем физика и химия, химия и биология как отдельные предметы, несводимые к физике.
– Не рассказывается об основных проблемах физики (типа квантовой гравитации, эволюционных теорий вселенной и т.д.), поэтому знание даётся как «незыблемое на века», что явно не так. Современная физика — это паутина из самых разных теорий, которые часто плохо понятно, как связаны друг с другом (связь эта осуществляется через математику, но роль математики как онтологии физики редко обсуждается).

Какое мышление у физиков, в чём специфика их работы с типами и категориями? Как физики делают догадки о важных объектах, как рассуждают, критикуя эти догадки, как ставят какие-то исследовательские цели? Учить нужно именно этому, «мышлению как физика». Учебники физики должны быть не про явления природы (про явления природы могут быть справочники!), а про мышление о явлениях природы. Мышление на предмет объяснения явлений природы. Это позволит поддерживать рассуждения о физике в самых разных проектах, а вот кругозор (что там за свойства основных видов физических объектов разных системных уровней, а также свойства математических объектов, использованных для их описания — собственно «чистая физика» может быть тут, равно как «чистая математика») можно использовать как примеры, и вполне возможно, что это должны быть одни и те же примеры как для физического мышления, так и для математического мышления. Возможно, это должен быть «физмат-курс», а не отдельные курсы «физики» и «математики». Это вполне возможно, практики интеллект-стека и их трансдисциплины, да и прикладные дисциплины не обязаны проходиться каждая в рамках отдельного курса, а также рассматриваться в рабочих проектах как отдельные. В одном курсе могут изучаться несколько трансдисциплин и дисциплин и их практики, а по одной дисциплине вполне может быть несколько курсов. И дальше изучение физики может плавно переходить в прикладную физику (и математику для неё), нужную для каких-то отдельных инженерных задач, скажем тонкости теории электромагнетизма, которые нужны для разработки устройств поддержки протокола связи 6G и математика, которая поддерживает эти тонкости теории магнетизма (скажем, нейронные дифференциальные уравнения [2]).

Конечно, где-нибудь в кругозорном курсе по инженерии устройств уровня сложности инертного вещества (а не более высоких уровней сложности: клетки, организма, личности, коллектива, сообщества, общества, человечества) вполне может быть курс прикладной физики в какой-нибудь интересной полуприкладной форме, типа «таблицы физических эффектов в ТРИЗ» [3]. Или уже упомянутый современный учебник физики [4], если поддаться искушению и дать зачем-то студенту «общефизический кругозор» в объёме примерно 2 тысяч страниц быстроустаревающего знания, «впрок», «вдруг в каком проекте пригодится». Но в любом случае это нужно рассматривать как прикладной физический кругозор, а не фундаментальное обучение физическому мышлению. При этом с учётом возможностей современных нейросетей становится непонятным, какой объём кругозорного прикладного знания надо давать студентам для изучения, а какой объём можно оставлять в виде справочного материала, легко находимого при потребности.

Физика тем самым вполне может быть поделена на прикладное знание, которое подробно нужно знать инженерам-разработчикам каких-нибудь кибер-физических устройств и фундаментальное, которое надо бы знать всем — и без которого в прикладном знании не разобраться. Всем интеллектам (человеческим и AI, личным и коллективным) нужно владеть физическим мышлением, и оно позволит довольно быстро разобраться в самых разных проектных ситуациях, обращаясь к знанию прикладной физики (всё это в равной степени относится и к математике, и к другим дисциплинам интеллект-стека).

Пока же физическому мышлению учат «исподволь», то есть не учат. Оно явно не прописано в учебниках физики, там прописаны только результаты его применения в «чистой физике». О физическом мышлении можно почитать только какую-то специальную (иногда научно-популярную, а иногда и нет) литературу, но оно точно не затрагивается в самих курсах физики как школьных, так и вузовских. Оно появляется главным образом после общения с состоявшимися физиками в разных их исследовательских проектах, в режиме «подмастерья». А если опыта «подмастерья», опыта совместной исследовательской физической работы нет, то знание всех курсов физики (и школьного, и многочисленных вузовских) мыслить про физику не помогает. Об этом писал и Richard Feynman в эпизоде про обучение бразильских студентов [5]. Ключевое там как раз про присвоение типов из учебника для мышления об объектах реального мира (в данном случае — учебника физики) объектам этого мира (которые встретились Feynman и его студентам на прогулке), этому ведь специально не учат, и природа этого присвоения типа не объясняется, это ведь вообще семантика, а не физика! А объяснять надо. Вот цитата, которую можно в равной мере применить к учебникам менеджмента, и к учебникам «как писать обучающие курсы», и ко всем вообще учебникам и курсам: «После длительного расследования я, наконец, понял, что студенты все запоминали, но ничего не понимали. Когда они слышали «свет, отражённый от преломляющей среды», они не понимали, что под средой имеется в виду, например, вода. Они не понимали, что «направление распространения света» — это направление, в котором видишь что-то, когда смотришь на него, и т.д. Все только запоминалось, и ничего не переводилось в осмысленные понятия. Так что, если я спрашивал: «Что такое угол Брюстера?», я обращался к компьютеру с правильными ключевыми словами. Hо если я говорил: «Посмотрите на воду», — ничего не срабатывало. У них ничего не было закодировано под этими словами».

Вот ключевая операция в моделировании, заключающаяся в корректном присвоении типа: «под средой имеется ввиду, например, вода». Работа с типами мета-мета-модели «из учебника физики», то есть справочной_информации/reference_data («среда») и мета-модели целевой/in_hand/of_interest предметной области приложения физики («вода»). А дальше ещё и собственно модель, уровень экземпляра в описанном эпизоде: «вода вот этого залива вот в этом месте, на которое надо смотреть и у которого вполне конкретное влияние на поляризацию, которое можно измерить».

Математика и физика долго сосуществовали вместе, математические объекты как ментальные объекты с хорошо понимаемым поведением появлялись просто для удобного выражения физических понятий, как их описания, «модели».

Для обсуждения физики нужно уже понимать математику: физическое мышление связано с тем, что мы смотрим на объекты в жизни, и подставляем в них математические объекты. А ещё мы как-то об этом говорим, то есть задействуем знаки — и поэтому хорошо бы иметь представление о семантике.

Gonzo-обзоры [6] статей по machine learning представляли собой в 2021-2022 годах концептуальные (принципы нарезки на функциональные части, по традиции это называется «архитектура») обзоры универсальных алгоритмов [7]: в речи очень густо поминаются типы объектов предметной области (архитектуры/концепции алгоритмов, архитектурные/концептуальные блоки, каналы, потоки, входы-выходы, внимания, гейты и много чего иного), и видно, что вопрос композиционности/модульности нейросетевых архитектур/концепций авторы этих обзоров для себя давно решили. Но это решение нужно просто описать (основные типы объектов, мета-модель предметной области алгоритмики нейросетевых моделей). Этой формализации (выделение объектов в способах построения нейросетевых алгоритмов) надо учить, и не исподволь через чтение описаний разных «архитектур нейросетей» и статей с описанием новых типов «блоков» для этих архитектур, а вот прямо давая понятие «блок» и далее разбираясь с тем, функциональные блоки ли это, или конструктивные, и что там ещё важно, если уж обсуждаем нейросетевые алгоритмы. Под всеми этими описаниями неявно скрыты какие-то объекты, которые надо выделять из окружающей среды, называть, обозначать. Под всеми этими описаниями скрыта семантика: что обозначают все эти «внимания» в универсальных алгоритмах? Как это проявляется в физическом мире (в вычислении на компьютере)? Какое может быть использовано описание (классическое из объектов и отношений, или какой-то математикой, или в свою очередь распределённое представление «настроенной нейросетью» или каким-то embedding-вектором для словесного представления в текстах [8]), какая может быть использована удобная нотация? Так, в оригинальных статьях по нейросетевым алгоритмам (они же «архитектура нейросетей», концепции нейросетей) довольно много математики, но вот в обзорах идут обсуждения без формул, менее формальные, более инженерные по их целям, вскрывающее другие типы отношений, чем проявленные в математических формулах (так, обсуждаются мотивы, почему берутся одни формулы, а не другие: функциональное описание, а не только конструктивное. Формулы не описывают функциональность, её приговаривают к формулам текстом, при этом в тексте описывают и ожидаемые результаты применения формул, чего нет в самих формулах).

В принципе, сами тексты эти часто представляют некоторую обратную инженерию того, что описывается формально-математически (или физически? Это ж описываются компьютерные алгоритмы, то есть «специализированные вычислители», они могут и чисто хардверно реализовываться!). Если такие тексты делать в ходе прямой инженерии (когда придумываешь новые концепции нейросетей), то можно было бы ожидать вот этого словесного неформального обсуждения, а потом уже следующим шагом было бы получение формального описания: формул и реализующего эти формулы программного кода.

Получается, что для физического моделирования, внутри которого скрыто математическое моделирование, нужно использовать техники формализации/моделирования и деформализации/рендеринга, которые мы обсуждали в семантике. Все эти обсуждения рендеринга/порождения/деформализации/элокуции/разворачивания схемы/нарративизации. Но там речь шла по факту об уровне формальности естественного языка, до уровня математических формул дело не доходило.

А вот чтобы обсуждать алгоритмику, надо хорошо понимать, что физически вычислитель может быть разной природы, что вычисления — это просто какие-то операции над памятью. Её хорошо бы давать после физики, когда понятна природа квантовости (иначе непонятно будет, почему так много разговоров про квантовые компьютеры, про мемристорные компьютеры для нейросетевых алгоритмов и т.д.).

В изучении физики (впрочем, и других предметов интеллект-стека) есть проблема: длинная история, где постепенно появлялись самые разные SoTA и время от времени решались задачи с признанием эквивалентности разных формулировок (то есть эквивалентности выражения физического знания в самых разных понятиях/самой разной математикой, понимаемой как «какой-то раздел или подраздел математики = догадка по ментальным/идеальным объектам и операциям с ними и попытка изучить то, как они себя ведут в рассуждениях», а потом ещё и проверка, что эти математические объекты ведут себя именно так, как показывают в эксперименте измерения физических систем, которые они описывают).

Это всё осложняется тем, что в рассуждениях участвуют не только математические понятия (например, «вектор», который моделирует какую-то «силу»), но и физические понятия, которые вроде как должны реферировать объекты в окружающем мире. И вот тут проблема:
– Сначала никаких «сил гравитации» не было. Галилей бросал пёрышки и дробинки с Пизанской башни, но они не «притягивались Землёй как объектом с большой массой».
– Ньютон сказал, что сила гравитации — это сила притяжения масс. Сила в объяснениях появилась, математика её учла в ньютоновской механике.
– Эйнштейн сказал, что сил гравитации никаких нет, это всё искривления пространства-времени. Это искривление задавалось математикой теории относительности.
– Изучающие проблему «квантовой гравитации» физики вроде как продолжают обходиться без «силы гравитации», но уже не факт, что речь идёт об искривлениях пространства-времени, а обсуждаются и всякие другие варианты объяснений. Математика тут тоже разная, хотя есть общее мнение, что она должна вести себя на микромасштабах как теория квантового поля, а на макромасштабах как теория относительности.

Ну, и какой физике (набору физических понятий) учить? Всем, или «лучшим известным»? Если идти «как обычно учат физику», то всё будет похоже на развитие человеческого эмбриона: вам долго будут рассказывать про рыбку, потом амфибию, потом неведому зверушку, потом примата, и только потом уже про человека.

Можно говорить о том, что сейчас есть какая-то SoTA физики и поддерживающей эту физику математики, которые и есть современная онтология «точных наук». И учить в физике-математике, по идее, нужно именно этому.

Раскручивать эту онтологию современной физики можно, например, с понятия интеграла по траекториям. Формулировка интеграла по траекториям [9] - это описание в квантовой механике, которое обобщает принцип действия классической механики. Она заменяет классическое понятие единственной, уникальной классической траектории для системы суммой или функциональным интегралом по бесконечному числу квантово-механически возможных траекторий для вычисления квантовой амплитуды. Чтобы вообще понять, о чём тут говорится, надо разобраться в квантовой механике. Причём если встретится текст, в котором сразу формулы-формулы-формулы и разговор про физику заменяется разговором про математику (большинство русскоязычных текстов в Википедии именно таковы), то такой текст не подойдёт, он не научит онтологии собственно физики, он научит какому-то разделу математики. А нужно чётко разделить: вот это 1) физическое понятие, и оно моделируется вот такой 2) математикой. Вытаскиваем пример такой современной физической онтологии прохождением по ссылкам в Википедии. Так, сразу находим принцип действия/action principle [10] и дальше всё через несколько исторических ходов по классической механике упрётся в понимание Лагранжиана из теории поля [11].

Скажем, прямо из википедии [12]: «Действие — одна из фундаментальных физических величин, входящая в современную формулировку большинства основных физических теорий во всех фундаментальных разделах физики, имеющая при этом и огромное значение в теоретической физике. Оно может иметь меньшее значение в сравнительно более прикладных областях, хотя и там нередко бывает употребительно. Используется равно и в квантовой, и в классической, и в релятивистской физике". Действие является мерой движения физической системы. Далее вопрос про меру и измерения — это не такой простой вопрос (скажем, колмогоровская теория вероятности включает вероятностную меру на алгебре, которая задаёт вероятностное пространство). Движение в общем смысле, а не только физическое движение — тоже должно быть тщательно обсуждено и понято. Пространство как математическое пространство (а не физическое 3D или даже 4D) в курсах физики практически не обсуждается, движение как нечто абстрактное — вот ни разу, студенты это «проходят мимо», и только кому повезло это как-то понять, потом когда-нибудь могут стать физиками или хорошими инженерами. Действие/action — это скалярная (без направления) величина, выражаемая в джоуль-секундах/J-s. И тут же надо разбираться с количествами/quantities и их величинами/magnitudes, что сразу будет отличать физику от математики. А ещё придётся выделять физическую систему: набор физических объектов (в механике — физических тел, но это могут быть и самые разные другие объекты) в каком-то окружении/environment, причём речь будет идти о математическом описании динамики, то есть изменений во времени. Ровно то, что надо для любого разговора о мире: описание объектов, выделяемых как-то из фона, причём описание это относится к изменениям в этих объектах.

Понятие исчисления даётся только на примере дифференциального и интегрального исчислений (и это воспринимается как название учебного предмета, а не собственно «исчисление» как «возможность посчитать»!). Энергия только механическая, без мостика к теории информации и далее идеям типа free energy principle. Информация и сверхинформация (квантовая информация) ни разу не по линии теории информации как части физики, только по линии «обучаем программированию». Но зачем это всё? Это ж частное знание, «раздел физики»? Можно, конечно, понимать и так — но с другой стороны, это и есть «основания физики», что-то наиболее общее. Если хочется понять, в чём там суть теории active inference, которая довольно легко в своих приложениях доводится до непосредственного использования в менеджменте, придётся разобраться с принципом минимизации свободной энергии и идеями вариационного исчисления. Если не на уровне формул и строгой математики и физики, то как минимум на уровне общих представлений.

Выход в обсуждение физичности чего бы то ни было, а также связи математики, физики и computer science упирается как раз в предыдущий пункт: мало кто понимает про «физичность», «математичность», «опору физики на математику», выход на семантику, те же вопросы связи описаний реальности в терминах объектов (теория категорий), с которыми возможны исчисления (теории типов). Как обсуждать связь многих вещей, которые ты не понимаешь даже по отдельности?!

ПРОДОЛЖЕНИЕ 👈

#познавательное

#новости

#интересное

#левенчук

#физика

#наука

Наука
7 млн интересуются