Получен первый комментарий от одолевшего переписанную половину курса “Интеллект-стек”: “крышесносно”. Вот что-то такое я и ожидал, для такого этот курс и переписываю. Там, кстати, готово первых примерно 400 страниц, вполне можно начинать проходить новый курс. Пока пройдёте первых 400 страниц, я закончу переписывать вторую половину. Обзор нового курса – это будет первая половина семинара “Образование для образованных”, Образование для образованных в 2023, подробности писал в Курс "Интеллект-стек": опубликовано ещё полторы сотни страниц.: ailev — LiveJournal. Текущий переписываемый фрагмент – алгоритмика как часть информатики. Вот текущее понимание поколений программной инженерии из нового текста:
– Софт/software 1.0:
– – Основано на программировании, основанном на формальных правилах выполнения формально определённых операций над формально определёнными данными.
– – Программы создаются путем явного кодирования правил и инструкций людьми.
– – Ограниченная способность обучаться на основе данных или адаптироваться к новым ситуациям (ограниченная вменяемость: если хочется, чтобы программа могла как-то разбираться с новыми данными, надо её менять «вручную»).
– Софт/software 2.0 (Software 2.0. I sometimes see people refer to neural… | by Andrej Karpathy | Medium, 2017):
– – Основано на искусственных нейронных сетях и глубоком обучении,
– – программы дифференцируемы (Дифференцируемое всё: от чёрно-белой картины мира к рябенькой: ailev — LiveJournal), поэтому способны обучаться на основе данных (обычно большой объём данных) и адаптироваться к новым ситуациям.
– Софт/software 3.0 (Software 3.0 - Div’s Substack, 2023):
– – Основано на предварительном обучении больших языковых моделей/large language models (LLM) сначала на примерах программного кода, а затем на больших массивах данных естественного языка и даже мультимедиа.
– – Эти большие языковые модели способны понимать естественный язык, а также понимать программный код на языке программирования или моделирования, они могут обучаться на небольших объемах данных. В пределе – это программирующий/планирующий интеллектуальный агент с высокой вменяемостью.
– – Используется нейролингвистическое программирование (сегодня называется prompt engineering), то есть программирование нейросети на какое-то вычисление или на создание кода на языке программирования, каковой код будет потом выполнен на каком-то внешнем компьютере (классическом, квантовом или ином), ведётся на естественном языке.
– – два варианта: или получается выполняемая программа как в Software 2.0 (часть нейросети просто аппроксимирует нужную функцию), или получается выполняемая программа как в Software 1.0 (и тогда нейросеть способна объяснять получившуюся программу, а также оптимизировать её – синтезировать более эффективные алгоритмы, чем придумываемые людьми).
Мои приоритеты по общей стратегии ШСМ:
– наше главное отличие от всех конкурентов и наше главное место на фронтире не в форме образования, а в содержании курсов (последний раз об этом писал в Хватит разговаривать про курсы, давайте про менеджмент, инженерию и практики интеллект-стека.: ailev — LiveJournal). Контент – король, а обёртка крайне важна, но в продукте не главное. Поэтому я full time занимаюсь проблемой недостающих курсов: 1. Переписываю “Интеллект-стек” и “Мастерство обучать образованных”, что даёт курсы пятого семестра и помогает курсам третьего и четвёртого семестров. А ещё помогаю доделать полную программу всех шести семестров. Уже сейчас достаточно материала, чтобы демонстрировать фундаментальность нашего образования, но уже к концу года тут будет всё значительно лучше. Доступ к материалам курсов (без заданий) сейчас бесплатный, дальше тексты будут сами говорить за себя. Заодно это поддержка сообщества: наши выпускники сегодня по факту – выпускники второго семестра из шести. Надо дать им возможность двигаться дальше. Так что full time произвожу контент, по фундаментальной программе без меня сегодня это не будет двигаться быстро.
– исследования и разработка прикладных курсов, то есть работа лабораторий текущих и разворачивание новых. Это опять таки: становится больше уникального контента, а также поддержание сообщества, ибо участники лабораторий неплохо так продвигаются в понимании своих предметных областей, быстрее растут.
– проблема масштабирования курсов с преподавателями. Нужно готовить преподавателей, для чего нужно чёткое отделение авторства курсов от преподавания. У нас, похоже, выкуплены потоки на следующий год корпоративными командами. Чтобы быстро вести преобразования, топ-менеджеры должны общаться на компактном языке мета-мета-моделирования, поэтому курсы выгодно проходить не одному директору по развитию, а команде развития (при этом топ-менеджмент какой-то фирмы – это и есть команда развития фирмы), они за счёт ускорения коммуникации по поводу проектов развития будут быстрее стратегировать, быстрее координироваться, быстрее реагировать на изменения. И чтобы выдержать поток заказов на такое корпоративное обучение, надо иметь множество преподавателей. Тут несколько подтем: 1. Переписка “Мастерства обучать образованных”, чтобы получить быструю передачу знания по собственно преподаванию и разделению труда. 3. Доработка курсов, чтобы не только авторы могли их вести (лучше объяснения прямо в курсах, больше разбора типовых ошибок прямо в курсах, лучше домашние задания, больше примеров), в пределе – надо сделать так, чтобы курсы могли работать вообще без преподавателей! Уже сейчас это работает, но только с самыми талантливыми и упорными. Поэтому пока улучшаем материалы курса, чтобы “самоучительствовать” получалось у всё большего количества студентов, но всё-таки опцию курса с преподавателями оставляем. 4. Стажировки преподавателей на текущих курсах как инструкторов в помощь авторам-преподавателям. 5. Поддержка преподавателей со стороны IT (включая их разгрузку со стороны AI: нам надо не столько загрузить преподов работой, сколько наоборот – максимально разгрузить).
– маркетинг, поддержка выпускников и всё остальное, что нужно для роста. Но без решения проблем по предыдущим пунктам это будет или трудно, или даже бесполезно (что толку с маркетинга, если у нас наборы закрыты?!).
Наши планы по AI свелись к следующим работам, которые в разной степени вялотекущести:
— сделать умный поиск на эмбеддингах (а не по ключевым словам) по материалам курсов. На этой неделе выберем векторную базу и к ней какой-нибудь фреймворк для промптовых pipelines, чтобы поставить вместо LangChain что-то более свежее. Дальше поиграемся как с чанками (цель – хотя бы абзац) и промптами (но это пока даже необязательно). Ещё нужен доброволец для разработки UX (а не только UI) этого поиска.
— добавить к материалам поиска тексты транскриптов тех преподских потоков, которые проходил конкретный участник. Эксперименты с транскриптами идут полным ходом (так, Whisper понимает промпты, и таким путём можно влиять, например, на расстановку знаков препинания, включая разбивку на более короткие и более длинные предложения), а административная часть (чтобы каждый участник получал поиск по доступным ему материалам, но не чужим материалам) – это сделаем позднее, после того, как добьём поиск по курсам и транскрипты. Мой текущий поток СМИ и предыдущий поток СМС начали получать кроме видео ещё и тексты транскриптов.
— улучшение текстов наших курсов, а также транскриптов (тут пока совсем непонятно, ручная переписка пока выигрывает). Тут ждём от мироздания хорошего софта, на русском языке пока ничего нет подобного Grammarly – надо, чтобы софт не просто отмечал какие-то проблемы в тексте, но и как Grammarly – предлагал исправления, а не заставлял их придумывать и вписывать. Нет, надо просто подтверждать или отвергать изменения, а правка должна быть сделана софтом, а не руками.
— рекомендательная система для клуба (чтобы подмешивала учебные материалы в ленту и формировала нормально саму ленту. Это входная точка во всё. Типа “пришёл на работу, посмотрел в issue tracker, что тебе накидали” — вот это наш issue tracker и он же newsfeed). Тут ещё вообще ничего не делали, и вряд ли руки быстро дойдут. Хотя это главная фича должна быть для долгосрочного выживания, но ресурсов на это нет совсем, а клуб только запустили.
— добавление табличного моделера со встроенным AI по типу “второго пилота”. Тут тоже пока тишина, хотя это тоже стратегическая фича. Тут ждём какого-то более-менее приличного опенсорс софта, пока всё советуемое не поддерживает нужных нам фич моделирования.
Иллюстрация от Kandinsky 2.1, не стреляйте в нейрохудожника, он рисует как умеет.
#новости
#интересное
#познавательное
#стратегирование
#интеллект