4 подписчика

Про все эти предлоги, местоимения и артикли

25 января 202225 янв 2022

1 мин

Вышла тут статья у MIT Technologies Review с упоминанием закона Зипфа. Закон Зипфа гласит, что если взять любой текст и распределить слова из него по частотности (от самого частотного до наименее частотного), то частота слова будет зависеть от его порядкого номера в этом списке. То есть второе по частотности слово будет встречаться в два раза реже, третье — в три и так далее. Закон очень старый, но до сих пор нет подтверждения, является ли это language universal, то есть относится ли ко всем языкам или это удел нескольких? Вот в статье как раз и говорится, что раз у нас есть теперь машины и корпуса, коих во времена формулирования закона не было, то ребята ученые из Пекина прогнали 50 языков и получили по ним пока что подтверждение закона, правда, там есть некоторые оговорки и модификации. Но не суть. Почему это должно быть интересно, особенно учителям и изучающим? Потому что нужно задаться вопросом: а почему так происходит? И вот те же самые китайские ребята напоминают (там точнее они

Закон очень старый, но до сих пор нет подтверждения, является ли это language universal, то есть относится ли ко всем языкам или это удел нескольких? Вот в статье как раз и говорится, что раз у нас есть теперь машины и корпуса, коих во времена формулирования закона не было, то ребята ученые из Пекина прогнали 50 языков и получили по ним пока что подтверждение закона, правда, там есть некоторые оговорки и модификации. Но не суть.

Почему это должно быть интересно, особенно учителям и изучающим? Потому что нужно задаться вопросом: а почему так происходит? И вот те же самые китайские ребята напоминают (там точнее они дальше проводят эксперименты) нам о двусистемной модели мышления Канемана, где в первой системе мы не думаем и действуем быстро (увидели опасность и побежали), а во второй думаем много и рационально, но медленно.

Так вот высокочастотные слова, на верхушке рейтинга, обрабатываются нами первой системой мышления, а редкие слова — второй. Заметьте, как быстро мы кидаемся предлогами, междометиями и союзами, и как замедляемся, когда нам нужно вспомнить более длинное и редкое слово. Именно поэтому в рейтинге по Зипфу наверху всегда будут and и but, а в самом низу Zipf и hypothesis.

Все это имеет implications for teaching, причем об этом как то мимоходом упоминал Gianfranco Conti, я пропустила это, но статья мне напомнила — инвестируйте время в дриллинг мелких слов, а именно служебных частей речи, тк они занимают большую часть текста и нужны для retrieval чаще всего и быстрее всего — т.е. на уровне первой системы мышления, а если им в самом начале не уделить достойного внимания, люди и на высоких уровнях будут путать his и her, when и then, или так долго их вспоминать, что это будет очевидно влиять на fluency.