Найти в Дзене
teimosia

Про все эти предлоги, местоимения и артикли

Вышла тут статья у MIT Technologies Review с упоминанием закона Зипфа. Закон Зипфа гласит, что если взять любой текст и распределить слова из него по частотности (от самого частотного до наименее частотного), то частота слова будет зависеть от его порядкого номера в этом списке. То есть второе по частотности слово будет встречаться в два раза реже, третье — в три и так далее. Закон очень старый, но до сих пор нет подтверждения, является ли это language universal, то есть относится ли ко всем языкам или это удел нескольких? Вот в статье как раз и говорится, что раз у нас есть теперь машины и корпуса, коих во времена формулирования закона не было, то ребята ученые из Пекина прогнали 50 языков и получили по ним пока что подтверждение закона, правда, там есть некоторые оговорки и модификации. Но не суть. Почему это должно быть интересно, особенно учителям и изучающим? Потому что нужно задаться вопросом: а почему так происходит? И вот те же самые китайские ребята напоминают (там точнее они

Вышла тут статья у MIT Technologies Review с упоминанием закона Зипфа. Закон Зипфа гласит, что если взять любой текст и распределить слова из него по частотности (от самого частотного до наименее частотного), то частота слова будет зависеть от его порядкого номера в этом списке. То есть второе по частотности слово будет встречаться в два раза реже, третье — в три и так далее.

Закон очень старый, но до сих пор нет подтверждения, является ли это language universal, то есть относится ли ко всем языкам или это удел нескольких? Вот в статье как раз и говорится, что раз у нас есть теперь машины и корпуса, коих во времена формулирования закона не было, то ребята ученые из Пекина прогнали 50 языков и получили по ним пока что подтверждение закона, правда, там есть некоторые оговорки и модификации. Но не суть.

Почему это должно быть интересно, особенно учителям и изучающим? Потому что нужно задаться вопросом: а почему так происходит? И вот те же самые китайские ребята напоминают (там точнее они дальше проводят эксперименты) нам о двусистемной модели мышления Канемана, где в первой системе мы не думаем и действуем быстро (увидели опасность и побежали), а во второй думаем много и рационально, но медленно.

Так вот высокочастотные слова, на верхушке рейтинга, обрабатываются нами первой системой мышления, а редкие слова — второй. Заметьте, как быстро мы кидаемся предлогами, междометиями и союзами, и как замедляемся, когда нам нужно вспомнить более длинное и редкое слово. Именно поэтому в рейтинге по Зипфу наверху всегда будут and и but, а в самом низу Zipf и hypothesis.

Все это имеет implications for teaching, причем об этом как то мимоходом упоминал Gianfranco Conti, я пропустила это, но статья мне напомнила — инвестируйте время в дриллинг мелких слов, а именно служебных частей речи, тк они занимают большую часть текста и нужны для retrieval чаще всего и быстрее всего — т.е. на уровне первой системы мышления, а если им в самом начале не уделить достойного внимания, люди и на высоких уровнях будут путать his и her, when и then, или так долго их вспоминать, что это будет очевидно влиять на fluency.