Слова и структура слов в речи
Чтобы овладеть языком, учащийся должен овладеть как расширенной сетью слов, составляющих его лексикон, так и сложной паутиной структурных связей, которые делают лексику продуктивной, позволяя говорящему пользоваться бесконечным творческим потенциалом, присущим только человеческому языку. Все дети во всем мире решают эти задачи в невероятно короткие сроки, учитывая сложность естественного языка. Их база данных состоит из образцов речи, произносимых в различных условиях, выступающими с разными намерениями, целями и способами выражения мнений. Однако через несколько лет они сходятся в окончательное стабильное состояние.
Таким образом, они должны обладать эффективными средствами извлечения слов своего языка и структурных связей из этих фрагментов речи. Что такое такие средства и какова относительная важность каждого из них, являются предметом интенсивных исследований. Несколько уровней сложности усложняют эти задачи. Речь не содержит явных признаков сегментации между словами. Поэтому, чтобы найти слова, младенцы должны разбить непрерывную речь на сегменты, которые в конечном счете станут словами на их языках.
Важный вклад в решение этой проблемы может внести доказанная способность младенцев извлекать некоторые статистические связи из речи. Примечательно, что в возрасте 8 месяцев младенцы могут распознавать слова по абсолютной частоте их произношения, что может помочь им выделить некоторые фиксированные точки для перехода к непрерывной речи. Примерно в том же или более раннем возрасте, они могут вычислить условные частоты, с которыми слоги сразу следуют друг за другом (или их смежная вероятность перехода; далее ТП), чтобы начать сегментирование искусственно созданного непрерывного потока в словесные единицы. Они также могут использовать такую дистрибутивную информацию при работе с реальной речью, предполагая, что расчеты TП могут быть вовлечены в изучение языка в реальном мире.
Несмотря на эти наводящие на размышления выводы, мы все еще не знаем, насколько чувствительна чувствительность младенцев к ТП и достаточно ли она сильна, чтобы использовать реальные статистические различия в реальных языках, которые гораздо менее заметны, чем те, что были проверены в лаборатории.
Поиск возможных слов в процессе раннего изучения языка
Многочисленные исследования в изучении языка показывают или подразумевают, что языковые правила возникают в результате индуктивного процесса, требующего значительного объема словарного запаса и разнообразия словарного запаса. Сначала младенцы приобретают много похожих слов, и из этой базы данных они извлекают информацию о своей структуре. Для справки, назовем эту картину эмпирической моделью изучения языка.
Согласно этой точке зрения, овладение языком в принципе ничем не отличается от других процессов статистического обучения: для овладения языком учащиеся нуждаются только в данных и некотором механизме анализа данных общего назначения (например, для того, чтобы овладеть языком, необходимы лишь данные и некоторые общие механизмы анализа данных), возможно, опираясь на примитивные стереотипы восприятия. Как писали Бейтс и Элман, несовершенства, связанные с обеднением языкового ввода, часто рассматривались как признак наличия в ученике богатых языковых структур, смываются достаточно большим количеством образцов. Несмотря на привлекательность и простоту этой модели, введение структуры из большой базы данных не обязательно является выигрышной стратегией для учащегося младшего возраста. Одно слово - одно слово, а одно правило - тысячи слов.
Изучая лексику, которая через несколько месяцев вырастет впечатляюще, младенцы извлекут большую пользу из понимания возможных слов как можно раньше, проектируя структуру слов, не дожидаясь, пока лексика выйдет за рамки их памяти и когнитивных ограничений. Таким образом, вместо того, чтобы широко исследовать факты о словах, чтобы вызвать их структуру, младенцы могут выиграть от менее консервативных и проектных гипотез о возможных словах после приобретения нескольких реальных слов, используя процедуру обучения, менее схожую с рациональной оценкой имеющихся доказательств, чем с угадыванием из примеров.
Несколько исследований с участием взрослых и младенцев показывают, что при изучении языка существуют механизмы, не сводимые к отслеживанию статистических распределений. Таким образом, взрослые, участвующие в задании по изучению слова, как правило, применяют стратегию "быстрого картирования" в одном испытании, чтобы зафиксировать значение новых слов, которая не требует обширных встреч со словосочетаниями объектов и статистической выборки таких встреч.
Слова и возможные слова на ранних стадиях развития
Искусственно синтезированная речь хорошо подходит для изучения нашего вопроса, поскольку она предлагает контроль над многими особенностями стимулов, такими как возможность устранить прозодизм, манипулировать скоростью речи, создавать точные статистические соотношения между слогами или вводить точные элементы сегментации. Одним из способов определения чувствительности к реальным и возможным словам на ранних этапах изучения языка является создание ситуаций, когда одни и те же экспериментальные стимулы содержат различающуюся информацию.
Предположим, что младенцы слушают искусственные речевые потоки, из которых они могут как идентифицировать некоторые фрагменты на основе статистической согласованности, так и найти словесную внутреннюю структуру, которая не может быть извлечена путем расчета одних и тех же статистических показателей. То, как разрешается конфликт, покажет относительную важность возможных слов и реальных слов для раннего овладения языком. Peña et al. подвергали взрослых особей воздействию потоков тризиллабических последовательностей, характеризующихся внутренней несмежной вероятностью перехода в 1 и переменным средним слогом. Следуя стандартной практике,такие статистически связные элементы называются словами, хотя очевидно, что это определение имеет лишь ограниченную связь с реальными словами в естественном языке. Для идентификации таких слов участники могли бы использовать информацию, не относящуюся к соседним источникам распространения.
Однако эти слова также звучали и в семьях. Таким образом, участники смогли не только извлечь реальные слова, которые произошли в потоке, но и определить свою морфосинтаксическую структуру. После знакомства с потоком языка AXC участники были протестированы на их предпочтение слов против паролей или слов правил против паролей. Слова правил представляли собой последовательность из трех слогов, полученных при замене среднего слога слов другим слогом. Они никогда не встречались в ручье, но были структурно похожи на слова, потому что они имели одну и ту же морфологическую конструкцию. Партийные слова представляли собой последовательности из трех слогов, которые происходили в потоке через границы слова, но не имели общих конструкций.
Таким образом, языки AXC содержат как статистическую информацию, благоприятствующую определенным группам слогов (слова или частичные слова, в разной степени), так и примеры слов, которые могут вызвать проекцию правила, потенциально применимого к неслыханным, новым словам. Поскольку в потоке никогда не было слов-правил, чувствительность к ним указывает на то, что учащийся определил структурные аспекты построения слова. Вместо этого, поскольку либо слова, либо их части всегда содержат ненулевые значения TП и частоты, способность извлекать их из потоковых сигналов, которые учащиеся идентифицировали их путем вычисления некоторой меры статистической информации.