ВВЕДЕНИЕ
При взаимодействии социальные субъекты автоматически адаптируют свое поведение к неблагоприятным условиям, которые могут поставить под угрозу их общение. В частности, голосовые изменения, вызванные шумом, известны под названием "Ломбардный эффект". Сначала это явление было задокументировано у людей, затем у других видов животных, особенно птиц и млекопитающих. Кроме того, ломбардный эффект имеет последствия для дизайна виртуальных агентов и социальных роботов. Действительно, он может ухудшить работу систем распознавания речи, которые, как правило, основаны на записи речевого корпуса в тихих условиях. Реализация ломбардного эффекта в системах диалога также повысила бы их адаптацию к шумной среде биомиметическим способом.
Ломбардный эффект заключается в основном в увеличении интенсивности речи. Это автоматическое явление, которое может лишь частично контролироваться динамиком. Он варьируется в зависимости от типа шума и значительно отличается от одного человека к другому. Это также зависит от участия выступающего. Действительно, есть некоторые свидетельства того, что ломбардный эффект сильнее при выполнении более интерактивных задач: Он увеличивается во время рассказов и этикетирования
общения с другими читателями
во время разговора с самим собой.
Кроме того, интенсивность хорошо известна как один из прозодических параметров, который часто подразумевается для выработки различных социально-аффективных установок (авторитет, неожиданность и т.д.) на многих языках. При личном взаимодействии изменения интенсивности, обусловленные ломбардным эффектом, почти никогда не путают с теми, которые имеют социально-аффективное значение. Однако в случае удаленного взаимодействия плохо сформировавшийся эффект Ломбарда может быть воспринят как путаница с социальными подсказками.
Основное внимание, будет уделено исследованию ломбардного эффекта в робототехнике. Специфика этого контекста заключается в том, что все собеседники находятся не в одной комнате: один из них дистанционно взаимодействует через робота, который воплощает своего управляющего (пилота) в "локальном" пространстве. Поэтому это асимметричная система, потому что пилот должен быть акустически погружен как в удаленную, так и в местную среду, в то время как собеседники напрямую общаются с роботом в местной среде. Поскольку ломбардный эффект происходит автоматически, он должен влиять на голос пилота независимо от того, откуда исходит шум. Напротив, если шум возникает в отдаленном пространстве, собеседники не могут слышать его так громко, как пилот, возможно, совсем. Тем не менее, они могут слышать голосовые адаптации пилота, которые могут изменить их поведение.
МЕТОДЫ
Методология
Для того чтобы реализовать это исследование, был разработан эксперимент с двумя предметами, разделенными в двух разных комнатах. Один из них играл роль дистанционного пилота (R), а другой - местного собеседника (L), взаимодействующего с роботом. Было протестировано несколько конфигураций, чтобы изолировать особенности ломбардного эффекта в удаленной коммуникации.
Условие использовалось для того, чтобы получить эталонное значение без дополнительного шума. Во всех других условиях R слышал шум, но этот шум не всегда слышал L. В состоянии B в помещении R воспроизводился шум. Поскольку голос R записывался с помощью микрофона, надетого на голову, этот шум был в значительной степени ослаблен для другого объекта, поэтому R не нужно было говорить громче, чтобы улучшить разборчивость речи. Напротив, даже если L не слышал шума в этом состоянии, L мог говорить громче, чтобы быть понятым для R. В состоянии D звук воспроизводился в местном пространстве, и оба субъекта могли его слышать. Этот случай близок к стандартной коммуникации с шумом, когда собеседники находятся в одной и той же обстановке. Наконец, в состоянии С, предварительно записанный шум был введен в наушники R, чтобы заставить R поверить, что этот звук существовал в местном пространстве и был слышен L.
ПРОЦЕДУРА
Эксперимент был представлен испытуемым в качестве теста визуального интерфейса робота. L сидел перед роботом и задавал список простых вопросов R, который был пилотом робота. Эти вопросы были разработаны для того, чтобы они были очень простыми и вызывать конечный набор ответов. Примерами таких вопросов являются следующие:
"Какой цвет травы?"
"Сколько ног у лошади?"
"Сколько будет 2 x
Для каждых 10 вопросов существовала специальная инструкция, в которой R предлагалось обрабатывать робота через интерфейс. Мы притворились, что измеряем время ответа, чтобы количественно оценить доступность пилотного интерфейса. Объекты были проинформированы о том, что тест должен быть проведен без перерыва. Действительно, во время нашего первого теста, испытуемый L перестал говорить, когда звук D проигрывал. Три различных шума регулярно вызывались экспериментатором.
Чтобы избежать искажения экспериментальных результатов, мы хотели подтолкнуть испытуемых к мысли, что возникновение шума не имеет отношения к эксперименту. Поэтому источники шума периодически скрывались и рассеивались. Мы использовали заранее записанные реалистичные шумы кофеварки и сеялки. Перед подведением итогов, большинство испытуемых считали, что шумы были случайными, и никто из них не догадывался, что целью эксперимента было измерение их голосовой адаптации к шуму. Это подтверждает, что наш сценарий был правдоподобным. Заполнение 140 вопросов заняло около 15 минут.