ИНТЕНСИВНОСТЬ И ДЛИТЕЛЬНОСТЬ КАК САМОСТОЯТЕЛЬНЫЕ ИСТОЧНИКИ ПРОСОДИЧЕСКОЙ ИНФОРМАЦИИ. ДАННЫЕ ИССЛЕДОВАНИЙ ВОСПРИЯТИЯ СЛОВЕСНОГО УДАРЕНИЯ
Сегодня ни у кого из исследователей речи не вызывает сомнения, что интенсивность и длителость элементов речевого потока могут нести просодическую информацию и, в частности, сведения о месте словесного ударения.
Не существует, однако, единого мнения в вопросе о том, являются ли эти признаки самостоятельными или при восприятии речи они образуют некоторый сложный, но один признак. Так, предпринимались попытки объединить их в параметр типа «текущей энергии», чтобы избежать измерения двух самостоятельных параметров. Как было установлено при анализе акустического речевого сигнала, акустическая энергия гласного достаточно хорошо коррелирует со степенью его ударенности в английском [354j и украинском [22] языках. Использование энергии гласного для принятия решения о месте словесного ударения предполагает наличие устройства, интегрирующего интенсивность речевого сигнала за время, соответствующее длительности гласного, и сбрасывающего до нуля вычисленное значение энергии после снятия отсчета, чтобы сделать возможным вычисление энергии следующего гласного.В главе 3 было показано, что при восприятии речи слуховая система человека должна осуществлять сегментацию непрерывного речевого сигнала на последовательность отрезков «гласных» и «негласных». Этим создается возможность интегрирования интенсивности сигнала на участке гласного. Однако данных о существовании в слуховой системе измерителя энергии со сбросом пока нет и, кроме того, психоакустические исследования показывают, что при восприятии словесного ударения человек не пользуется полной энергией гласного [136].
Некий эквивалент «текущей энергии» могла бы дать обычная схема выделения общей энергетической огибающей речевого сигнала при соответствующем подборе параметров ее элементов: детектора и фильтра нижних частот. Выходной сигнал такого устройства имел бы множество максимумов, соответствующих слоговым ядрам (гласным), и задача поиска места словесного ударения решалась бы путем выделения и сравнения этих максимумов без сегментации речевого потока.
Очевидно, с точки зрения автоматического распознавания такой подход весьма привлекателен, но с точки зрения психоакустики он кажется весьма неправдоподобным.Из психоакустических измерений следует, что аналогом «текущей энергии» в слухе может быть громкость звука. Поскольку все модели слухового измерителя громкости имеют интегрирующее звено (как правило, в виде фильтра нижних частот), при определенном соотношении постоянной времени такого фильтра и длительности звука громкость последнего может быть не только функцией интенсивности, но и длительности. Не исключено поэтому, что при восприятии словесного ударения различия в длительности звуков речи при равной их интенсивности могли бы восприниматься не сами по себе, а через различия в громкости этих звуков.
Экспериментально показано, что при средних уровнях интен-сивности фильтр нижних частот модели слухового измерителя громкости должен иметь постоянную времени в 30—50 мс [442].
Если минимальную длительность гласного в речи принять равной 50 мс, то при такой постоянной времени увеличение длительности гласного до 100 мс при неизменной интенсивности даст наибольшее приращение его громкости, эквивалентное увеличению интенсивности на 2—3 дБ. А изменение длительности гласного, скажем, от 100 до 200 мс уже не даст практически никакого увеличения его громкости.
Исследования, посвященные восприятию словесного ударения в двусложных словах, показывают, что при равной длительности гласных увеличение интенсивности одного из них на 3—5 дБ еще не приводит к восприятию его как ударного р07, 314, 398]. Из этого можно сделать вывод, что изменение длительности звуков речи вряд ли может восприниматься через изменение их громкости.
С другой стороны, известна способность человека оценивать звуки по длительности, причем субъективная длительность звука в широком диапазоне изменения интенсивности не зависит от по-следней [541]. Кроме того, относительный дифференциальный порог по длительности, полученный в опытах, где оценивалась именно длительность стимула, в интересующем нас диапазоне длительностей (50 мс и более) не превышает 10—15% [173 223, М7] и достаточно хорошо совпадает с величинами, полученными в экспериментах, где критерием служила степень ударенности (см.
раздел 5.2). Еще одним аргументом в пользу возможности независимого измерения слухом интенсивности и длительности элементов речевого потока может быть тот факт, что в ряде языков длительность является единственным фонематическим признаком некоторых гласных (см. главу 3).Таким образом, есть все основания предположить, что в процессе восприятия речи интенсивность и длительность являются самостоятельно измеряемыми параметрами, но при принятии решения о том или ином просодическом признаке они используются одновременно, причем вполне возможно, что влияние («вес») каждого из них не одинаково.
| Экспериментально-фонетические исследования признаков сло-весного ударения привели к выводу, что в русском языке интен-сивность менее существенна, чем длительность [в0' 74' 125], что «относительная интенсивность гласного зависит не столько от его ударности-неударности, сколько от его места в слове» [15]. Попытки выяснить роль интенсивности и длительности в восприятии словесного ударения приводят подчас к противоречивым результатам; это либо является следствием использования разных методических подходов, либо отражает различие между языками. Так, в голландском языке ни увеличение интенсивности, ни увеличение длительности гласного в синтетическом сигнале не вызывает эффекта восприятия его ударным [314].х В английском языке по данным одних авторов интенсивность не играет роли в создании ударения [38в], другие полагают, что и длительность, и интенсивность создают эффект выделенности, но только «вес» каждого из этих признаков неодинаков [2вз]. К аналогичным выводам приходят и другие исследователи, изучавшие роль этих параметров в вос- цриятии словесного ударения в русском [7>136], польском [307] и английском I398] языках.
На рис. 5.1. и 5.2 представлены частоты восприятия ударения на первом слоге синтетической двусложной последовательности носителями разных языков (английского, польского, русского) в функции разности длительностей и интенсивностей первого и второго гласных.
Эти результаты получены в экспериментах, где англичанам и полякам предъявляли синтетические слова [sasa], [soso] и [sisi], а испытуемым-русским — последовательность гласных, разделенных короткой паузой (такой сигнал воспринимается как слово [ага]). Носителям английского и польского языков разрешались три вида ответов на каждый стимул: «первый ударный», «второй ударный» и «не знаю, не уверен, ударные оба». Носителям русского языка неопределенные ответы были запрещены.Приведенные на рис. 5.1 данные о восприятии словесного ударения англичанами и поляками получены в экспериментах [307, 308], где носителям разных языков предъявлялись практически одинаковые синтетические сигналы. Если бы признаком словесного ударения была громкость, следовало бы ожидать одинаковых результатов для носителей разных языков, так как в этом случае восприятие ударения определялось бы свойствами измерителя громкости в слуховой системе человека. Совершенно очевидно, однако, что распределения на рис. 5.1, А и 5.1, Б существенно различаются. Такой результат возможен при условии, что длительность и интенсивность измеряются как независимые признаки и по-разному используются носителями разных языков.
По виду приведенных на рис. 5.1 и 5.2 распределений можно сделать заключение, что в исследованных языках (английском, польском и русском) и интенсивность, и длительность являются признаками словесного ударения. Ясно также, что влияние каждого из этих признаков на восприятие словесного ударения (его «вес») неодинаково в разных языках.
Семейство гистограмм, приведенных, например, на рис. 5.2, можно описать одним выражением, учитывающим зависимость вероятности ответа «первый слог ударный» сразу от двух параметров сигнала: разности интенсивностей и длительностей гласных, — применив следующую процедуру.
требует специального изучения. Видимо, говорить о «весе» конкретного признака при передаче просодической информации имеет смысл лишь применительно к тем языкам, в которых данный признак не является фонематическим.
Допустим, что при заданной разности интенсивностей гласных зависимость вероятности ответа «первый слог ударный» от разности длительностей может быть аппроксимирована интегральной кривой нормального распределения с параметрами АТ и а. Вычислив значения этих параметров для каждой из приведенных на рис. 5.2 є, &Т, мс
Рис. 5.3. Параметры интегральных кривых нормального распределения, аппроксимирующих гистограммы ответов «первый слог ударный» (рис. 5.2), при разном соотношении интенсивностей гласных в двусложном синтетическом стимуле.
По оси абсцисс — разность интенсивностей первого и второго гласных; по оси ординат — разность длительностей этих гласных, при которой оба слога воспринимаются ударными с равной вероятностью, и величина среднеквадратического отклонения. Крестики — среднеквадратическое отклонение, точка — пограничная величина разности длительностей.
гистограмм, получим зависимости AT и а от разности интенсивностей АI (рис. 5.3). На этом рисунке отчетливо выделяются две области: область сравнительно постоянных а и область, в которой а увеличивается с увеличением разности интенсивностей. Последнее, вероятнее всего, является следствием неестествен-ности части использованных в эксперименте сигналов с точки зрения носителя русского языка: в естественной речи первый глас- 99
7* ный в двусложном слове не может быть существенно меньше второго по интенсивности. Судя по данным рис. 5.3, этот эффект начинает сказываться при AI = — 4 дБ.
Рассмотрим далее только ту область, в которой а постоянна. Здесь усредненное среднеквадратическое отклонение (а) равно 37.2 мс, а зависимость AT от разности интенсивностей (в дБ) может быть представлена выражениемAT = а -{- Ъ • А/, где а = —20мси6 = —1.95 мс/дБ. Вероятность восприятия ударения на первом слоге при заданных разностях интенсивностей и длительностей гласных теперь может быть получена из таблиц интегральных вероятностей по известной величине нормированного отклонения:z = (AT-AT)/а = (АГ— а — ЬМ)/а =(AT - — а)/а — Ъ-АЦа, ИЛИZ=(AT — а)/о — АН ог, Где аг = а/Ь.
Это выражение дало бы возможность оценить «вес» каждого из параметров, если бы удалось найти способ сравнивать столь разные параметры, как длительность (в мс) и интенсивность (в дБ).
Одна из возможностей заключается в установлении того количества дифференциальных порогов, на которое надо изменить каждый из рассматриваемых признаков, чтобы получить одно н то же приращение нормированного отклонения.
В результате аппроксимации экспериментальных данных имеем а = 37.2 мс и ai = 19.1 дБ. Исходная длительность гласного в этих экспериментах [13в] составляла 100 мс, что при относительном дифференциальном пороге 10% дает величину абсолютного дифференциального порога 10 мс. При а = 37.2 мс изменениеzна единицу будет достигнуто при изменении длительности гласного на 3.72 величины дифференциального порога.Для интенсивности абсолютный дифференциальный порог равен 0.3—0.7 дБ [153], и, следовательно, изменениеzна единицу достигается при изменении интенсивности гласного на 27—64 величин дифференциального порога.
При этих условиях следует признать, что длительность гласного имеет больший «вес» при определении места словесного ударения.
Еще по теме ИНТЕНСИВНОСТЬ И ДЛИТЕЛЬНОСТЬ КАК САМОСТОЯТЕЛЬНЫЕ ИСТОЧНИКИ ПРОСОДИЧЕСКОЙ ИНФОРМАЦИИ. ДАННЫЕ ИССЛЕДОВАНИЙ ВОСПРИЯТИЯ СЛОВЕСНОГО УДАРЕНИЯ:
- ИНТЕНСИВНОСТЬ И ДЛИТЕЛЬНОСТЬ КАК САМОСТОЯТЕЛЬНЫЕ ИСТОЧНИКИ ПРОСОДИЧЕСКОЙ ИНФОРМАЦИИ. ДАННЫЕ ИССЛЕДОВАНИЙ ВОСПРИЯТИЯ СЛОВЕСНОГО УДАРЕНИЯ
- Невербальньїе средства общения