<<
>>

ИНТЕНСИВНОСТЬ И ДЛИТЕЛЬНОСТЬ КАК САМОСТОЯТЕЛЬНЫЕ ИСТОЧНИКИ ПРОСОДИЧЕСКОЙ ИНФОРМАЦИИ. ДАННЫЕ ИССЛЕДОВАНИЙ ВОСПРИЯТИЯ СЛОВЕСНОГО УДАРЕНИЯ

Сегодня ни у кого из исследователей речи не вызывает сомнения, что интенсивность и длителость элементов речевого потока могут нести просодическую информацию и, в частности, сведения о месте словесного ударения.

Не существует, однако, единого мнения в вопросе о том, являются ли эти признаки самостоятельными или при восприятии речи они образуют некоторый сложный, но один признак. Так, предпринимались попытки объединить их в параметр типа «текущей энергии», чтобы избежать измерения двух самостоятельных параметров. Как было установлено при анализе акустического речевого сигнала, акустическая энергия гласного достаточно хорошо коррелирует со степенью его ударенности в английском [354j и украинском [22] языках. Использование энергии гласного для принятия решения о месте словесного ударения предполагает наличие устройства, интегрирующего интенсивность речевого сигнала за время, соответствующее длительности гласного, и сбрасывающего до нуля вычисленное значение энергии после снятия отсчета, чтобы сделать возможным вычисление энергии следующего гласного.

В главе 3 было показано, что при восприятии речи слуховая система человека должна осуществлять сегментацию непрерывного речевого сигнала на последовательность отрезков «гласных» и «негласных». Этим создается возможность интегрирования интенсивности сигнала на участке гласного. Однако данных о существовании в слуховой системе измерителя энергии со сбросом пока нет и, кроме того, психоакустические исследования показывают, что при восприятии словесного ударения человек не пользуется полной энергией гласного [136].

Некий эквивалент «текущей энергии» могла бы дать обычная схема выделения общей энергетической огибающей речевого сигнала при соответствующем подборе параметров ее элементов: детектора и фильтра нижних частот. Выходной сигнал такого устройства имел бы множество максимумов, соответствующих слоговым ядрам (гласным), и задача поиска места словесного ударения решалась бы путем выделения и сравнения этих максимумов без сегментации речевого потока.

Очевидно, с точки зрения автоматического распознавания такой подход весьма привлекателен, но с точки зрения психоакустики он кажется весьма неправдоподобным.

Из психоакустических измерений следует, что аналогом «текущей энергии» в слухе может быть громкость звука. Поскольку все модели слухового измерителя громкости имеют интегрирующее звено (как правило, в виде фильтра нижних частот), при определенном соотношении постоянной времени такого фильтра и длительности звука громкость последнего может быть не только функцией интенсивности, но и длительности. Не исключено поэтому, что при восприятии словесного ударения различия в длительности звуков речи при равной их интенсивности могли бы восприниматься не сами по себе, а через различия в громкости этих звуков.

Экспериментально показано, что при средних уровнях интен-сивности фильтр нижних частот модели слухового измерителя громкости должен иметь постоянную времени в 30—50 мс [442].

Если минимальную длительность гласного в речи принять равной 50 мс, то при такой постоянной времени увеличение длительности гласного до 100 мс при неизменной интенсивности даст наибольшее приращение его громкости, эквивалентное увеличению интенсивности на 2—3 дБ. А изменение длительности гласного, скажем, от 100 до 200 мс уже не даст практически никакого увеличения его громкости.

Исследования, посвященные восприятию словесного ударения в двусложных словах, показывают, что при равной длительности гласных увеличение интенсивности одного из них на 3—5 дБ еще не приводит к восприятию его как ударного р07, 314, 398]. Из этого можно сделать вывод, что изменение длительности звуков речи вряд ли может восприниматься через изменение их громкости.

С другой стороны, известна способность человека оценивать звуки по длительности, причем субъективная длительность звука в широком диапазоне изменения интенсивности не зависит от по-следней [541]. Кроме того, относительный дифференциальный порог по длительности, полученный в опытах, где оценивалась именно длительность стимула, в интересующем нас диапазоне длительностей (50 мс и более) не превышает 10—15% [173 223, М7] и достаточно хорошо совпадает с величинами, полученными в экспериментах, где критерием служила степень ударенности (см.

раздел 5.2). Еще одним аргументом в пользу возможности независимого измерения слухом интенсивности и длительности элементов речевого потока может быть тот факт, что в ряде языков длительность является единственным фонематическим признаком некоторых гласных (см. главу 3).

Таким образом, есть все основания предположить, что в процессе восприятия речи интенсивность и длительность являются самостоятельно измеряемыми параметрами, но при принятии решения о том или ином просодическом признаке они используются одновременно, причем вполне возможно, что влияние («вес») каждого из них не одинаково.

| Экспериментально-фонетические исследования признаков сло-весного ударения привели к выводу, что в русском языке интен-сивность менее существенна, чем длительность [в0' 74' 125], что «относительная интенсивность гласного зависит не столько от его ударности-неударности, сколько от его места в слове» [15]. Попытки выяснить роль интенсивности и длительности в восприятии словесного ударения приводят подчас к противоречивым результатам; это либо является следствием использования разных методических подходов, либо отражает различие между языками. Так, в голландском языке ни увеличение интенсивности, ни увеличение длительности гласного в синтетическом сигнале не вызывает эффекта восприятия его ударным [314].х В английском языке по данным одних авторов интенсивность не играет роли в создании ударения [38в], другие полагают, что и длительность, и интенсивность создают эффект выделенности, но только «вес» каждого из этих признаков неодинаков [2вз]. К аналогичным выводам приходят и другие исследователи, изучавшие роль этих параметров в вос- цриятии словесного ударения в русском [7>136], польском [307] и английском I398] языках.

На рис. 5.1. и 5.2 представлены частоты восприятия ударения на первом слоге синтетической двусложной последовательности носителями разных языков (английского, польского, русского) в функции разности длительностей и интенсивностей первого и второго гласных.

Эти результаты получены в экспериментах, где англичанам и полякам предъявляли синтетические слова [sasa], [soso] и [sisi], а испытуемым-русским — последовательность гласных, разделенных короткой паузой (такой сигнал воспринимается как слово [ага]). Носителям английского и польского языков разрешались три вида ответов на каждый стимул: «первый ударный», «второй ударный» и «не знаю, не уверен, ударные оба». Носителям русского языка неопределенные ответы были запрещены.

Приведенные на рис. 5.1 данные о восприятии словесного ударения англичанами и поляками получены в экспериментах [307, 308], где носителям разных языков предъявлялись практически одинаковые синтетические сигналы. Если бы признаком словесного ударения была громкость, следовало бы ожидать одинаковых результатов для носителей разных языков, так как в этом случае восприятие ударения определялось бы свойствами измерителя громкости в слуховой системе человека. Совершенно очевидно, однако, что распределения на рис. 5.1, А и 5.1, Б существенно различаются. Такой результат возможен при условии, что длительность и интенсивность измеряются как независимые признаки и по-разному используются носителями разных языков.

По виду приведенных на рис. 5.1 и 5.2 распределений можно сделать заключение, что в исследованных языках (английском, польском и русском) и интенсивность, и длительность являются признаками словесного ударения. Ясно также, что влияние каждого из этих признаков на восприятие словесного ударения (его «вес») неодинаково в разных языках.

Семейство гистограмм, приведенных, например, на рис. 5.2, можно описать одним выражением, учитывающим зависимость вероятности ответа «первый слог ударный» сразу от двух параметров сигнала: разности интенсивностей и длительностей гласных, — применив следующую процедуру.

требует специального изучения. Видимо, говорить о «весе» конкретного признака при передаче просодической информации имеет смысл лишь применительно к тем языкам, в которых данный признак не является фонематическим.

Допустим, что при заданной разности интенсивностей гласных зависимость вероятности ответа «первый слог ударный» от разности длительностей может быть аппроксимирована интегральной кривой нормального распределения с параметрами АТ и а. Вычислив значения этих параметров для каждой из приведенных на рис. 5.2 є, &Т, мс

Рис. 5.3. Параметры интегральных кривых нормального распределения, аппроксимирующих гистограммы ответов «первый слог ударный» (рис. 5.2), при разном соотношении интенсивностей гласных в двусложном синтетическом стимуле.

По оси абсцисс — разность интенсивностей первого и второго гласных; по оси ординат — разность длительностей этих гласных, при которой оба слога воспринимаются ударными с равной вероятностью, и величина среднеквадратического отклонения. Крестики — среднеквадратическое отклонение, точка — пограничная величина разности длительностей.

гистограмм, получим зависимости AT и а от разности интенсивностей АI (рис. 5.3). На этом рисунке отчетливо выделяются две области: область сравнительно постоянных а и область, в которой а увеличивается с увеличением разности интенсивностей. Последнее, вероятнее всего, является следствием неестествен-ности части использованных в эксперименте сигналов с точки зрения носителя русского языка: в естественной речи первый глас- 99

7* ный в двусложном слове не может быть существенно меньше второго по интенсивности. Судя по данным рис. 5.3, этот эффект начинает сказываться при AI = — 4 дБ.

Рассмотрим далее только ту область, в которой а постоянна. Здесь усредненное среднеквадратическое отклонение (а) равно 37.2 мс, а зависимость AT от разности интенсивностей (в дБ) может быть представлена выражениемAT = а -{- Ъ • А/, где а = —20мси6 = —1.95 мс/дБ. Вероятность восприятия ударения на первом слоге при заданных разностях интенсивностей и длительностей гласных теперь может быть получена из таблиц интегральных вероятностей по известной величине нормированного отклонения:z = (AT-AT)/а = (АГ— а — ЬМ)/а =(AT - — а)/а — Ъ-АЦа, ИЛИZ=(AT — а)/о — АН ог, Где аг = а/Ь.

Это выражение дало бы возможность оценить «вес» каждого из параметров, если бы удалось найти способ сравнивать столь разные параметры, как длительность (в мс) и интенсивность (в дБ).

Одна из возможностей заключается в установлении того количества дифференциальных порогов, на которое надо изменить каждый из рассматриваемых признаков, чтобы получить одно н то же приращение нормированного отклонения.

В результате аппроксимации экспериментальных данных имеем а = 37.2 мс и ai = 19.1 дБ. Исходная длительность гласного в этих экспериментах [13в] составляла 100 мс, что при относительном дифференциальном пороге 10% дает величину абсолютного дифференциального порога 10 мс. При а = 37.2 мс изменениеzна единицу будет достигнуто при изменении длительности гласного на 3.72 величины дифференциального порога.

Для интенсивности абсолютный дифференциальный порог равен 0.3—0.7 дБ [153], и, следовательно, изменениеzна единицу достигается при изменении интенсивности гласного на 27—64 величин дифференциального порога.

При этих условиях следует признать, что длительность гласного имеет больший «вес» при определении места словесного ударения.

<< | >>
Источник: Чистович Л. А., Венцов А. В., ГранстремМ. П. и др. Физиология речи. Восприятие речи человеком. «Наука»,1976. 388 с.. 1976

Еще по теме ИНТЕНСИВНОСТЬ И ДЛИТЕЛЬНОСТЬ КАК САМОСТОЯТЕЛЬНЫЕ ИСТОЧНИКИ ПРОСОДИЧЕСКОЙ ИНФОРМАЦИИ. ДАННЫЕ ИССЛЕДОВАНИЙ ВОСПРИЯТИЯ СЛОВЕСНОГО УДАРЕНИЯ:

  1. ИНТЕНСИВНОСТЬ И ДЛИТЕЛЬНОСТЬ КАК САМОСТОЯТЕЛЬНЫЕ ИСТОЧНИКИ ПРОСОДИЧЕСКОЙ ИНФОРМАЦИИ. ДАННЫЕ ИССЛЕДОВАНИЙ ВОСПРИЯТИЯ СЛОВЕСНОГО УДАРЕНИЯ
  2. Невербальньїе средства общения