<<
>>

4.3. ФОНЕМА КАК ЗАПОМИНАЕМОЕ СОКРАЩЕННОЕОПИСАНИЕ СИГНАЛА

Переход от описания сигнала в терминах акустических признаков к фонемному описанию (описанию в терминах дифференциальных признаков) не только обеспечивает возможность дальнейшего смыслового (лексического и синтаксического) анализа сообщения, он также резко сокращает количество информации, необходимой для записи сигнала в памяти.

Гипотеза о том, что при запоминании речевого сигнала человек использует не его подробное акустическое изображение, но принятое о сигнале фонемное решение, проверялась в многочисленных экспериментах.

4.3.1. СОГЛАСНЫЕ

Все данные, касающиеся согласных, были получены методом сравнения функций идентификации с функциями различения. В экспериментах такого рода применяются синтезированные стимулы, образующие ряд по какому-то акустическому признаку стимула.

Рассмотрим в качестве примера опыт со стимулами, различающимися по так называемому времени начала голоса. В различных языках выделяются три группы смычных согласных: полностью звонкий согласный, глухой неаспирированный согласный и глухой аспирированный согласный. В случае полностью звонкого согласного (например, русские [bl, [d], [g]) голосовая^щель смы-

I ™

і

Рис. 4.1. Определение параметра «время начала голоса». По [17в].

На А: — динамические спектрограммы слогов [di], [ti] и [thi];по оси абсцисс — время, по оси ординат — частота. На Б — энергетические огибающие тех же слогов. По оси абсцисс — время, по оси ординат — интенсивность. Стрелками отмечен интервал времени между началом колебаний голосовых связок и размыканием смычки в [di] и интервал времени между появлением шума взрыва и аспирации и началом колебаний голосовых

связок в [ti] и [thi].

кается значительно раньше размыкания смычки, в случае глухого аспирированного согласного (например, английские [ph], [th], [kh]) голосовая щель остается открытой некоторое время после размыкания смычки.

В качестве акустического коррелята этого признака было Пред

ложено [3

67, 3681

принять параметр, названный «время начала

голоса».

Рис. 4.1, где приведены спектрограммы слога с полностью

А В О -10 -го

/ гтт 1ЯЕШДШ. 'Пб 3350-Ш0 JL 25Ш910 IT тжа 10 a 1500-1705 1150-1305 J

0 sb-m

S09-7Z7 70-190 -150

+ 150 +300 +450

+ 15В +300 +450 мс

Рис. 4.2. Схематическое изображение синтетических слогов, начинающихся со звонкового согласного (Л) и глухого аспирированного согласного (Б).

По [17в].

По оси абсцисс — «время начала голоса», начало отсчета соответствует моменту размыкания смычки согласного; по вертикали — характеристики каналов управления синтезато-ром: 1 — уровень интенсивности сигнала (в дБ); 2— частота основного тона (сохраняется постоянной и равной 114 Гц); 3 — характер возбуждения (а — голосовой, б— шумовой); 4 — спектр сигнала, заданного в 18 частотных полосах (номера и границы полос в Гц указаны в соответствующих столбцах) так, что энергия в полосе имеет максимальное значение

в зачерненных областях.

Звонким согласным [di], глухим неаспирированным согласным [til и глухим аспирированным согласным [thi], иллюстрирует способ измерения этого параметра на динамических спектрограммах. За точку отсчета принимается момент размыкания смычки согласного, характеризующийся появлением энергии в высокочастотной части спектра (шум взрыва, появление энергии в области второй и более высоких формант). Начало голоса, если оно предшествует размыканию смычки, определяется по появлению энергии в области основной частоты голоса. В случае начала голоса после размыкания смычки имеют место не только появление энергии на основной частоте и проявление периодического характера

всего сигнала, но и резкое увеличение амплитуды первой форманты и общей энергии сигнала.

Слоги, приведенные на рис. 4.1, характеризуются по параметру «время начала голоса» значениями —85, 15 и 110 мс. Для исследования восприятия был синтезировал набор стимулов, изменяющихся в широком диапазоне значений этого параметра. Характеристики двух крайних стимулов показаны на рис. 4.2. В данном случае стимулы соответствуют слогу с гласным [а] и переднеязычным взрывным согласным [d] и [th].

Аналогичным образом были синтезированы слоги с губным согласным.

Рис. 4.3. Функции идентификации синтетических слогов, упорядоченных по параметру «время начала голоса». По [зв9].

По оси абсцисс — «время начала голоса» (начало отсчета — то же, что и на рис. 4.2); по оси ординат — относительное число ответов [Ы (кривая 2) и [ph] (кривая 1).

Для получения функции идентификации стимулы, следующие друг за другом в случайном порядке, записывались на магнитофонную ленту и предъявлялись испытуемым. Испытуемые должны были записывать в ответ на каждый стимул букву, обозначающую ту фонему, на которую этот стимул больше всего похож. Набор букв был ограничен экспериментатором (метод форсированного выбора).

На рис. 4.3 приведены результаты идентификации губных согласных группой слушателей-американцев [369]. Можно видеть, что использованный ряд стимулов разделился на две области, одна из которых связана с фонемой [Ь], вторая — с [рь]. Значение параметра «время начала голоса», при котором ответы [Ь] и [ph] оказались равновероятными, называется фонемной границей между [Ь] и [рь] по указанному признаку.

После получения функции идентификации можно проверить предположение, что при запоминании и сравнении стимулов испытуемый действительно пользуется фонемами как субъективными описаниями этих стимулов.

Для этого используется метод АВХ-сравнения. Испытуемым предъявляются триады стимулов типа ж,.,хі+к, х{ ж xi+k, xi+k(і — порядковый номер стимула в ряду по значениям акустиче-ского параметра, к=1, 2, 3, 4). Задачей испытуемых является опре-деление того, с каким звуком триады — первым или вторым — совпадает последний звук. Построив такие триады для всех значений г, можно получить функцию различения — вероятность правильного ответа испытуемого в зависимости от положения стимулов но шкале акустического параметра. Зная функцию идентификации, легко вычислить теоретические значения функции различения при предположении, что вся информация о стимуле, которую испытуемый может запомнить, сводится к знанию выбранного в ответ на стимул фонемного символа.

Me останав-

Рис. 4.4. Функции различения синтетических слогов, упорядоченных по параметру «время начала голоса». По [177].

По оси абсцисс — «время начала голоса»; по оси ординат — относительное число случаев, когда данный стимул отличался от остальных. Кривые 1—з соответствуют стимулам, раз-личающимся на две, три и четыре градации параметра «время начала голоса». Прямая 4. соответствует положению фонемной границы между [Ь] и [рЬ] на рис. 4.3.

ливаясь на процедуре вычислений, укажем только, что в этом случае значения функции различения должны быть близки к вероятности случайного отгадывания на интервалах, лежащих внутри фонемных категорий, и должны достигать максимальных значений вблизи фонемных границ.

На рис. 4.4 приведены функции различения описанных стимулов, полученные на группе слушателей-американцев [369]. Сравне-ние рис. 4.3 и 4.4 показывает, что максимум на функции различения совпадает с положением границы между [Ь] и [рь] на функ-ции идентификации. Различение же стимулов внутри фонемных категорий оказывается очень плохим, близким к уровню случайного отгадывания.

Иная картина была получена для носителей языка таи. В этом языке имеются три губных согласных, различающихся по пара-метру «время начала голоса»: звонкий [Ь], глухой неаспирирован- ный [р] и глухой аспирированный [рь]. Эксперименты, описан-ные в [17?- 178 369], показали, что на функции различения, получен- ной на испытуемых-таиландцах, имеются два максимума, соот-ветствующие границам между [Ь], [р] и [р], [рь], определенным по функции идентификации.

.Данные, аналогичные только что описанным, были получены также в большом количестве экспериментов с синтезированными взрывными согласными, различающимися по направлению переходов F2и ^з [242, 353, 378 492]. При идентификации таких стимулов обычно удается получить три фонемные категории, соответствующие согласным с разным местом образования: [b], [d] и lg] или [р], [t] и [к]. Функции различения, полученные на таких стимулах, всегда имели максимумы в области фонемных границ.

4.3.2.

ГЛАСНЫЕ

Значительно более сложным оказался вопрос о субъективных речевых образах гласных. Сравнение функций раз-личения с функциями идентификации не позволило сделать опре-деленных выводов, так как было показано, что человек способен различать большое число градаций стимулов (синтезированных гласных), относимых им к одной и той же фонемной категории [гее, 480, 489] Этот результат можно было интерпретировать двоя-ким образом. Одна возможная интерпретация состояла в том, что множество фонетических образов гласных образует континуум, и в качестве субъективных признаков гласных используются координаты гласных в фонетическом пространстве (например, конфигурация речевого тракта). Другая интерпретация заклю-чалась в том, что, кроме фонемного решения о гласном, запоминается еще какая-то дополнительная информация (например, данные о спектре гласного).

Доказательство того, что, запоминая гласный, человек использует фонему в качестве описания этого гласного, было получено в экспериментах по прямому численному шкалированию субъ-ективного расстояния между гласными-стимулами, приведенными на рис. 4.5,А [47]. Фонемная идентификация этих стимулов группой русских слушателей показала, что стимулы 1—3 воспринимаются как [І], стимулы 4—9 — как [е], стимулы 10—12 — как [а].

На рис. 4.5,Б приведена зависимость субъективного расстоя-ния от расстояния между стимулами на двухформантной пло-скости (положение стимулов в двухформантной плоскости показано на рис. 4.5, А). Можно видеть, что зависимость имеет отчетливый ступенчатый характер: субъективное расстояние резко возрастает при переходе от одной фонемной категории к другой, оно мало меняется в пределах фонемной категории.

Это позволяет утверждать, что испытуемые пользуются фонемами в качестве описания стимулов и что расстояния, которые они указывают, это расстояния между фонемами. Однако такой

ступенчатый характер зависимости ярко выражен лишь в случае, если стимулы в оцениваемой паре принадлежат к разным фонемным категориям.

Другая картина наблюдается в том случае, когда оба стимула в паре относятся к одной и той же фонемной категории.

На рис. 4.6 приведены зависимости, полученные для пар [е]—[е]. Можно видеть, что субъективное расстояние монотонно возрастает с увели-

Б І-1

і = г

200 600 1000 Ги, 2

1 3 5 6 7 8 910 12 1 3 5 6 7 8 9 10 12

Рис. 4.5. Результаты экспериментов по психологическому шкалированию.

По J"].

Гц

2500

Л

с ?

зл

JS\

\

7\

2100

Л

\

1700 ¦

1300

НаА: положение в плоекоети первой и второй формант (F,F2) синтетических гласных, использованных в экспериментах; по оси абсцисс — частотаF,, по'оси ординат — частота F2;цифрами около точек обозначены номера стимулов. На Б: субъективные расстояния между парами синтетических гласных эспо оси абсцисс — номер стимулаxj, по оси ординат — субъективное расстояние в баллах междуxjи стимулом, номер которого(г) указан на каждом из четырех графиков; кривые 1 и 2 соответствуют разному порядку следования стимулов в парах(xfx,-или х ;х().

чением физической разницы между стимулами. Этого не могло бы быть, если бы информация о гласном, полученная при его восприятии, ограничивалась фонемным символом. Необходимо допустить, что человек способен на какое-то время запоминать не только фонему, выбранную на основании услышанного стимула, но и более подробное описание сигнала; назовем это условно «тембраль- ной информацией». В работе [266] исследовались идентификация и различение синтетических [і] и [е] гласных в условиях, когда после каждого стимула следовал дополнительный мешающий звук. Полученные

результаты оказались весьма близкими к тем, которые ранее наблюдались для согласных. Из рис. 4.7 видно, что на функции различения имеется отчетливый пик, соответствующий границе между

Рис. 4.6. Субъективные расстояния между парами гласных ^^принадле-жащими к одной и той же фонемной категории (стимулы 4—9 на рис. 4.5, А).

По [168].

По оси абсцисс —номера стимулов ху в соответствии с рис. 4.5, А; по оси ординат— субъективное расстояние в баллах. Параметром кривых 1—6 является номер стимула ^(соответственно i=4, 5, 6, 7, 8, 9). Вверх от горизонтальной прямой отложено субъективное расстояние для пар стимулов сj >і,вниз — для пар с г>j.

Рис. 4.7. Сравнение функций идентификации {А) и различения (Б) синтетических гласных. По [2вв].

По оси абсцисс — частотаF, синтетических гласных; по оси ординат — относительное число ответов [е] (А) и относительное число случаев, в которых данный стимул отличался

от остальных (Б).

фонемами [і] и [е]. Различение стимулов, лежащих внутри фонемной категории, оказывается плохим.

Итак, полученные данные позволяют сделать вывод, что множество субъективных образов гласных также является дискретным.

<< | >>
Источник: Чистович Л. А., Венцов А. В., ГранстремМ. П. и др. Физиология речи. Восприятие речи человеком. «Наука»,1976. 388 с.. 1976

Еще по теме 4.3. ФОНЕМА КАК ЗАПОМИНАЕМОЕ СОКРАЩЕННОЕОПИСАНИЕ СИГНАЛА:

  1. В чём причины?
  2. Объекты судебной экспертизы
  3. 1.2. Задачи и объекты судебной экспертизы
  4. 1.3. Объекты судебной экспертизы
  5. Пражский лингвистический кружок
  6. Московская фонологическая школа
  7. ГЛАВА 9. ОСНОВНЫЕ ПСИХОЛОГИЧЕСКИЕ ПРОЦЕССЫ ИСОСТОЯНИЯ
  8. Изменение социальной ситуации развития на протяжении дошкольного детства. Игра и другие виды деятельности. Общение со взрослыми и сверстниками. Развитие восприятия и мышления ребенка; развитие внимания и опосредованного поведения; развитие памяти; развитие воображения. Развитие личности дошкольника.
  9. Как вырабатываются навыки и умения?
  10. 63.Понятие фонемы
  11. 1.4. АВТОМАТИЧЕСКОЕ РАСПОЗНАВАНИЕ РЕЧИ
  12. 2.1. ОПИСАНИЕ СМЫСЛА И ПРЕДШЕСТВУЮЩИЕЕМУ ОПИСАНИЯ СООБЩЕНИЯ
  13. 3.3. ФОНЕМНЫЙ СОСТАВ ФОНЕТИЧЕСКОЙПОСЛЕДОВАТЕЛЬНОСТИ
  14. 4.3. ФОНЕМА КАК ЗАПОМИНАЕМОЕ СОКРАЩЕННОЕОПИСАНИЕ СИГНАЛА
  15. 4.5. ФОНЕМНАЯ КЛАССИФИКАЦИЯ
  16. ВОСПРИЯТИЕ ПРОСОДИЧЕСКОЙ ИНФОРМАЦИИ