汉语语调结构复杂性的语音学和音系学分析原载Proc. of PCC2012(《2012年中国语音学学术会议论文集》, 5月18—20日,上海)。

摘要 一个语言里语调的基频曲拱特点主要取决于重音凸显和短语结构的语音实现。对于声调语言来说,共同的核心问题之一就是,各个声调的音高运动究竟是怎样调节变化、以适应和实现一定韵律域内的重音凸显和短语结构的表达需要的。就汉语普通话而言,中间短语内部的声调、尤其是上声声调的音高运动行为又是导致表层语调结构复杂性的关键,至今众说纷纭。为此,本文试图通过对普通话中间短语内上声基频曲拱的解剖,分析普通话语调结构复杂性的语音学和音系学基础。初步考察结果显示,中间短语内基频曲拱的随机变化,不仅取决于各个调类的曲拱特征区别,而且跟各自固有的音区特征区别密切相关;普通话上声调的音高实现便是一个典型。它的低音区特征,作为其底层音系目标的本质特点,不但直接影响其在重音凸显和短语结构中的音高运动范围,而且决定了它不同于其他调类的音高突出方向。因此,即使不考虑更大范围语境因素的影响,短语的基频曲拱也会因为相邻声调间的彼此影响和相互制约而产生相当大的随机变化。正是这种音系特点及其独特的音高调节方式导致了语调表层基频曲拱的复杂表现。同时,相关的比较分析发现,声调在语流中的音高调节方式及其复杂程度还跟一个语言的音系特点诸如声调类型学特点或有无词重音等有关。

1 引言

1.1 汉语的语调结构究竟复杂在哪里?

说到导致汉语语调复杂性的要素,大家首先想到的自然是声调和重音,而且主要关注相关的音高运动问题,它们是构成汉语中性语调[1]的基础。在中国的语音学界和言语工程学界,早就不乏对汉语语调结构复杂性的探索,包括对声调跟语调关系的探索以及对话语重音凸显的一系列研究。从赵元任开始的,沈炯等学者进一步深入的关于调冠、调头、调核及调尾结构的分析,以吴宗济为首的一大批学者以各级变调规则为基础的详尽阐述,特别是近些年来不少学者对焦点重音的比较集中的研究,都大大地提高了对汉语语调结构复杂性的认识。但是,由于话语表层的音高输出、特别是话语中间短语内音节的音高上限(即高音点)表现异常复杂,往往突破高音下倾线的范围,因而普遍反映无法抓住这方面的变化规律。

那么,中间短语内的音高运动究竟特殊在哪里、复杂在哪里?说到这点,大家关注最多的、也是最熟悉的肯定是跟赵元任先生最早提出的变调和轻声相关的音高运动问题。然而,我们对于汉语的这些个性方面可能还远没有真正认识清楚。中间短语是语调结构的一个重要层级,然而,对于反映中间短语音高运动的连续的基频曲拱,却很难定量地加以描写。如上所述,通常看到的音高表现,是各个声调从底层向表层转换的最低层面到最高层面之间的多层、多次转换累积的结果,早已不是我们熟知的变调或轻声的一般模式所能准确描写的了。从自然话语的情况来看,中间短语部分复杂表现的关键,主要在于焦点与非焦点词之间的音高组合关系,这里既涉及音系学的底层构架,又涉及语音学的表层实现。重音是焦点表达的语音形式,重读情况下的声调一般表现为音阶的抬高和音域的扩大。在普通话里,这主要是通过高音点的抬高实现的;不过,上声除外,它的音高运动行为相当复杂,尤其是在中间短语内部。许多相关研究曾对上声问题作过专门的探讨,但众说不一,这就需要进一步的考察。

1.2 需要进一步考察的重点

1.2.1 关于重音音高凸显的一般看法

早在20世纪八九十年代,沈炯关于汉语语调的双线模型就比较集中地阐述了汉语重音的音高凸显问题,指出重音凸显的特征是高音线音高值的明显提升和紧接着的非重读部分高音线的骤落(sudden drop)[2]。此后的一系列相关实验研究也发现,跟重音相关的音高变化主要体现为总体音阈(pitch threshold)的突出和音域(pitch range)的扩大。譬如,王蓓等认为,高音点的提高是重读音节的主要征兆,而低音点的运动跟重音凸显没有太大关系,而且受低音下倾线的限制[3]。可是,曹剑芬等的研究[4]以及郑波的实验研究结果[5]都表明,上声跟阴平、阳平和去声情况下的音高突出不同,它主要表现为音阈(即高、低音点的上、下限threshold)的下沉或音域的扩大。因而认为,由句子重音的调节而导致的音节音高突出方式会受制于声调的音区特性,这是一种音系学制约的表现。然而,学界对这个问题存在不同的看法。于是,便引发了对于上声重音音高实现问题的一系列专门的探讨。

1.2.2 关于上声重音音高凸显问题的讨论

关于上声重音音高凸显问题讨论,主要涉及以下两个方面的疑问:第一,上声的重音突显究竟能否通过自身音高的调节来实现?第二,上声的重音突显究竟是跟高音点提升还是低音点的下落相关?

首先,权英实在她的《普通话句子重音的语调体现》一文中提出,上声强重音的一个组合特征是抬高前面音节的音高[6]。接着,凌锋的实验研究表明,上声强重音主要是通过压低后面第二个非轻声音节的高音点,改变周围音节音高特征的组合关系来实现[7]。此后,陈玉东的实验研究进一步明确指出,上声本调作重音时的凸显一般无法通过自身音高的调节来实现(尽管也会有通过降低低音点的方式来强调重音的情况存在,但这一现象还不具有显著意义),它只能依靠其前后位置音节的高音点的相对凸显来实现[8]

然而,此前的这些研究有两个方面的倾向可能影响其考察结果,一是只用高音点是否提升作为衡量标准,二是只关注上声重读的音高表现,而忽略了上声音高在语流中的一般运动规律。此外,自然话语中的重读是跟其他多重因素影响同时并存的,而此前的相关研究中所用的语料,多半是专门设计的、用以典型的焦点与非焦点对比的实验语句,这跟自然话语中的实际情况可能存在一定的系统差异。为此,本研究试图通过对比较接近自然话语的朗读语篇语料的分析,从解剖中间短语里的上声音高运动的一般行为入手,通过对自然语句本身包含的重读与非重读上声音高运动的比较,进一步考察它的音高凸显方式,以及它在形成错综复杂的短语基频曲拱方面的影响。本节仅仅报告局部的考察结果。

2 普通话上声重音音高凸显方式考察

作为预测试,首先采用Praat对多人朗读语篇语音库[9]中某个语篇的全部朗读语料进行声学分析。通过对男、女两人的全部上声基频曲拱的粗略考察,获得了如下初步印象:语流中的上声似乎多半是既有起始高音点的抬高,又有低音点的下落,而收尾高音点只是偶尔出现。在这里,高音点的抬高与低音点的下落看来都是事实,而且在两个发音人语料中的表现基本一致。这里的关键是,它们究竟是上声音高在语流中的一般特性还是重读时的特殊表现?如何衡量这些起点音高和收尾音高跟它的底层音高目标之间的关系?这里就涉及上声调低降升的感知问题,这个感知上的升尾究竟来自何方?

为了进一步确认上述表现是否具有普遍性,一方面把考察对象增加到男、女各两个人的语料;同时为了便于较为深入地解读这些复杂现象,这里缩小了考察范围,从该语篇中抽取了两个片段,对其中的上声音高运动行为进行分析解剖。

2.1 实验语料

本研究考察的语料由两组小句构成。第一组是:


可以用极简单的事例加以说明


它是“世间的问题,原来极复杂的,可以用极简单的事例加以说明”中的一个小句,共包含4个上声音节,其中“可”由于变调已读如阳平,所以这里的考察对象只有“可以”的“以”(以a)、 “简”和“加以”的“以”(以b)。根据听觉印象,“简”重读,“以a”和“以b”非重读。

第二组测试语料是一个长句,由四个小句构成:


现代经济学是这样表述的,制度至关紧要,制度是人选择的,是交易的结果


这段话语有“表”、“紧”、“选”和“果”四个上声音节,尽管它们都处于小句的常规重读部分,但具体重读的程度有所区别。根据听觉印象,“紧”和“选”较重,而“表”和“果”较轻。

2.2 实验方法

为了考察上声在短语任何位置上的音高实现,这里为不同位置上音节的高、低音点和音阶(pitch register,这里用音高高度pitch height代表)的度量设置了一种大致规整的参考基准,以便尽可能避免底层音高下倾因素的影响。各个位置上的参考基准可从如下计算获得:

F0r=f0h. b-(f0h. b-f0h. e)/(syll. n-1)∗(ta. n-1)

其中f0h. bf0h. e 分别为短语首、末音节的音高高度基频值,syll. n代表短语内的音节数目,ta. n 代表被测音节在短语内的序号,通过此法就可以计算出跟每个测试音节对应的基频参考值F0r。然后,以此为基准,计算每个被测音节的实测基频值跟相应位置参考基准值的差异,用以衡量各该音节的高、低音点运动和音阶运动偏离参考基准的方向和程度。

2.3 实验结果

图1显示的是第一组测试结果,从这组结果来看,重读的“简”的高音点偏离值略高于非重读的“以a”,但却显著地低于非重读的“以b”,这说明上声重读时,其高音点并不总是抬高的。可是,“简”的低音点的偏离值却显著地低于这两个非重读的“以”。而且,四个话者的表现一致。这说明上声重读时,其低音点总是压得更低。

图1 重读与非重上声高、低音点偏离参考值比较

图2出示的是第二组语料的各小句内不同重度上声的高、低音点偏离参考基准的情况比较。可以看到,所有的上声,不管轻重地位有何不同,它们的低音点无一例外地低于参考基准值,而且重读程度越高,低音点的向下偏离越明显。而高音点则没有一致的趋势,也看不出跟重读程度有什么内在的关联。这跟在图1中看到的情况是一致的。

图2 语句内不同重度上声高、低音点偏离参考值比较

其实,无论重读与否,上声的音阶总体趋势都是低于参考基准值,这可以从表1出示的这几个上声音节的音阶偏离参考标尺的数据看出,说明这是上声音高实现的一般特点。但是,重读与非重读的上声音阶之间存在着显著的差异:“简”的音阶(不管男女)一律明显低于两个“以”的音阶。这表明,上声声调的音高凸显方式确实跟其余几个声调不同,它的音阶不是向上突出,而是向下突出。

表1 重读与非重读上声音阶偏离参考值(Hz)比较

3 讨论和结论

3.1 关于上声底层音高目标问题的讨论

传统语音学把普通话上声的音值定为214,但现代语音学的实验研究结果早就对此提出了质疑。早在20世纪80年代初,吴宗济就发现,上声在连调中的特征就是低。他据实验结果画出的上声连调调形基本都是低平[10]。沈炯的研究也确认“上声基调核心段是低音区平调。”“上声基调还可能有中音区尾音特征,但只在单说或停顿前它才以声调尾音形式出现,以对偶关系支撑上声低音特征”[11]。此后,曹文的感知研究[12]和石锋的研究[13]也都认为,普通话上声的本质是低平调,214的升尾属于边界成分,调头的降和调尾的升,都是次要的。

而从本研究的初步结果来看,一方面进一步确认了上声基调的核心是低音区特征,另一方面却发现,调尾高音点是时隐时现,且无明显规律。它的出现常常不是发生在重读情况下,也不一定出现在语句末尾。因此,关于上声的214调值仍然是个值得探讨的问题。

3.2 如何看待重读上声高音点的抬高和低音点的下沉

本研究获得的数据除了进一步确认了此前研究发现的音域扩大的一般趋势以外,还发现重读情况下上声高音点的相对提升。这可能是音域扩大的一个重要来源。可是,这就面临一个新的问题,那就是:如何看待这种高音点的提升现象?它究竟是来源于前邻声调末尾的同化作用,还是反映出它对前邻声调的逆异化效应。

图3是小句“可以用极简单的事例加以说(明)”的音高运动轨迹,具体如图中有下划线对应的部分所示。我们不妨仔细解剖一下其中各个上声(除句首“可”已变阳平之外)的基频曲拱。(1)“可以用”的“以”:首先,男女都一样,其首、尾基频都是承前启后,跟前、后声调的基频顺势连接;其次,它虽然非重读,但除了男声2外,其余三人“以”的基频曲拱都显示出降升调的模式。(2)“简单的”的“简”:首先,男女都一样,其首、尾基频也都是承前启后;其次,尽管它是重读的,但四个人的基频曲拱除了女1的具有比较明显的降升以外,基本上都不是完整的降升调模式,尤其男2的基本上就是个低平调。这可能跟个人处理此处重读的方式不同有关。因为“简”前面的“极”实际上也处于同一重读范域之内,有的人、譬如男1就把“极”读得比“简单的”还要重些;而有的人、譬如女1则特别加重“简单的”,因此,其基频曲拱明显有降升,而且调长明显加长。(3)“加以”的“以”:首先,首、尾基频也是承前启后;其次,基频曲拱因人而异,以降为主,只有女声1的呈现降升模式。

图3 语流中上声音高运动的一般表现举例

统观这三个上声的情况,可以归纳为如下几个要点:第一,语流中上声的基频曲拱是否完整跟轻重没有必然关系,而且因人而异。第二,上声跟其他声调一样,无论是否重读,其首、尾音高都是跟前后声调的音高顺势牵延。第三,最重要的是,比起两个非重读的“以”来,重读的“简”似乎没有表现出提升前、后声调高音点的作用;相反,倒是“简”的高音点都被不同程度地抬高了。

由此可见,语流中上声音高跟相邻声调音高之间的对比关系,是由它跟其他声调之间的底层音区特征区别决定的自然状态,这在重读和非重读的情况下同样都存在。因此说明,这并不是间接地通过提升或抑制前、后声调的高音点来衬托其重读的方式。至于相邻声调的音高究竟对重读的上声起了怎样的作用,或许可以从许毅的相关理论得到启示。

根据许毅的理论[14],第一,一个声调的底层目标是保持不变的,而它实际的音高曲拱则取决于一个音节的起始基频。第二,每个声调的底层音高目标总是在接近它所在音节的末尾得以实现。因此,它在不同声调环境中的音高曲拱的表层实现是不同的。譬如,当普通话的一个高调(阴平)分别后随高、升、低和降调(阴、阳、上、去)的时候,后接声调的起始音高都很高,而且彼此很接近,如图4上部虚线圈内情况所示。然后逐渐分开、并趋向各自的音高目标。这说明前邻声调会对后接声调产生明显的顺同化作用。

图4 相邻声调之间的音高关系图解(摘引自xu, 1997)

第三,每个声调趋向其目标的音高运动是从音节的起头开始,到音节的末尾结束,这种改变基频、从而逐渐趋近其音高目标的过程必定需要时间。因此,声调连读时彼此之间不可避免地会出现基频曲拱的过渡状态,涉及的声调不同,过渡状态就不同。譬如,当上声分别前接阴、阳、上、去调的时候,这个上声不仅起点音高不一样,而且过渡状态也各不相同,如图4下部情况所示。这个事实充分说明,主要是前邻声调的末尾音高抬高了后接上声的起始音高,而不是上声抬高或压低了前邻声调的末尾音高。也就是说,在这个过程中,主要是自前向后的顺同化效应,而不是自后向前的逆异化作用,尽管两者都存在。因此,上声音节起点音高的这种提升应该看作其跟前邻音节末尾音高自然过渡的结果。假如从这个角度看,那么,不管是否重读,上声起点基频的具体高度都会取决于前邻声调结尾处的基频高低,这是一种自然状态。唯一不同的就是,重读上声情况下的基频曲拱会更加陡峭。因为它底层音高的低目标是既定的,重读情况下的实现应该更加充分,但由于起点基频被抬高了,要达到它的底层目标所需的路程就更长;可是,一个音节内实现音高目标的时间又是有限的,因而必须采用更快的速度,才能在有限的时间里尽快实现其底层目标,所以,其基频曲拱就更加陡峭,看起来有点像大写的L。

3.3 从普通话声调的类型学特点看上声的音高运动行为

3.3.1 语调结构与声调类型学特性的关系

一个语言的语调结构必定涉及各个局部的声调和/或重音。声调跟语调虽然属于不同的载信系统,但却通过同样的功能载体——各个音节声调的音高运动——同步实施。然而,这个功能载体又是因语言而异的。同样是载荷陈述跟疑问的语调区别,语调语言里主要考虑末尾边界调的高低;而声调语言还必须考虑边界音节内部的音高滑动模式,即声调调形。同样的道理,声调跟重音也属于不同的载信系统,却也通过同样的功能载体同步实施。功能载体虽相同,载信方式却是因语言而异的。譬如说,同样是载荷语句的焦点信息,重音语言主要关注音高凸显的韵律域范围(宽焦点还是窄焦点)和凸显的量级(音域范围的展缩);而声调语言还必定涉及相关部分音节内部的音高滑动模式及其与相邻音节声调之间的音高组合关系。

即使就声调语言而言,也因各自在类型学(typology)上的差异而具有不同的载信方式。声调语言的声调类型主要分为曲拱型(contour)和层级型(register/level,也叫平调型、静态static调型或等级stepping调型)两个大类(R. L.特拉斯克编《语音学和音系学词典》中译本,语文出版社2000年版)。从现代音系学的观点来看,不同类型声调的底层音高结构不同。曲拱声调包含不止一个音区音高目标,因而必然具有从一个目标向另一个目标的升降滑动。同一语言或方言内不同调类的区分既涉及音区等级的区别,也就是调级(register,参见Maddieson, 1978)的区别,又涉及从起始到收尾目标之间音高的动态滑移。普通话的声调属于这种类型,阴、阳、上、去四声通常被描写为高平、中升、低降升和高降四种不同音区目标之间的音系组合。而层级声调的底层音系目标基本上是单一的、静态的,不同声调的区分主要以音区的等级差异为准。粤语的声调基本上属于这种类型,9个声调中就有6个都是平调,彼此以音区的高、中、低区分。不过,根据Maddieson的调查研究,曲拱型声调系统内至少会出现一个平调,而层级型声调系统内也会出现至少一个曲拱调[15]

3.3.2 声调类型对声调音高实现的影响

仅就手头掌握的材料来看,声调的类型学特点很可能会直接影响其音高实现的方式。譬如说,同样是低音区声调,普通话的上声的音高突出方式跟其余几个声调的不同;而粤语尽管也有好几个低音区特征的声调,但是,根据Gu Wentao, Lee Tan的研究,这些低调的重音凸显方式跟其余调类是一致的——都表现为音区的抬高。他们发现,在重读焦点的效应方面,尽管普通话与粤语这两种方言里存在着某些共同特性(例如,较高的音高目标上的效应更大),但性质上却是相反的:普通话在三个领域里显示出不对称的效应,那就是,焦点-前的F0范围保持不变/完整无缺,焦点处F0范围的扩展以及焦点-后F0范围的抑制;可在粤语里却表现为对称的效应,那就是,F0值在所有这三个领域里都被提升了[16]

粤语跟普通话这两个方言里低调的表层语音实现方式的不同,显然跟它们各自声调系统的底层音系结构类型区别有关。普通话声调属于曲拱型,但是,如前所述,它的上声本质上是个低平调,相对于其余几个调类而言,低音区特征是它的标记性(marked)形式,它是决定表层音高实现的主宰因素,首、尾高音点的有无和量级差异只是个辅助因素。相反,粤语声调属于层级型,调级的高低是默认特征,低音区特征只是它的无标记(default)形式;而且,粤语缺乏词重音,连像普通话那样不典型的词重音形式都不存在。所以,尽管在这两个方言里都有低调,但它们在重读情况下的音高凸显方式却各不相同。

3.3 结论

从本研究的考察结果,可以得出如下几点结论:

(1)普通话上声重音凸显的典型特点是它的音阶下落,而且主要通过其低音点的进一步下降来实现。这是一种显著区别于其余三个声调的音高凸显方式。这种独特方式,本质上是由它底层的低音区音系特征决定的。这个事实充分证明,跟其他几个声调一样,上声的重音凸显也是通过它自身的音高调节实现的,只不过它的凸显方向和方式跟其他几个声调不同。这表明,无论是向上的音高突出还是向下的音高突出,都对重音凸显具有自己的作用。以往大多数研究重音凸显的注意力都集中在高音点的运动行为,而忽略了低音点的运动特点。这就是为什么人们认为普通话的上声对于重音凸显没有多大贡献的缘故。

(2)上声跟相邻声调的音高对比关系,是由各自的底层音系目标决定的自然状态,无论是否重读,这都是客观存在。只是在重读情况下这种对比会变得更加突出,这是由于重读上声低音点的进一步下降,使它跟其他声调高音点的显著提升形成了更加鲜明的对比。

(3)粤语跟普通话低调的音高实现方式的对比情况表明,声调的类型学区别对于声调音高实现的影响,不仅会表现在声调类型不同的方言之间,而且还出现在同一声调语言内部具有类型学差异的不同声调范畴(tonal category)之间,普通话上声调类跟其余几个调类音高凸显方式的不同就是一例。这就是汉语语调结构的复杂之所在。对于方言分支极其丰富复杂的汉语语调而言,如果说必定存在一些语言的共性特点(诸如一般的韵律短语调模式、边界调特征,等等)的话,那么语句中间短语的个性特征可能更为重要,因为它是构成汉语各方言分支语调特点的核心所在,也是破解汉语复杂的语调结构的关键。所以,结合声调的类型学特点来考察声调在语流中的音高变化行为,不但可以找到解开普通话复杂的语调结构之谜的钥匙,还可能对认识汉语各方言的语调结构特性具有一定的参考价值,而且应该有助于不同汉语方言的语音合成的建模。

参考文献

[1]赵元任:《北平语调的研究》, 《赵元任语言学论文集》,商务印书馆2002年版。

[2]沈炯:《汉语语调结构和类型》, 《方言》1994年第4期。

[3]Wang, Bei, et al. “The pitch movement of word stress in Chinese”. Proc. of ICSLP' 2000, Beijing, Oct.17-20.2000.

[4]Cao, Jianfen, et al. Strategy and tactics on the enhancement of naturalness in Chinese TTS, Proc. Of ISCSLP' 2000.13-15 Oct.2000.

[5]郑波:《汉语语句韵律特征与句法、语义关系的实验研究》, 2001年中国科学院心理研究所博士学位论文。

[6]权英实:《普通话句子重音的语调体现》, 2001年北京大学博士论文。

[7]凌峰:《普通话上声强重音的声学表现》, 2003年北京大学硕士论文。

[8]陈玉栋:《普通话上声重音的音高组合方式》, 《语言科学》2005年第4期。

[9]朗读语篇语音库(ASCCD),中国社会科学院语言研究所语音研究室。

[10]吴宗济:《普通话语句中的声调变化》, 《中国语言学报》1984年第2期。

[11]沈炯:《汉语音高载信系统模型》, 《中国语言学的新拓展》,香港城市大学出版社1999年版。

[12]曹文:《汉语平调的声调感知研究》, 《中国语文》2010年第6期。

[13]石锋、冉启斌:《普通话上声的本质是低平调》, 《中国语文》2011年第6期。

[14]Xu, Yi. Target approximation as core mechanism of speech production and perception, Invited lecture given at Institute of Linguistics of CASS, 1997.

[15]Maddieson, Ian. Universals of tone. In Greenberg ed. Universals of Human Language. Stamford Univ. Press, 1978.

[16]Gu Wentao, Lee Tan. Effects of tone and emphatic focus on F0 contours of Cantonese speech-a comparison with Standard Chinese. 《中国语音学报》第2辑,商务印书馆2009年版。