
3.实验二:音长对普通话声调感知的影响研究
3.1 研究背景
目前,已有不少学者针对音长对声调范畴感知的影响进行了探讨,但实验结果表现出了较大争议。Wang和Peng[13]合成了两个音长分别为300ms和500ms的阴平—阳平语音刺激连续统,并进行了辨认和区分实验,结果发现音长对声调范畴感知的影响非常有限。杨玉芳[29]采用了100ms、200ms、300ms、400ms和500ms五种音长,实验发现音长对声调辨认有显著影响,且音长越短,越倾向于辨认为音长较短的声调。Chen、Zhu和Wayland[3]采用40—200ms的音长变化范围,认为音长对声调范畴感知有显著影响,且音长对声调范畴感知有加强作用。Wang、Yang和Liu[14]选择100ms、200ms和400ms三种音长,对阴平—阳平、阴平—去声的范畴感知进行了实验,发现音长对青年人无影响,对老年人有显著影响,音长越长,老年人的声调感知范畴性越强。
本实验选择250ms、375ms和500ms三种音长,分别合成三组阴平—去声语音刺激连续统,以探讨音长对声调感知的影响。从前人的研究中可以发现,在普通话声调中,去声是时长最短的声调,而阴平的时长相对较长,两者在音长方面差距较为明显[17][19][23],因此实验二选取阴平—去声作为刺激音;250ms、375ms和500ms三个时长能够较为完整地表达声调信息,不会过短或过长,且在听感上存在明显的区别,因此作为实验音长进行探讨。
3.2 实验设计
3.2.1 被试者
实验被试者为中国科学院深圳先进技术研究院的18名汉语母语者(8男10女),平均年龄24.6岁(SD=2.91)。所有被试者均来自北方方言区,视听能力正常,无阅读或听力障碍,没有接受过正规的音乐训练且为右利手。
3.2.2 实验语料
发音人与实验一相同。使用TANDEM-STRAIGHT[10]合成三组基频从阴平过渡到去声的语音刺激连续统:第一组音长为500ms,第二组音长为375ms,第三组音长为250ms。三组语音刺激连续统除音长外,其他参数保持一致:基频范围为74.89—187.51Hz,音强为75dB;1号刺激音为阴平,11号刺激音为去声,2—10号刺激音从阴平到去声渐变,基频曲线起始点步长约为4Hz,终点步长约为8Hz。音长为500ms的语音刺激连续统的基频曲线如图7所示。
图7 音长为500ms的语音刺激连续统基频曲线
3.3 实验任务与数据处理
采用辨认实验和区分实验,实验二的设计与实验一相同,每次任务正式开始前也均有练习环节。在辨认实验中,若被试者将所听到的音判断为阴平“衣”,则按键盘上的数字1键;若判断为去声“意”,则按键盘上的数字2键。区分实验中,若被试认为所听到的两个音声调相同(即都为“衣”或都为“意”)则按键盘上的数字1键,若声调不同(一个为“衣”,另一个为“意”)则按数字2键。数据处理方法与实验一相同,计算出18位被试者对三组不同音长的语音刺激连续统的感知数据,包括范畴感知边界位置及边界宽度、区分正确率以及峰度。计算方法同实验一。
3.4 实验结果与分析
3.4.1 范畴感知边界位置及边界宽度
三组语音刺激连续统的辨认曲线如图8所示,其中横坐标表示1—11号刺激音,纵坐标表示去声的辨认率。
通过计算,三组语音刺激连续统的边界位置分别为4.429(SD=0.691),4.470(SD=0.755)和4.831(SD=0.678)。单因素方差分析的统计结果表明,三组不同的音长对范畴边界位置有显著性影响[F(2,34)=3.315,p=0.048]。但从成对比较的结果来看,任何两组之间都没有出现显著性差异(ps>0.05)。
图8 三组语音刺激连续统辨认曲线
同样,由计算可知,三组语音刺激连续统的平均边界宽度分别为0.901(SD=0.350)、1.143(SD=0.682)和1.349(SD=0.888)。单因素方差分析的统计结果表明,三组音长对边界宽度没有显著性影响[F(2,34)=2.209,p=0.125]。
3.4.2 区分正确率及峰度
三组语音连续统的区分准确率见图9,横坐标表示9个刺激音对,纵坐标表示平均区分正确率。通过观察图9可以发现,对于三组不同音长的声调连续统,区分正确率曲线均有较为明显的峰值:第一组和第二组位于3—5号音处,第三组位于3—5号音和4—6号音处,即第一组和第二组在区分3—5号刺激音音对时正确率最高,第三组在区分3—5号刺激音和4—6号刺激音音对时正确率最高;这与各组的边界位置基本对应。
图9 三组语音刺激连续统区分正确率曲线
图10 三组语音刺激连续统范畴间区分与范畴内区分正确率对比图
将区分正确率分为范畴间区分正确率和范畴内区分正确率,三组连续统的范畴间/内区分正确率对比见图10。三组的范畴间区分正确率分别为75.83%(SD=0.091),76.39%(SD=0.093)和76.39%(SD=0.060);范畴内区分正确率分别为55.96%(SD=0.032),54.55%(SD=0.026)和56.26%(SD=0.029):三组的范畴间区分正确率均高于范畴内区分正确率。双因素(3组语音连续统×2种范畴)重复度量方差分析统计结果表明,范畴种类的主效应显著[F(1,17)=144.335,p<0.001],而三组连续统不存在显著的主效应[F(2,34)=0.253,p=0.778]。说明范畴间区分正确率与范畴内区分正确率存在显著差异,表明这三组语音刺激连续统的声调感知范畴化显著,但音长对声调范畴间/内区分准确率没有显著影响。
通过计算,三组语音刺激连续统的峰度分别为0.199(SD=0.102),0.218(SD=0.102)和0.201(SD=0.074)。单因素方差分析的统计结果表明,三组音长对峰度无显著影响[F(2,34)=0.351,p=0.707]。
3.5 讨论
以往关于音长对声调感知的影响的研究结果都存在较大争议,表1综合整理了相关研究的实验设计和结果。
表1 相关研究结果汇总
从实验结果看,本实验与[13][14]的结论一致,即音长对青年人的声调范畴感知没有显著影响。与[13][14]的音长设置相比,本实验的音长范围扩大到500ms,组间间隔缩小至125ms,这一改进使整个音节保持在听感上更为自然的音长范围内,也能够更为细致地考察音长因素对声调范畴感知的影响。虽然在边界位置上三组音长表现出显著性差异,但成对比较的结果并无显著性。因此,音长对声调范畴感知的影响可能非常有限。
而[3][29]结果表明音长表现出显著性影响,一方面,可能是因为实验中音长的设置较为极端,最短音长仅有40ms和100ms,可能导致听者不能完全捕捉到充足的声调信息,从而表现出感知上的差异;另一方面,音长因素对声调感知的影响有可能与年龄有关。老年人感知声调时更容易受音长影响。
3.6 小结
实验二中三组不同音长的语音刺激连续统仅在范畴感知边界位置上表现出了非常微弱的显著性差异(p=0.048),但在边界宽度与峰度上并不存在显著性区别。这说明音长因素对声调范畴感知的影响非常有限,在一定范围内改变音长特征不会对声调辨认产生影响。