吴语中的浊音如何追溯到古代的中国字母?
字母者,谓三十三字十四音……将前十四音,约后三十三字,出生一切。此等能生一切字故。一切诸义皆能摄故,故名为母。
——唐·窥基《瑜伽师地论略纂》
今天的我们能够确信,江浙地区方言如今的辅音格局是继承自古代汉语,古代的中国人不但对送气与不送气能够分辨,对清浊也同样敏感。这样的认知得归功于古代中国发明的字母。早在中古时代,中国人就已经通过创造字母的方式,较为完善地总结出了汉语的声韵体系。
今天中国人熟悉的字母主要是26个拉丁字母,当下全世界大部分语言采用的就是以古代罗马人使用的拉丁字母为基础的文字体系。拉丁字母自发明以来,就是一种纯表音的文字体系,这也是拉丁字母今天在世界各地如此盛行的重要原因之一:任何一种语言,只要把拉丁字母拿过来,顶多稍加改造,就可以较方便地拼读语音,这样的拼读书写下来就可以当作文字使用。
除了拉丁字母以外,当今世界上其他几种主要的文字体系也都是以拼读读音为主。然而中国人使用的汉字则是其中的另类。自远古时期中国人的祖先发明汉字以来,中国人一直使用汉字记录汉语,漫长的几千年间,汉字和汉语紧密结合,形影不离。在全世界主要文字体系中,汉字可说独树一帜,是极其少有的土生土长的、从远古沿用至今的自源文字。
尽管汉字高度适配汉语,在历史长河中忠实记录了汉语,然而对想要知道某个汉字的发音的人来说,汉字却也制造了一些障碍。总体而言,汉字并不直接记录发音,尽管有形声字存在,一个汉字的读音却也不是一目了然的。
因此,尽管从上古时代开始,中国人就用“目”来表示眼睛,但是作为一个象形文字,我们并不能直接知道发明“目”的人到底是怎么读“目”这个字的。理论上说,如果硬要用汉字表达英语,“目”读“eye”也未尝不可。要想知道“目”在古代的发音,就必须通过古人对“目”的注音来探得。
习惯用汉语拼音打字的当代中国人已经很难体会注音上的困难。但是对于没有拼音,甚至根本没见过拉丁字母的古代中国人来说,他们缺乏如汉语拼音这般称手的工具。在古代,我们的祖先为了能够给汉字注音,坚持不懈地进行了诸多探索。
对于一个稍微生僻的汉字,最直接的方法当然是用同音字标音。今天生活中,我们仍然可以经常见到很多这样用同音字注音的例子,譬如在描述上海话的时候,可能会有人说“上海话‘人’的读音就是‘宁’”。这种用同音字标注的方法简单方便,从古至今都相当流行。中国古人把这种注音方法称作直音法。
然而在简单方便的同时,直音法也存在一些重大的缺陷,它对使用者的文化水平有较高要求。想要使用直音法,就必须事先知道大量常用字的读音,否则就可能出现虽然知道两个字读音相同却两个字都不知道怎么读的窘境。更尴尬的局面也时有出现:如果一个字并没有常用字和它同音,那要么就得用一个不大常见的字,要么就得选个只是读音接近的字。于是直音法就会竹篮打水一场空。
实践中,有时候确实会用读音接近的字来注音,如“珣,读若宣”之类,经常出现于没有合适同音常用字的情况。无论是直音法还是读若法,都存在难以回避的缺陷,我们的祖先自然是不会满足于这些方法的。大约在汉末到南北朝时期,一种崭新的注音方式——反切法的出现,解决了直音法、读若法存在的问题,成为汉语主流注音方式。反切法的原理是把一个字的读音用两个字“切”出来。如“南”字,反切法注为“那含”,也就是用“那”的声母和“含”的韵母以及声调去拼合,就可以得出“南”的读音。
自反切法发明以来,汉语的注音体系可以说有了质的飞跃。相对直音法或读若法,反切法需要一定的基础知识才能理解,然而反切法的出现意味着几乎所有的汉字都能准确地切出读音。尽管如此,反切法仍然存在一些明显的可改进之处,最明显的恐怕就是反切的用字存在很高的自由度。譬如“冬”在著名的宋朝韵书《广韵》中为“都红切”,“丁”为“当经切”。这两个字的声母本是一样的,但反切的切语选择了不同的上字。如果仅仅只是以能读出读音为目标,这不是什么大问题,可倘若要总结汉语的语音体系,就稍嫌有些不完善了。
到了唐朝,通过进一步梳理总结汉语的语音体系,中国人发明了汉语“字母”。传统上,中国人把汉语“字母”的发明归功于唐末沙门守温,他创造了“三十字母”。
除了发明了“三十字母”外,守温可以说生平不详。和中古时期许多汉语语音的研究整理者一样,他也是佛教僧人。这和中古时期僧人接触过梵语有密切关系。佛教源自印度,早期的佛经多是从印度的语言翻译而来。中古时期开始,中国内地主要流传的一直是大乘佛教,大乘佛教的原始经典在印度一般以梵语书写。和世界上大多数文字一样,梵语也是采用一套表音的字母拼写。
事实上,“字母”这个词在汉语中出现就是为了描述梵语的书写体系。汉文书写的基本结构是“字”,一个“字”是一个独立存在的个体,表示汉语中的某个音节。由于汉语本身语素多为单音节的性质,一个“字”通常也表示某个语素,有自身的含义。但是梵语的书写则很不一样,用唐朝著名僧人玄奘的徒弟窥基在《瑜伽师地论略纂》中对“字母”的解释就是:“字母者,谓三十三字十四音……将前十四音,约后三十三字,出生一切。此等能生一切字故。一切诸义皆能摄故,故名为母。”梵文中的单个字母并没有含义,只是为了表音,但是把这些字母拼合起来,却能拼出一切词句,所以才叫“字母”。
古代印度的语言学发展到了相当的高度,佛教中的“声明学”就是主要研究语言的学问。哪怕梵文字母也在许多方面体现了古印度语言科学的成果:与拉丁字母A、B、C、D、E、F、G、H、I、J、K、L、M、N、O、P、Q、R、S、T、U、V、W、X、Y、Z的排序本质而言是无规律的乱序不同,梵语字母是按照相当科学合理的顺序排列的。梵文字母的排列顺序大致遵循这样的原则:首先排列塞音和鼻音,根据发音部位分成5组;从发音位置最靠后的组开始排列,渐次向前,每组内部又按照清不送气、清送气、浊不送气、浊送气、鼻音分5类;把这些声母排列完成之后,再将不便归于任何一类的字母附在之后。也就是说,梵文的塞音和鼻音字母排列构成一个规律而科学的5×5矩阵。
梵语的语音相对复杂,尤其是辅音系统很大程度上有较为足够的字母兼容其他语言的辅音。加之这样的字母排序科学合理,在大多数以印度婆罗米字母为基础创造的文字中,基本保留了这样的顺序。如和婆罗米字母关系很密切的藏文、傣文的字母顺序大体都是照搬该排序。
当佛教传入中国后,印度语言学的成果——字母也很快对中国人对语言的认识产生了相当大的影响。
对于接触过梵文的僧人,尤其是其中参与过翻译工作的,几乎不可避免地会比较梵语语音和汉语语音。中古时代的僧人尤其对梵文字母颇多赞美,相比数以万计、随时代演进不断出现的汉字,只用几十个字母拼写世间万物的梵文在某些僧人看来颇有亘古未变的天赐之物感。唐初高僧道宣在《释迦方志》中就曾赞美:“故五天竺诸婆罗门,书为天书,语为天语,谓劫初成梵天来下,因味地肥,便有人焉。从本语书天法不断……汉时许慎方出《说文》,字止九千,以类而序。今渐被世,文言三万,此则随人随代,会意出生,不比五天,书语一定。”
更为夸张的是玄奘和尚的另一位弟子彦悰和尚。他主张不要再进行不精确的佛经翻译,而是应该中国人全体学习梵语。如果中国人全都学了梵语,那就“五天正语,充布阎浮;三转妙音,普流震旦”。“阎浮”是梵语जम्बु(jambu),本是一种果树,也就是莲雾(莲雾正是这个词的音译),在佛教世界观中,长了阎浮树的大洲即为人类所居的南瞻部洲,所以阎浮指代世界。“震旦”则是梵语चीनस्थान(cīnasthāna),是梵语中中国的称呼。在彦悰和尚心里,一个人人都会梵语的中国与世界才是理想的。武周时期著名僧人义净颇为赞同与其翻译不如让大家都学会梵语的论调,他甚至身体力行编写了《梵语千字文》这样的教科书,并号称只要认真学习一两年就可以当翻译。
唐朝几位名僧和尚的言论在现实中并未产生任何可见的影响。一方面,汉语和汉字具有强大的生命力,要让中国人全民改掉自己的母语去学习一种异国语言,无异于痴人说梦。另一方面,拼音文字简单的前提是一个人得会说这种语言,如果连说都不会说,就算学会了一套字母,也什么都拼不出来。与之相比,汉字虽然确实需要较高的学习成本,但是经过几千年的磨合,它和汉语早已经高度适配,对于社会中有读写需求的那部分人来说,学汉字并不是什么无法完成的困难任务——至少是比学会梵语、梵文要容易多了。
在整个中古时代,中国社会中能够真正掌握梵语的人仍然是凤毛麟角。就算是高僧群体中,能以梵语交流乃至著书的仍然少之又少,恐怕只有彦悰的老师玄奘和尚这样有过长期在印度学法经历的僧人才能真正做到梵语水平出神入化。事实上,玄奘和尚确实组织把汉语的《道德经》翻译成了梵文,但这是唐太宗给他的任务,他本人并不情愿。辛苦翻译的梵文版《道德经》很快失传,也说明梵文原文读物在中国社会中实际上并无市场。
但是梵语的影响仍然逐渐渗透。终于,唐朝有僧人提出,汉语其实也可以像梵语一样总结出“字母”。每个“字母”其实就是汉语中的一个声母,用一个属于这个声母的特定汉字代替。唐朝僧侣一开始发明的是三十字母,发现于敦煌的《归三十字母例》就体现了这种“字母”。譬如第一个字母为“端”,下方又举了“丁当颠敁”四个属于“端”母的字作为例证。
通过三十字母,可以明显地看出梵文字母在当时的影响。以“端透定泥”为例,它们分别是清不送气音、清送气音、浊音和鼻音,与梵语字母每组内部的排序完全相同。和梵语的差别只在于,汉语的浊音并没有送气与不送气的对立,自然也就不需要用两个字母表示浊音,其他组别的汉语字母如果和梵语语音可以对应,也都是按照清不送气音、清送气音、浊音、鼻音的顺序排列的。不过如果碰上和梵语语音难以一一对应的组别,就出现了一些不规律的现象,如把“审穿禅日”放一起,反倒把“照”放在了矩阵外的附加组。
《归三十字母例》
到了沙门守温的时代,守温进一步整理了三十字母。他将三十字母按照发音部位进行了进一步的梳理,最终整理出:
唇音:不芳并明
舌音:端透定泥是舌头音
知彻澄日是舌上音
牙音:见君溪群来疑等字是也
齿音:精清从是齿头音
审穿禅照是正齿音
喉音:心邪晓是喉中音清
匣喻影亦是喉中音浊
以上总结来自在敦煌发现的《守温韵学残卷》。这是一个相当潦草的抄本,抄写者很可能对语音学本身一无所知,因此有不少疑似抄错的地方,不过仍然可以看出守温本人的研究已经到了比较高的水平。与梵语从口腔后部向前的排列顺序有所不同,守温字母的排序是从口腔最前部的唇音开始向后排列,并且归纳了每组音的发音部位。当然,这里的发音部位总结和现代人的感受有所不同。譬如“见君溪群来疑”发音部位是“牙音”,此处的“牙”指的是后牙,因为这几个声母发音位置已经很靠后。其中“来”母显然是守温或者抄写者归类错误,剩下的几个字母在今天中国南方广东、福建等地的大部分方言中,发音位置仍然很靠后,如广州话“见”/kin/、“君”/kʷɐn/。但是在大部分方言中,则因为腭化关系,这些字的发音位置出现了前移。
这套守温字母在中古以后不断改进,到了宋朝,完善为三十六字母。由于守温和尚的影响力,三十六字母也经常伪托守温和尚的名义,称守温三十六字母。三十六字母对发音部位的归类和分析比守温三十字母要精准很多,而且脱离了生搬硬套梵语的桎梏,对声母体系的分析更加契合汉语的实际,基本可以准确反映中古后期汉语的语音体系。
三十六字母虽然是在宋朝出现的,但是宋朝人本是想描述隋朝陆法言所编撰的《切韵》中体现的中古汉语早期的语音体系,只是由于时间上差了小几百年,出现了一些当时语音的成分。在进一步分析中古汉语早期的语音体系后,中古时代的字母表应为:
自从字母出现之后,我们的祖先就一直习惯用这些汉字充当的“字母”总结语音。虽然其中中古的字母影响最为深远,但是后来出现的各地韵书也统统使用这样的格式。譬如描述明朝北方话的《韵略易通》就精心挑选了二十个字来代表当时北方话的二十个声母,并且这二十个字还可以连缀成诗,即:“东风破早梅,向暖一枝开,冰雪无人见,春从天上来。”明朝戚继光在福建地区抗击倭寇时,为了让戚家军能和当地百姓交流,还先后出现了描写福州话的《戚参将八音字义便览》,里面把福州话的声母总结为“柳边求气低波他曾日时莺蒙语出喜”。据传戚家军还曾经用十五字的声母和其他字的韵母编成军事密码。由于福州方言和闽南方言同属闽语,音系有相近之处,随后十五声母南流至闽南和潮汕地区,在当地形成所谓十五音,广为流传。
严格来说,这类并非为纯粹表音而设计的汉字,如果真代替汉字直接用作表音书写,还是显得相当不方便。中古时期的中国人也不是没有过用表音字母来拼写汉语的情况,敦煌就有一些用藏文字母拼成的汉语,于阗也有用于阗字母拼的汉语,这恐怕是中古时代中国最接近“拼音化”的尝试。但是可以发现,这些尝试一般都发生在远离中原,非汉族影响较强的地区。而且总的来说,此类尝试要么是出现在学习对方语言的材料之中,要么是出现在非正式的文体之中。由于没有系统梳理音系,直接生搬其他语言的字母,拼写上一般比较随意,也不能完整地反映当时汉语的语音系统。
相对来说,有意识地整理描述当时汉语发音的“字母”,会使我们对当时汉语发音体系的认识更直接。稍留意一下中古时代的中国人总结的声母字母,就会发现当时的语音系统要比今天的任何一种汉语都复杂得多,而且古人把清不送气音、清送气音、浊音和鼻音分别命名为全清音、次清音、全浊音和次浊音。以“端透定泥”为例,“端”属全清音,“透”属次清音,“定”属全浊音,“泥”属次浊音。结论很明显,古代中国人对浊音是相当敏感的,他们在整理字母的时候把浊音归入“全浊音”类别。
今天江浙地区的吴语和湖南娄底、邵阳等地的语言仍然能够完整保留中古时代字母中“全清”“次清”“全浊”的对立,江浙人如果读字母表中同一行全清、次清、全浊三栏的字母,一般都能读出三个声母。然而如果你没有出生在上述区域,这三栏字母你读起来一般只会有两个声母。一般来说,中国大部分方言“全清”“次清”声母的读音比较一致,但是“全浊”栏里的则各地大不相同,可说千奇百怪。今天中华大地上各类方言的形成,就和浊音的变化有着绝大的干系。