从统计数字看尖团合流的危害

宛东先生

本站多次提到:尖团音是汉语里的重要发音(方法)。有多重要呢?国家语委等一些研究机构对汉字的使用频度有过统计,但资料并不公开,我们只能根据网上搜集到的零星资料,推算如下。

1.清华大学对6763个汉字在一定的文字资料里出现的频率做了统计(含一级汉字3755个、二级汉字3008个,资料总字数为86405823),发现:使用频度最高的500字,覆盖面为78.53%,以此类推,列表如下:

字数 覆盖率(%)
500 78.53202
1000 91.91527
1500 96.47563
2000 98.38765
2500 99.24388
3000 99.63322
3500 99.82015
4000 99.91645
4500 99.96471
5000 99.98633
5500 99.99553
6000 99.99901
6479 100.00000

剩余244个汉字没在选定的文字资料里出现过。

2.小学生的识字要求是2500字,这个数字不是随便定的,根据就是类似上表这样的统计:2500个常用字可以满足99%以上的读写需求。而我们日常说话,基本上不会超出这2500个常用字(方言字除外)。

3.根据百度文库的《3500汉字频度表》,我统计出前2500字里共有255个团音字(占比高达10.2%)、177个尖音字(占比高达7.08%);团音字使用频率之和为8.22%、尖音字使用频率之和为5.74%,尖团音使用频率总和为13.96%。而我估计在实际生活中,尖团音使用频率要在15%以上。

口语和书面语存在明显区别,主要区别是口语更简练、更随便,比如《3500汉字频度表》里排名第一的“的”字(频率高达4.126%),在口语里远用不了这么多。例如:

他(的)人品好。

这谁家(的)孩子啊?

甲:就这样定吧? 乙:好(的)

()里的字可用可不用,但口语中明显比书面语用得少。

再如“一”、“是”、“什”、“么”、“吗”等字,口语里省略或简化的情况很多,如:

来(一)碗面吧?

这(是)啥?【口语中多数方言都说“啥”而不说“什么”】

你也去(吗)?

更重要的是,书面语中的双音节词占比远高于口语,比如:口语“你要想清”在书面语里可能就变成了“你要考虑清楚”。

这些差别大大稀释了尖团音所占的比例,书面中尖团音的比例就将近14%,那么口语中估计在15%以上。

在尖团合流的情况下,等于把近6%的字音取消了,又因为尖音并入团音而导致近9%的语音受到污染,一共影响了15%的字音,这对汉语是何其严重的损害!如果完全按现行拼音方案说话,那么每100个字有15个字得靠猜,害人啊!