唐诗声律研究 廖继莉

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 47

分类号________ 密级________

U D C_________

硕士学位论文

唐诗声律研究

学位申请人:廖继莉
学 科 专 业 : 语言学及应用语言学
指 导 教 师 : 尉迟治平教授

论文答辩日期 2005.5.14 学位授予日期

答辩委员会主席 程邦雄 评阅人 程邦雄 董为光

I
A Thesis Submitted in Partial Fulfillment of the Requirements

for the Degree of Master of Arts

Research on the Natural Rhythm of Poetry


in Tang Dynasty

Candidate: Liao Jili

Major: Linguistics and Applied Linguistics

Supervisor: Prof. Yuchi Zhiping

Huazhong University of Science & Technology

Wuhan 430074, P. R. China

May, 2005

II
摘 要

有唐一代是我国诗歌发展的高峰,对唐诗声律的研究既是对诗歌文学形式的分
析,又是对唐诗语音结构规律的研究,涉及到语言研究和文学研究两个不同的领域,
属于语言和文学的交叉研究课题。
在回顾前人对唐代诗歌用韵和平仄格式研究的基础上,我们以唐代诗歌的总集
《全唐诗》和《全唐诗补编》为文本基础,创建了整个唐代诗歌的数据库,并采用数
理统计方法来处理唐诗,得出了以下结论和成果:
(1)建立了唐代诗歌数据库,包括《全唐诗》和《全唐诗补编》收录的所有诗
歌 57379 首。其中五言诗歌为 29105 首,七言诗歌为 21433 首,两者共占唐代诗歌总
数的 88.1%。
(2)通过计算机编程对唐代诗歌进行声律地位的标识,包括韵、摄、调和平仄
句型和谱式的标识。
(3)对 29105 首五言诗歌和 21433 首七言诗歌的用韵情况进行穷尽式分析,整
理出唐代诗歌的首句用韵情况。首句入韵方面,我们证实了前人关于五言诗歌首句入
韵的较少,而七言诗歌首句入韵的较多这一结论;统计出五言首句入韵的比例和七言
首句不入韵的比例差不多,与前人结论不同。首句借韵方面,我们统计出唐代诗歌中
首句借韵的并不多,其中七言诗歌首句借韵的情况比五言诗歌首句借韵的情况要多。
而且从时代上来说初盛唐只是偶一为之,中晚唐逐渐增多。
(4)对 15370 首五言八句诗歌的押韵情况进行数量分析,并与诗韵宽窄情况进
行对比,整理出诗韵所辖字数和韵段数目对比表。一般说来,诗韵收字的多少和韵字
入韵的频率呈正比,与前人说的诗韵的宽窄相同,但也有例外的情况。如微文删三韵
虽为窄韵却很常用;而虞韵虽是宽韵但押韵上却不如其它的宽韵常用。
(5)编程实现对 14416 首五言八句诗歌体裁的区分,整理出古体诗和律诗分期
数量表。通过频率统计整理出古体诗和律诗采用的平仄句型以及他们的数量。

关键词:唐诗 声律 诗韵 平仄 数理统计 数据库

III
Abstract

Tang dynasty was famous for its splendid achievement of poetry. Research on the
natural rhythm of poetry in Tang dynasty is not only the analysis of literature form, but also
an applied research on the rule of sound structure. It is an intercrossed-discipline research
subject and a trailblazing research.
This dissertation attempts to deal with all the poems in Tang dynasty by establishing
database and adopting the method of mathematical statistics, and draws the following
conclusions:
First, we input all the poems in Tang dynasty and converted them into database file,
which are included 25 volumes of the poetry in Tang Dynasty and 3 volumes of the
supplement to the poetry in Tang Dynasty. The total amount of poetry in Tang Dynasty is
57,379. The amount of Five-character verse and Seven-character verse occupied 88.1% of
the total amount.
Second, we designed the computer-assisted language information processing system to
access the database, and labeled the phonological status inquiry of poem character,
including the rhyme scheme, rhyme league, tone and tonal pattern.
Third, we analyzed the rhyme scheme of Five-character verse (29,105) and
Seven-character verse (21,433), and drew the conclusion of the rhyme scheme of first
sentence.
Forth, we processed quantity analysis on the rhyme scheme of Five-character and
Eight-sentence verse (15,370), contrasted with the rhyme width, and drew the table of the
count of rhyme’s word and Rhyming Category.
Fifth, we divided the types of poetry (14,416), and drew the amount form of
ancient-verse and regular-verse by stages. On the other hand, we drew the tonal patterns of
ancient-verse and regular-verse by frequency statistics.

Key words: The poetry of Tang Dynasty The natural rhythm of poetry
Rhyme scheme Tonal pattern Mathematical statistics Database

IV
目 录

摘 要 ................................................................................................................ I
Abstract........................................................................................................... IV
1 绪论
1.1 本课题的目的和意义 ............................................................................(1)
1.2 唐代诗歌及其整理 ................................................................................(1)
1.3 本课题的研究材料及校勘 ....................................................................(2)
1.4 国内外研究现状 ....................................................................................(3)
2 唐代诗歌的计算机处理
2.1 研究方法及处理程序 ............................................................................(8)
2.2 底本的录入、校对和整理 ....................................................................(9)
2.3 唐代诗歌数据库的建立 ......................................................................(10)
2.4 唐诗声律的计算机处理 ......................................................................(11)
2.5 相比前人研究的进步 ..........................................................................(15)
3 唐代诗歌用韵情况的研究
3.1 诗歌用韵情况概说 ..............................................................................(16)
3.2 首句用韵情况的统计和分析 ..............................................................(17)
3.3 诗韵和韵段的统计与分析 ..................................................................(20)
4 唐代诗歌平仄格式的研究
4.1 诗歌平仄概说 ......................................................................................(23)
4.2 唐诗中平仄格式的分析 ......................................................................(24)
4.3 平仄格式表 ..........................................................................................(28)

V
5 计算机处理过程中的问题及其解决思路
5.1 计算机查找不出来的字的处理问题 ..................................................(32)
5.2 多音字的计算机自动筛选问题 ..........................................................(33)
6 结束语 .....................................................................................................(36)
致 谢 ...........................................................................................................(37)
参考文献 .......................................................................................................(38)
附录 1 攻读学位期间发表论文目录 ........................................................(41)

VI
1 绪论

1.1 本课题的目的和意义

唐诗的声律多是由后人根据成型了的律诗来定论的。但实际上,唐诗的声律不是
一成不变的,而是经历了一个不断发展不断完善的过程。唐代的诗歌不论是近体诗、
古体诗,都有一定的声律。本课题的目的就是采用计算机辅助研究和分析,来对整个
唐代诗歌本身的用韵和平仄情况进行定量分析,还原唐诗声律的本来面目。
诗歌和其他文学一样,是一种语言的艺术。它遵循一般的语言规律,创造性地改
变语言的组构程式,并将语音、词汇、句法和修辞等方面的变异组合起来,形成一种
诗歌特有的运作规范,是对诗人的内心情感和人生体验的一种审美化的描述。
唐代诗歌在形式上与唐以前的诗歌相比,具有一定的创新和突破。它既能充分自
由的表情达意,又能取得声情并茂的艺术效果,这种特有的体制形式就是唐诗的声律。
唐代诗人自觉运用汉语声律的特点,精心选择和利用汉语的声、韵、调等物质材料,
作为构律的要素和手段,并按照特定的规则将其配合起来,形成一种固定的格律形式。
凭借这种形式进行诗歌创作,使诗歌的音调抑扬顿挫,节奏错落有致。唐诗以其谐和
的音韵词语、整齐对仗的句式和形音尽美的状态,极大地推动了文学形式的发展。
声律是汉语语音结构在诗歌创作中的反映,其中最重要的是节奏和韵律。节奏是
由声音、声调的变化和搭配形成的,即由语音的高低、断续所形成的有规律的音调节
拍;韵律是指同一韵母的声音按照一定的规律在诗歌中反复回应。这些都是与汉语言
的特点有关的,对声律的研究属于语言学研究的一个方面。
对唐诗声律的研究既是对诗歌文学形式的分析,又是对唐诗语音结构规律的研
究。它涉及到语言研究和文学研究两个不同的领域,属于语言和文学的一个交叉研究
课题。因此,唐诗声律研究具有极其重要的意义。

1.2 唐代诗歌及其整理

唐代以文学取士,尤重声律,硕儒俊彦,无不遵循此道,三百年间,诗人数以千
计,流传下来的诗歌也蔚为大观,故论诗者必称李唐焉。唐人自己就有一些诗歌的选

1
集,如殷璠《河岳英灵集》、元结《箧中集》、高正臣《高氏三宴诗集》、芮挺章《国
秀集》、令狐楚《御览集》、高仲武《中兴间气集》、姚合《极玄集》等,或偏于一体,
或囿于一方,都没有对整个唐代的诗歌做一个全面的整理。
宋明以后,唐代诗歌的大规模整理和汇编工作就拉开了序幕。从宋初太平兴国年
间编纂《文苑英华》开始,其后历代学者都做过长期不懈的努力。南宋赵孟奎编《分
门纂类唐歌诗》以及明张之象编《唐诗类苑》,收诗都超过 40000 首。另外,吴琯编
刻《唐诗纪》170 卷,胡震亨编纂《唐音统签》1033 卷,季振宜编修《唐诗》717 卷,
都对总集唐一代诗歌进行了重要的奠基工作。
至清康熙四十四年,在扬州天宁寺开馆编修唐诗,以胡、季二书为基础,再加采补
校订,历时一年零五个月,编成《全唐诗》900 卷。
《御制全唐诗序》称此书“得诗四万
八千九百余首,凡二千二百余人”,其收罗之广,数量之巨,确是空前,康熙誉其“大
备”,
《四库全书总目》称“自有总集以来,更无如是既博且精者矣”。此书问世以后,
在清代就曾多次翻刻,1960 年中华书局出版了点校本,1986 年上海古籍出版社又影印出
版,两种版本为国内外图书馆及古代文学研究者所收藏,成为研究唐诗的主要依据。
限于条件,《全唐诗》成书时有许多文献典籍当时都没有见到,所以对于有唐一
代的诗歌仍有不少漏收的地方。后人在新的材料基础上又加整理,如日本市河世宁辑
成《全唐诗逸》3 卷,王重民、孙望、童养年辑录的《全唐诗外编》2 册,陈尚君辑
校《全唐诗补编》3 册,为唐诗的研究提供了新的资料。

1.3 本课题的研究材料及校勘

1.3.1 本课题的材料

本课题的研究力求真实反映有唐一代诗歌声律的全貌,所以首先要尽量多的搜集
唐代诗人的诗歌作品,诗歌材料来自《全唐诗》、
《全唐诗补编》中的所有诗歌。另外
为了对声律进行研究,还参考了古代的韵书和诗法书。具体材料及其版本如下:
《全唐诗》
(900 卷)中华书局校点本,后附《全唐诗逸》3 卷,中华书局,1960
《全唐诗》扬州书局本,上海古籍出版社,1986
《全唐诗外编》,中华书局,1982

2
《全唐诗补编》,中华书局,1992
《新校互注宋本广韵》(增补本)余迺永校著,上海辞书出版社,2000
《宋本广韵》(张氏泽存堂本),北京市中国书店,1982

1.3.2 材料的校勘问题

唐代诗歌的有关材料可谓异常丰富,不仅有《全唐诗》系列,而且有很多作家作
品的别集,但是各种版本之间往往存在差异。我们主要参考的是中华书局校点本《全
唐诗》和《全唐诗补编》。在文本的校勘过程中,我们发现一些问题,主要是异体字
和倒文误字方面的。对于这种情况,若有互校版本,则较容易进行判断。由于本课题
的重点在声律,所以我们只是依照韵例来发现问题,再借助其他有关文献资料予以佐
证,其他的校勘不能一一进行。下面举例略加说明。
庾抱《別蔡參軍》(卷三十九)“人世多飄忽,溝水易東西。今日歡娛盡,何年
風月同。悲生萬里外,恨起一杯中。性靈如未失,南北有征鴻。”韵字为:西同中鸿。
“西”,十二齊;
“同中鸿”,一東。两韵不协。按扬州书局本则此诗为“溝水易西東”,
“東”,一東,显然《全唐诗》为倒文之误。
盧照鄰《戰城南》(卷四十一)“將軍出紫塞,冒頓在烏貪。笳喧雁門北,陣翼
龍城南。琱弓夜宛轉,鐵騎曉參驔。應須駐白日,爲待戰方酣。” 韵字为:貪南驔
酣。“貪南”,二十二覃,“酣”,二十三談;“驔”,五十一忝。前两韵与后一韵不协。
查扬州书局本则此句下标有“一作潭”,“潭”,二十二覃,应为此。
韋應物《曉至園中憶諸弟崔都水》
(卷一百九十一)“山郭恆悄悄,林月亦娟娟。
景清神已澄,事簡慮絕牽。秋塘徧衰草,曉露洗紅蓮。不見心所愛,茲賞豈爲妍。”
按律诗的平仄规律来说,每句末字平仄相间,但其中只有“澄”字平仄不合,该仄而
平。按扬州书局本则此句下标有“一作謐”
,“謐”,仄声,应为此。

1.4 国内外研究现状

1.4.1 前人的研究

1.4.1.1 律诗的形成
律诗的形成经过了一段时期的摸索,从五世纪中叶到七世纪初期是从古诗到律诗

3
的过渡时期。初唐时律诗逐渐形成,但格律还不太严。开元年间(8 世纪初期),律诗
才算成了定式。关于唐代律诗的形成,元稹在《唐检校工部员外郎杜君墓系铭并序》
中说:“唐兴,学官大振。历世之文,能者互出。而又沈宋之流,研练精切,稳顺声
势,谓之为律诗。”
《新唐书·宋之问传》:
“汉建安后迄江左诗律屡变,至沈约、庾信
以音韵相婉附,属对精密。及之问、沈佺期又加靡丽,回忌声病,约句准篇,如锦绣
成文,学者宗之,号为沈、宋。”
1.4.1.2 唐代的声律理论
宋代胡仔《苕溪渔隐丛话·前集·卷七》中云:“律诗之作,用字平侧,世固有
定体,众共守之。”这说明在唐宋时,是有关于近体诗的平仄规则和专讲这些规则的
书的。
但是这些著作至今多不传,仅在日本僧空海的《文镜秘府论》中保存有一些片断。
如上官仪《文札华梁》
,佚名《文笔式》,王昌龄的《诗格》
、《诗中密旨》,皎然的《诗
式》、
《诗评》,崔融的《唐代新定诗格》,元兢的《诗髓脑》等。此外,殷璠的《河岳
英灵集集论》、李德裕《文章论》、陆龟蒙《复友生论文书》等也对声律理论进行了一
些探讨。
这一时期的声律理论,继承前人的同时又有重要的变革,大体形成了律诗的严整
声律。仍然讲“四声”,但以平仄为基础,将四种声调归结为平声、仄声(包括上去
入三声)两大类别,对“四声”作了合理的简化,使得平仄交替协调,形成抑扬顿挫、
错落有致的节奏旋律。不仅在一句一联内部讲究平仄的相对,还推广到整个篇章组织
中,对各联之间的粘合贯通也提出了要求(如《文镜秘府论·天卷·调声》中说:
“或
曰凡四十字诗,十字一管,即生其意……诗上句第二字重中轻不与下句第二字同声为
一管。上去入声一声。一管上句平声,下句上去入;上句上去入,下句平声;以次平
声,以次又上去入;以次上去入,以次又平声。如此轮回用之,直至于尾。”),这样
就使声律的运用有了整体的布局。从而建立起一整套有则可循的规范化的谱式,便于
初学者和应试者学习掌握。

1.4.1.3 唐以后人(主要是清代人)对唐诗声律的看法

唐以后人对唐诗声律的看法主要见于各类诗话中,但比较零星,多是单篇零札,

4
散见于一些总集别集之中,且多不成体系。这类著作从宋代到清代都有,如宋王直方

《王直方诗话》、宋葛立方《韵语阳秋》、宋胡仔《苕溪渔隐丛话》、宋魏庆之《诗人

玉屑》、宋严羽《沧浪诗话》、金王若虚《滹南诗话》、元方回《瀛奎律髓》、元杨载《诗

法家数》、明李东阳《麓堂诗话》、明吴讷《晦庵诗抄序》
、明谢榛《四溟诗话》、明林

希恩《诗文浪谈》、清章学诚《文史通义》等。

专门从声律上来研究唐代诗歌的专著,是从清代赵执信《声调谱》开始的。此后

翟翚《声调谱拾遗》,王士禛《律诗定体》,何世璂《然鐙记闻》,许印芳《诗谱详说》,

吴镇《声调八病说》,吴绍燦《声调谱说》,王祖源《声调三谱》,董文焕《声调四谱

图说》、李少鹤《拗法谱》等相继出现,对近体诗的平仄格式和拗救的规则谈得比较

详细。这些著作都是根据唐诗的平仄情况加以分析总结,从而得出—些规律,提出了

“正律”、
“拗律”、
“古律”以及“拗字”
、“拗句”、
“拗联”、
“拗粘”、
“拗对”等概念,

并在大量分析律诗实际平仄格式的基础上批评了前人的“一三五不论,二四六分明”

的陈说。

特别指出的是,对古体诗的声律进行研究,也是从赵执信的《声调谱》开始。前

人一般认为古体诗是自由的,本无所谓声律的,如李少鹤《拗体谱》中就说:“大拗

体其声调初无一定……难定印板”,“杜集七言大拗体,其声调亦无一定”,章学诚也

说:
“执古诗而定人之音节,则音节变化,孰非一成之诗所能限也”
。但唐代律体盛行

之后,古诗则于有意无意间避免入律。明人论诗讲究格调,在这个问题上也有所体会,

但并未成书。赵执信看到了一些古体和近体的区别,如七言下三字的平仄用平平平、

仄仄仄、平仄平、仄平仄的为古调,用仄平平、平仄仄、仄仄平、平平仄的为律调,

这的确是很重要的发现,但还很不成熟。之后,王士禛的《古今平仄论》一书也对唐

代古体诗的声律现象加以研究。虽然这两本书都没有为古体诗总结出一套严整的格

律,仅是提出了一些古体的格律现象,不具有规律性和普遍性,而且不能说明何以这

些现象使得古近体区分开来,但是至少说明了唐代古体诗在体制形式上已经不同于汉

魏古诗,走上了人工声律的道路,可见古体诗的声律化确是唐代诗歌创作中值得注意

的新因素。古体诗和近体诗的声律是互相影响的。

5
1.4.1.4 现代学者对唐诗声律的研究
(1)一般的传承
这类著作很多,如启功《诗文声律论稿》,刘福元、杨新我《古代诗词常识》,李
葆瑞《诗词语言的艺术》,徐志刚《诗词韵律》,夏援道的《诗词曲声律浅说》,等等。
这类著作多是对诗律的一般性的介绍,从诗歌的起源、发展到格律要点,如四声、平
仄、用韵、对仗的特点和注意事项,还有避免孤平、合掌、拗救等等。着眼点主要是
使读者全面了解古代的诗歌声律,并对现在的诗歌创作起到一定的借鉴作用。
(2)就唐诗本身来研究唐诗
此类著作以王力的《汉语诗律学》、蒋绍愚《唐诗语言研究》和涂宗涛《诗词曲
格律纲要》等为代表。他们的主要观点在于:对各家谈论近体诗格律的著作,都必须
用唐人的作品来验证,凡被唐代诗人所遵守的,被唐代诗人的大量创作实践所证明的,
符合唐人大多数作品实际的声律就是正确的。
王力的《汉语诗律学》将汉语诗律的一般常识和自己的研究成果杂糅在一起,对
近体诗、古体诗的用韵、平仄格式和拗救、对仗、句式和语法都有一个科学的基于统
计分析的论述,初步涉及了唐诗所反映的声律现象。而且,他还提出了一些与前人不
同的看法,如“平平仄平仄”名为拗而实际非拗,律诗首句用邻韵是宋代诗人的风尚
等。但限于条件,这只是一个抽样的研究,没有全面地展开。
而涂宗涛的《诗词曲格律纲要》与王力最大的不同是不讨论古体诗的声律,另外
在近体诗的平仄格式和拗救问题上略有差异。如涂宗涛认为,
“平平平仄仄”的第一、
三两字的平仄可以无条件不论,而王力认为第三字仄时,第一字必用平;“仄仄平平
仄”的第三、四字都改为仄时,王力认为对句第三字必须改为平相救,涂宗涛认为据
唐人遗规也可不救。
(3)
“全唐诗电子检索系统”
市面上的全唐诗电子检索系统很多,其中北京大学开发的比较常用。北大的“全
唐诗电子检索系统”作为“中国古典诗歌大系”的一个重要组成部分,由“211 工程”
资助,在北京大学中文系李铎博士的主持下历时一年开发完成,1999 年底投入运行,
是目前国内最通用的一个全唐诗的电子检索系统,可以进行作者、诗题、体裁、诗韵

6
和诗句的查询。其主要的贡献在于建立数据库,方便了查询检索,而且给全部的诗歌
作了“体裁检索”标引,扩大了系统的检索功能,这在国内外都属首创。
北大的“全唐诗电子检索系统”从某种程度上说只是《全唐诗》纸质文本的电子
版本,“体裁检索”标引虽然是一个全面的研究,但它是手工凭经验进行的,其中存
在一些错误,且不能反映唐代诗歌声律的全貌。
以上种种关于唐诗声律的研究,说明了学术界对这一问题的重视程度。

1.4.2 前人研究的不足之处

(1)从律诗的定型到古近体相互影响的发展,再到拗律、拗格的产生,声律本
身在唐代就是不断发展不断完善的。而前人多是从诗歌创作的角度来分析研究,并没
有对唐代诗歌的用韵和平仄情况进行一个历史的、发展的、全面的考察。
(2)唐代是我国古代诗歌创作的高峰,各种诗体同时并存。唐诗的声律虽然首
先建立在近体诗的体制上,却并不专限于近体诗的范围。声律化可以说是唐代古近体
各类诗歌的普遍特点。因此,近体诗的声律状况并不能全面反映唐代诗歌声律的全貌
和发展历程。而前人对唐诗声律的看法主要是根据成型了的律诗的格律来分析,总结
出各种平仄和拗救的格式,而忽略了其他诗体的声律状况(比如齐梁体诗歌,古体诗
等)。
(3)前人在对平仄和拗救格式进行分析时,往往采取评点式的方法,在例诗下
对个别字或个别句子进行分析。这只是一个抽样的调查分析,大部分凭的是作者的语
感经验,不够全面、科学。而且每位作者在论述时没有一个统一的标准,术语不统一。
(4)前人的研究多是从诗歌用韵分合的角度来考察语音的演变和地域性,还没
有全面地从声律角度来考察唐代诗歌中首句用韵的情况,诗韵的宽窄情况究竟是怎样
的,等等。

7
2 唐代诗歌的计算机处理

2.1 研究方法及处理程序

2.1.1 本课题的研究方法

本课题采用数理统计的方法穷尽式的统计和分析整个唐代诗歌的用韵情况和平

仄格式,力求如实的反映出唐代诗歌声律的真实情况,而不是主观的、个别的归纳和

分析。

由于我们的工作重点在于对整个唐代诗歌的声律情况作一个全面、真实的反映,

而要研究的语料又数量庞大,所以整理起来工作量极大。因此,我们利用先进的科技

手段来进行语料处理,通过计算机建立整个唐代诗歌的数据库,使得每首诗歌成为一

条数据,方便检索和统计,并为每首诗歌编制用韵情况和平仄格式的分类、系联、查

询、统计等一系列程序。事实证明这样做要比手工制作卡片更为便捷、高效,极大地

减少了手工工作量,从而节省了大量时间。但也由于采用计算机的缘故,研究过程中

出现了一些在传统研究中没有出现过的新问题,如冷僻汉字、异体字的输入问题,同

音字声律的自动筛选问题,等等,这些不可能完全依靠计算机来完成,所以还需我们

对唐代诗歌的用韵情况和平仄格式等特点进行细致的考察、精密的分析,并参照已有

的研究成果,最后才能得出可靠的结论。

2.1.2 本课题的工作程序

本课题的工作主要在人与计算机之间展开。从文本的校对到数据库的建立,到最

后声律情况的分析统计,整个过程均使用到计算机操作。大致说来,有如下一些操作

步骤:

(1)文本的校对和整理

由于整个唐代诗歌的语料庞杂,蔚为大观,虽然目前市面上有多种版本的《全唐

诗》电子文本,但或多或少都存在问题,而《全唐诗补编》更是由我们手工录入,难

免产生误差,因此校对工作非常重要。

8
(2)将文本转换成数据库
为了对整个唐代诗歌的声律情况进行分析归纳,光是有了文本还不行,还要转换
为数据库,方便我们对其中的数据进行分析和研究。我们使用的数据库是 Microsoft
Access,因为比较常用,而且功能也强大。
(3)建立韵字声律地位查询的各种表
我们并不是直接对全唐诗的文本进行分析和统计,而是对诗歌的声律地位如韵、
摄、调和平仄等进行分析统计,所以还必须建立诗歌用字的声律地位查询表,包括诗
歌用字的语音属性和属性集合的各种查询表。我们一共建立了 6 种声律地位查询表,
包括“韵与韵字表”,
“韵摄调表”,
“调与平仄表”,
“广韵同用独用表”,
“诗歌基本句
型表”和“平仄谱式表”。
(4)唐诗声律情况各类标识的建立
有了以上各种表,我们就可以通过访问不同的表,提取相关信息来对唐代诗歌的
声律地位进行标识,标出每首诗歌的韵脚及它所属的韵摄调,整首诗歌的平仄格式等
等。整个过程不是通过人工标记的办法,而是通过编程自动进行标注。
(5)唐诗声律分析
将每首诗歌的声律地位标注好了之后,我们就可以在这个基础上对唐诗的用韵情
况和平仄格式进行统计分析了。这是本课题的重点,也是本文内容的主体。用韵情况
方面主要是对首句入韵情况,首句借韵情况以及诗韵和韵段情况进行分析;平仄格式
方面主要是对古体诗和近体诗的平仄格式进行分类和描述。在对所有数据进行统计分
析和全面考察的基础上,我们就可以整理归纳出唐代诗歌的用韵情况、诗韵及韵段对
比情况和平仄格式情况。

2.2 底本的录入、校对和整理

我们的纸质底本主要就是两种:中华书局 1960 年校点本《全唐诗》和陈尚君辑


校《全唐诗补编》3 册。
《全唐诗》的文本市面上有多种电子版本,所以免去了我们手工录入计算机的麻
烦。通过考察,我们选择了两种具有权威性的《全唐诗》的电子文本:北大“全唐诗

9
电子检索系统”的《全唐诗》
(http://Chinese.pku.edu.cn/tang )和国学网站的《全唐诗》
(http://www.guoxue.com/qts/qts_sml.htm )。我们先将两种文本的多余信息,如标点、
空 格 等 去 掉 , 完 成 两 个 电 子 文 本 的 预 处 理 。 然 后 利 用 磁 盘 文 件 管 理 软 件 Total
Commander 中的文件比较功能,对两种文本进行自动校对。不同的地方再参照中华书
局校点本《全唐诗》进行修改。
而《全唐诗补编》的文本由于是手工录入,就只能是在文本录入之后,再对照录
入所据书籍版本,校核录入的诗歌,订正录入时产生的错误。
尽管经过了长时间的校对整理,我们的唐代诗歌文本还是存在一定的问题,其中
最主要的就是有一些字无法在计算机上显示。这些字都是超大字符集以外的汉字。超
大字符集以外的外字,采用组字表达式来表示(参照中华电子佛典协会 CBETA 电子
佛典系列制定的《一般组字式基本规则 6/8 '98》)。这样我们就解决了所有汉字在计算
机上的显示问题。举例如下:

符號 說明 範例
* 表橫向連接 明=日*月
/ 表縱向連接 音=立/日
@ 表包含 因=囗@大 或 閒=門@月
- 表去掉某部份 青=請-言
-+ 表去掉某部份,以另一部份代替 閒=間-日+月
() 為運算分隔符號 繞=組-且+((土/(土*土))/兀)
[] 為文字分隔符號 羅[目*侯]羅母耶輸陀羅比丘尼

通过以上文本的录入、校对和整理工作,我们大致拥有了一个唐代诗歌的比较全
面的总集,从而得到一个比较可靠的全唐诗语料库文本,为下一步的研究打下了基础。

2.3 唐代诗歌数据库的建立

电子文本完成之后,我们就可以在此基础上建立全唐诗数据库了。

10
其中,《全唐诗》的部分由于有文献标识,所以可以编程实现将文本文件直接转
换成数据库中的表格。首先,将所有已经格式化好了的唐代诗歌的文本文件放在一个
目录中。然后,在同一目录下建好 mdb 数据库文件,其中必须包含表单“全唐诗”

表单由 11 个字段组成,分别是:ID、書名、册數、卷數、頁碼、標題、作者、體裁、
小序、題解、正文。第三,运行程序将文本文件中的数据添加至数据库中,并形成表
“全唐诗”。
在全唐诗数据库中新建一个表“全唐诗补编”,也包含和全唐诗一样的 11 个字段。
由于《全唐诗补编》是手工录入,没有标识,所以在转换成数据库的时候就只能手工
一首一首的将每首诗歌的内容复制到数据库的每个字段下。
《御制全唐诗序》中称《全唐诗》“得诗四万八千九百余首,凡二千二百余人”,
而据日本平冈武夫《唐代的诗篇》统计,该书收诗 49403 首,句 1555 条,录作者 2576
人(未计神、鬼、怪类)。而我们的建库工作完成之后,我们就可以方便的得出,
《全
唐诗》共收录诗歌 50096 首,《全唐诗补编》共收录诗歌 7283 首(包含句在内),整
个全唐诗数据库中包含的唐代诗歌一共是 57379 首。其中五言诗歌为 29105 首,七言
诗歌为 21433 首,两者共占唐代诗歌总数的 88.1%,可见五言、七言诗歌在唐代诗歌
创作中占据主要地位。

2.4 唐诗声律的计算机处理

2.4.1 建立诗歌韵字声律地位查询的各种表

我们一共建立了 6 种声律地位查询表,包括“韵与韵字表”,
“韵摄调表”
,“调与
平仄表”,“广韵同用独用表”,“诗歌基本句型表”和“平仄谱式表”。下面分别加以
介绍。
(1)韵与韵字表
这个表是在华中科技大学 2000 级研究生仝小琳的《广韵》检索系统的基础上形
成的,采用的是《广韵》的 206 韵,一共包括韵字 25362 个。该表包括 3 个字段:编
号,韵,韵字。格式如下:

11
編號 韻 韻字
1 一東 東
2 一東 菄

(2)韵摄调表
这个表显示了韵、摄和调三者之间的关系。一共是 206 个韵,16 个摄,4 个调。
该表包括 4 个字段:编号,韵,摄,调。格式如下:

編號 韻 攝 調
1 一東 通 平
2 二冬 通 平

(3)广韵同用独用表
《广韵》一共有 206 韵,并不单是为诗文用韵而编写的。它的分韵繁细给诗人创
作带来不便。所以唐初许敬宗等人提出要将一些韵目“合而用之”,现在所见的《广
韵》韵目下所注“同用”、“独用”,戴震等认为就是当时规定下来的。所谓同用,就
是允许一些语音相近的韵相互通押。凡同用的韵,就可以看成是一个韵部。这样 206
韵简化成 113 个韵部,减少了对诗文用韵的限制。这个表就是根据《广韵》规定的同
用独用做成的,包括 2 个字段:编号,同用独用。格式如下:

編號 同用獨用
1 一東
2 二冬三鍾

(4)诗歌基本句型表
诗歌的主要功能在于抒情,情感的起落需要通过合适的语言节奏来加以表现,这
种节奏对于我国的诗歌而言,主要是指在一句诗之中平声字和仄声字要交替出现,正

12
是平仄相间才造成了诗歌婉转回环的韵律美。近体诗有不同的平仄格式,但是基本的
句型只有四种,他们之间的不同搭配,就构成了各种格式的平仄谱式。五言诗一句 5
个字,每个字都有平仄两种可能,那么一句就有 25=32 种句型,但实际上不是每种句
型在近体诗的创作中都能用上的。根据王力[14]和朱承平[36],我们总结出了近体诗五言
的四种平仄基本句型,每种句型又有不同的变体,一共是 18 种。
该表包括 3 个字段:代码,名称,句型。格式如下:

代碼 名稱 句型
A 五言仄起仄收 仄仄平平仄
B 五言平起平收 平平仄仄平

(5)平仄谱式表
近体诗按照一定的规则将上面说的四种基本平仄句型组合搭配,就成了各种诗体
固定的平仄谱式。这是近体诗声律的重要内容,不能任意改变。关于这点前人论述颇
多,总结为三点:一,一句之中平仄交错;二,两句之间平仄对立;三,两联之间平
仄相粘。总的来说,就是要注意平仄粘对,这是近体诗平仄的核心,也是全部平仄谱
式的基本要点。据此,我们列出了近体诗五言的平仄谱式表,一共是 4 种。
该表包括 3 个字段:编号,谱式名称,平仄格式。格式如下:

編號 譜式名稱 平仄格式
1 仄起仄收五言律詩 ABCDABCD

2.4.2 唐诗声律情况各类标识的建立

我们工作的重点是要对唐诗的声律进行分析和研究,所以就必须通过访问以上不
同的表,提取相关信息来对唐代诗歌的声律地位进行标识,标出每首诗歌的韵脚及它
所属的韵、摄、调,整首诗歌的平仄格式等等。这类的标识我们一共设立了 8 个:末
字韵 endyun,末字摄 endshe,平仄格式 pzformat,同摄否 sameshe,偶句摄 inshe,柏

13
梁体 btl,首句用韵 firstin,韵宽 width。这 8 个标识是通过计算机编程来进行标注的,
该程序的流程图见图 2.1。

开 始

偶数句句末字的 No
以查询方式打开数据库中的表
摄相同否

读取诗词数据表(如五言)中第一条记录的
Yes
正文字段中的诗,并赋给 line
该诗有相同摄 该 诗 摄 相 同
sameshe=TRUE sameshe=FALSE
读取该诗的第一个字, 并赋给 word

在韵与韵字表中找到 word 所对
应的韵,并赋给 tempyun

前三句的摄 Yes
在韵摄调表中找到 tempyun 的调和摄,将摄赋给
相同否
strendshe,再在调与平仄表中找到该调所对应的平
仄,并赋给 strPZ,strPZ+=strPZ;
No

该诗不为柏梁体 该诗为柏梁体
No blt=FALSE blt=TRUE
word 是 句 末
字否?

Yes

strYun=strYun+tempyun;
strShe=strShe+strendshe; 将结果写入数据库并更新数据库

No
word 是 偶 数 句
末字否? 该首诗是使数
line 移 向 下
据表中最后一
一首诗
Yes
首诗吗?

inshe=inshe+strendshe;(偶数句句末字的摄)
Yes

结束程序关闭数据库
Yes
word 是 该 诗 的 最
后一个字否

No

word 移向下一个字

图 2.1 建立声律标识流程图

14
2.5 相比前人研究的进步

(1)采用计算机辅助研究,充分利用了计算机强大的检索和统计功能。整个唐
代诗歌卷次繁多,数据量十分庞大。而通过计算机将之转化为电子文本,在文本的检
索,数据的统计、分析和整理方面就有了优越性。
(2)在全唐诗语料库的基础上,建立专家知识的数据库,将每首唐诗变成一条
记录,对之进行标识,方便以后的统计研究。标识主要是诗歌语音属性方面的标识,
如韵、摄、平仄等。这些标识不是采用人工标记的办法,而是利用华中科技大学
2000 级研究生仝小琳设计的《广韵》电子检索系统,加以修改和重新编程来进行
自动标识。而且,计算机的应用使得准确、迅速的标识每首诗歌的韵、摄和平仄成
为可能。
(3)编写程序对整个唐代诗歌声律的属性进行分析、统计,使我的研究结果建
立在一个定量的分析的基础上,更为直观、全面。而且,我们的统计方式也是与
前人不同的。前人的统计多是对字符串单位(如字、词)的频率的统计,而我们
是对每首诗歌中字的语音属性(如韵脚所处的韵部、字的平仄)及属性集合的一
个统计。

15
3 唐代诗歌用韵情况的研究

3.1 诗歌用韵情况概说

3.1.1 韵和押韵的原因

诗歌,作为一种艺术形式,使用的表现手段是语言,而且是和普通的会话语言有
区别的语言。为了区别两者,从声音处理的角度来说就是要考虑语言的音乐性,于是
便有声律的出现,其中,韵是诗歌声律很重要的部分。中国的诗歌历经数千年,尽管
格律、体裁多有变化,但用韵这一点,却是贯彻始终,成为定例。
我国诗歌的用韵,都在句子的末尾,称为押韵。究其目的,章学诚在《文史通义·诗
歌》中说,
“所以便讽诵,志不忘也”。现在普遍认为,押韵通过相应位置上同韵字的
有规律的反复,构成和谐回环的旋律,把语义跳跃的各个诗句通过同韵字的前后呼应,
构成一个和谐紧凑、脉络相通的整体,以加强全诗结构上的完整性,增进诗歌的音乐
节奏和抒情效果。

3.1.2 用韵标准和韵书

既然诗歌用韵是个惯例,那自然就有一定的用韵标准。王力[14]P3 把诗歌的用韵标
准大致分为三个时期:唐以前为第一期,依口语押韵。唐以后至五四运动以前为第二
期,押韵必须依照韵书。五四运动之后为第三期,除了旧体诗之外,又是以口语押韵。
魏晋南北朝之前,由于没有专门的韵书,诗人多数就是用当时的口语来入韵,没有
一个特定的标准。到了魏晋时期,李登撰《声类》
,吕静编《韵集》
,开始了我国编纂韵
书的先河。整个魏晋南北朝时期私人编撰韵书多达十七种,但他们“各以土风”为据,
分韵上互有出入,最终都未能流传。隋代陆法言集前代韵书之大成,著成《切韵》一书,
分韵为 193 部,不仅为诗文创作提供用韵的标准,也有审音正音的作用,
“时俗共重,以
为典范”
,对后世韵书的编撰产生了深远的影响。后来唐代孙愐的《唐韵》
,以及宋代陈
彭年等奉诏修订的《大宋重修广韵》
(简称《广韵》
)都是在《切韵》的基础上编成的。
由于《切韵》和《唐韵》都只有残本存世,所以我们只能采用《广韵》作为我们
课题研究中唐代诗歌用韵的标准。《广韵》是我国第一部官修韵书,收字二万五千多

16
个,按平上去入四声分卷。平声字还分为上下两卷,其他三声各一卷,一共是五卷,
分韵为 206 韵。这么多的韵部,对于诗歌用韵来说过于琐细,所以当时就规定了一些
语音相近的韵可以同用。去除这些可以同用的韵,《广韵》的韵实为 113 韵。

3.1.3 古、近体诗用韵的不同

唐代诗人用韵比较严格,要遵循当时朝廷认可的由私人或官方编撰的韵书中的韵
部,也就是《切韵》和《唐韵》,而不能任意使用,或者是以方言口语入韵。但是,
唐代诗歌数量庞大,体裁众多,各种体裁对于用韵的要求是不同的。古体诗虽然押韵,
但对韵的限制并不严格。可以押平声韵,也可以押仄声韵,并且可以随时换韵。倒是
古体诗中的柏梁体,要求句句押韵,且是押平声韵。和古体诗相比,近体诗在押韵方
面的要求,就严格多了。为了方便计算机的处理,我们将其归纳为以下三点:
(1)押平声韵。近体诗在用韵上,严格区别韵的平仄,绝没有平声韵和仄声韵
混杂通押的情况。究其原因,应该是出于诗歌音乐性的要求。清代江永[10]P4 认为:
“平
声音长,仄声音短;平声音空,仄声音实;平声如击钟鼓,仄声如击木石。”平声音
调悠长平展,适于曼声吟咏,而仄声有升降变化,节奏短促,音响效果也不如平声韵
那么和谐响亮。所以近体诗中采用平声韵。
(2)偶句用韵。把同一韵部的字齐整的安放在偶句句末的韵脚上,每隔一句才
重复一次,使得用韵上出现“同”的美。押韵体现在偶数句,奇数句不押韵(首句可
押可不押),两者交错进行,又体现出“异”的美。刘勰说“同声相应谓之韵,异音
相从谓之和”,这“同”和“异”的对比,大大加强了诗歌的音乐性。
(3)一韵到底。近体诗从头到尾只能押一个韵,不能间杂使用其他韵部的字,
更不能中途转韵。这个原则非常严格,不论是律诗、绝句还是排律都要遵循这个原则,
否则就叫出韵,犯了诗家大忌。这种一韵到底的韵例,能够保证韵律的和谐。

3.2 首句用韵情况的统计和分析

3.2.1 首句入韵情况

中国的诗歌不论古体,近体,都是押韵的。上面我们说到近体诗的用韵要求有一
条就是偶句用韵,而古体诗除了柏梁体之外,也多是偶句用韵的。如果首句的末字和

17
偶句韵脚的韵相同,那么就叫做首句入韵。
近体诗本来在格律上并不要求首句入韵,即使入韵了,也不算在韵脚之内。古人
称五言、七言律诗为四韵诗,绝句为二韵诗,排律有十韵或二十韵以至一百韵的不同,
都是偶数韵,而无单数韵,就是这个道理。既然首句可以入韵,也可以不入韵,诗人
就可以从这个多余的韵脚上讨得一些自由,可以根据诗意要求和个人爱好决定,不必
受格律的限制。前人总结出,一般来说,五言诗中,首句用韵的较少;七言诗中,首
句入韵的较多。且认为五言首句入韵的比例比七言首句不入韵的比例要多。原因在于
五言诗从魏晋以来首句就多不入韵,而七言诗从柏梁体到燕歌行,就有句句用韵的传
统,所以唐代诗歌保留这一传统,也体现出同样的规律。
关于首句入韵问题,前人的论述只是一个大概的印象,我们的任务就是将唐诗数据库
中的五言诗和七言诗做一个统计,考察两个不同体裁的诗歌首句入韵的比例各为多少。为
此,我们建立 1 个标识:首句用韵 firstin。具体做法是访问字段“末字韵 endyun”
,如果首
句的韵和偶句的韵属于《广韵》规定的同用范围,则在字段“首句用韵 firstin”中填入“入”

然后统计出字段“首句用韵 firstin”的内容为“入”的数量,就是首句入韵的数量。

3.2.2 首句借韵情况

首句借韵,也叫衬韵,是指诗歌的第一句不押本韵,而采用邻近他韵的现象。钱
大昕《十驾斋养新录》里说:
“五七言近体第一句,借用旁韵,谓之借韵。
”既然近体
诗首句用韵不是诗律所要求的,于是就有人在首句末字上玩点花样,使得它既与偶句
用韵不同,又讲求用韵的格式,这就造成了首句借韵现象。
但这一做法,有人认为是首句出韵,是不合韵律的。如王世懋《艺圃撷馀》“论
诗”云[2]P776:“至于首句出韵,晚唐作俑,宋人滥觞,尤不可学。”谢臻《四溟诗话》
卷一[3]P1143 也说“七言绝律,起句借韵,谓之‘孤雁出群’,……宁用仄字,勿借平字。

但大多少人认为近体诗首句借韵,是格律诗偶句韵式的一种变异,觉得这种变异给诗
歌带来了别样的韵趣。如果首句不用韵,韵与韵之间间隔的距离相等,不免显得呆板,
首句入韵的话又与偶句相同,还是没有变化。因此,在首句中采用邻韵,两韵的差别
不大,能够实现韵声之间的相互呼应和配合,取得声韵和谐的效果,也增强了本韵的
音响旋律。而且,在一首诗中,先出一个邻韵字作为本韵的铺垫,让人从这个韵字的
音响中预先推测出全诗所用的韵部,更能带来一番乐趣。

18
首句借韵的话,韵字就一定要选用邻韵字,不能随意用其他的韵字。沈德潜《说
诗晬语》卷下云:“律诗起句可不用韵,故宋人以来有入别韵者,然必于通韵中借
入。……乱杂不可为训。”可见哪些是邻韵也是有讲究的。前人多是按韵书韵部的先
后次序,把排列相近而又语音相似的韵作为邻韵,且不因上平声和下平声的界限而有
间隔。平声韵的邻韵关系如下:
东冬 江阳 支微齐 鱼虞 佳灰 真文元(半) 寒删先元(半)
萧肴豪 庚青蒸 覃盐咸
而歌、麻、尤、侵四个韵部没有邻韵。以上邻韵,只限于诗歌的首句,而且只有
同一类中的两个韵部才能互为邻韵,相互通押。首句用不用韵,用本韵还是邻韵,都
是合乎规则的。
我们统计首句借韵情况的具体方法是访问字段“末字韵 endyun”,如果首句的韵
和偶句的韵属于以上说的邻韵的范围,则在字段“首句用韵 firstin”中填入“邻”。然
后统计出字段“首句用韵 firstin”的内容为“邻”的数量,就是首句借韵的数量。

3.2.3 首句用韵情况表

通过统计分析,我们可以总结出全唐诗中首句用韵的情况,整理成图 3.1 如下。

30000
24331
25000

20000
16691
五言
15000
七言
10000
4372 3464
5000
402 1278
0
首句入韵 首句借韵 首句不入韵

图 3.1 首句用韵情况

全唐诗数据库中五言诗歌为 29105 首,七言诗歌为 21433 首,从图 3.1 中我们可


以看出,其中五言首句入韵的诗歌为 4372 首,占整个五言诗歌比例的 15%;七言首
句入韵的诗歌为 16691 首,占整个七言诗歌比例的 78%,可见前人关于五言诗歌首句
入韵的较少,而七言诗歌首句入韵的较多这一结论是正确的。我们还发现,七言首句

19
不入韵的诗歌为 3464 首,占整个七言诗歌比例的 16%,和五言首句入韵的比例 15%
差不多,与前人说的五言首句入韵的比例比七言首句不入韵的比例要多的看法不同。
首句借韵方面,据我们的统计,整个唐诗数据库 29105 首五言诗歌中有 402 首首句
采用了邻韵,所占比例为 1.4%;21433 首七言诗歌中有 1278 首首句采用了邻韵,所占比
例为 6%。可见,唐代诗歌中首句借韵的诗歌并不多,而其中七言诗歌首句借韵的情况比
五言诗歌首句借韵的情况要多。从出现的时代来看,五言借韵最早出现在盛唐王丘的《奉
和聖製送張尚書巡邊》中(卷一百十一)
,韵字为:通戎公衷融中雄風窮,都是東韵,首
句“宗”字为冬韵,以冬衬東。七言借韵最早出现在初唐郭震的《螢》中(卷六十六)

韵字为:時知,为支韵,首句“依”字为微韵,以微衬支。另外,初盛唐首句借韵现象
很少,只有五言 15 首,七言 11 首首句采用了邻韵,到中晚唐五言、七言首句借韵现象
逐渐增多,分别占整个唐诗首句借韵情况的 96%和 99%。可见,首句借韵这一现象是在
中晚唐才形成风气的,初盛唐不过是偶一为之。所以我们可以认为,初唐律体刚定的时
候首句采用邻韵是算做出韵的,但到了中晚唐就成了一种风尚,不算出韵了。

3.3 诗韵和韵段的统计与分析

近体诗用韵甚严,无论律诗、绝句还是排律都必须是押平声韵,一韵到底,不允
许通韵。《广韵》一共 25362 个字,分为 206 韵,除去同用的也有 113 韵,每个韵部
所包含的字数并不是相同的,有的韵字数多,有的韵字数少。诗韵字数的问题对于诗
人创作来说是很重要的,字数多的自然方便创作,字数少的约束较多,不利于创作。
诗律学中所指的韵的宽窄,主要是指每一韵部字数的多少,字数多的韵宽,字数少的
韵窄。前人按诗韵的宽窄程度,将诗韵分为四类(见王力[14]P44,他是按照平水韵的平
声 30 韵,我们这里按照《广韵》规定的同用独用的平声 31 韵,多加了一个严韵):
(1)宽韵:东 支 虞 真 先 阳 庚 尤
(2)中韵:冬 鱼 齐 灰 元 寒 萧 豪 歌 麻 侵
(3)窄韵:微 文 删 青 蒸 覃 盐
(4)险韵:江 佳 肴 咸 严
但是经过我们的考察,诗人经常采用的韵却不一定和以上诗韵的宽窄完全对应,

20
因为不同的韵有不同的表达效果,周济[4]P4 就说“东真韵宽平,支先韵细腻,鱼歌韵缠
”关于这个现象,王力[14]P44 也提到过,
绵,萧尤韵感慨,各具声响,莫草草乱用。 “像
微文删三韵,字数虽少,却是非常的合用,所以诗人很喜欢用它们”
。所以,我们就想
通过考察全唐诗数据库中的唐诗,来看到底哪些诗韵是诗人常用的,哪些是不常用的,
并与前人所说的诗韵的宽窄做一个比较。为此,我们建立了 1 个标识:韵宽 width。具
体做法是访问所有近体诗的字段“末字韵 endyun”
,将偶句的韵提取出来,属于《广韵》
规定的同用独用范围的就记入字段“韵宽 width”中,然后计算每个韵宽的数量。

表 3.1 诗韵所辖字数和韵段数目表
编号 同用独用例 所辖字数 韵段数目
1 一東 357 890
2 二冬三鍾 301 253
3 四江 108 28
4 五支六脂七之 1090 1143
5 八微 141 808
6 九魚 234 358
7 十虞十一模 678 226
8 十二齊 335 275
9 十三佳十四皆 167 25
10 十五灰十六咍 300 652
11 十七眞十八諄十九臻 398 1094
12 二十文二十一欣 163 453
13 二十二元二十三魂二十四痕 335 399
14 二十五寒二十六桓 301 491
15 二十七删二十八山 139 520
16 一先二仙 570 1030
17 三蕭四宵 407 282
18 五肴 177 21
19 六豪 221 140
20 七歌八戈 286 437
21 九麻 258 475
22 十陽十一唐 582 823
23 十二庚十三耕十四清 463 1259
24 十五青 231 219
25 十六蒸十七登 175 174
26 十八尤十九侯二十幽 620 928
27 二十一侵 208 736
28 二十二覃二十三談 193 41
29 二十四鹽二十五添 212 20
30 二十六咸二十七銜 100 6
31 二十八嚴二十九凡 20 1

21
我们提取出整个全唐诗数据库中的五言八句的诗歌,一共 15370 首,占整个唐代
五言诗歌的 52.8%,通过考察这些诗歌来得出唐诗诗韵所辖字数和韵段数目之间的对
比关系,并列成上面的表 3.1。
通过表 3.1,我们发现,15370 首五言八句的诗歌中押平声韵的有 14207 首,占了
92.4%,可见唐代诗歌多押平声韵。此外,韵段数目最多的是十二庚十三耕十四清韵,
为 1259 次,占整个平声韵的 9%;最少的是二十八嚴二十九凡韵,只押了 1 次。为了
与上文的四类诗韵作对比,我们根据表 3.1 中韵段数目的多少,采用与诗韵宽窄一样
的平声 31 韵将唐代诗歌诗韵分为 ABCD 四类:
A 韵段数目大于 800 次的韵:庚 支 真 先 尤 东 阳 微
B 韵段数目在 400 到 800 之间的韵:侵 灰 删 寒 麻 文 歌
C 韵段数目在 100 到 400 之间的韵:元 鱼 萧 齐 冬 虞 青 蒸 豪
D 韵段数目小于 100 次的韵:覃 江 佳 肴 盐 咸 严
通过比较我们发现,大部分韵的韵段数目与它所辖字数的多少呈正比,与前人说
的诗韵宽窄情况相同,但也有例外情况。比如,微韵在诗韵中算作窄韵,其字数只有
141 个字,但是诗人们用它押韵的次数却是 808 次,可见微韵是诗人们最常用的韵之
一。与此相同,删、文两韵都属于窄韵,但押韵的次数分别为 520 次、453 次,也是
诗人们喜用的韵。相反,虞韵在诗韵中算作宽韵,其字数为 678 个,但诗人们用它押
韵的次数却只有 226 次。另外,覃韵和盐韵本来在诗韵中不是险韵,但其韵段数目却
和险韵的差不多。
为了更方便的看出诗韵和韵段的关系,我们制作了表 3.2 如下:

表 3.2 诗韵和韵段分类对比表
诗韵分类 宽 宽 宽 宽 宽 宽 宽 窄 中 中 中 中 中 窄 窄

诗 韵 东 支 真 先 尤 阳 庚 微 侵 灰 歌 寒 麻 删 文

韵段分类 A A A A A A A A B B B B B B B

诗韵分类 宽 中 中 中 中 中 中 窄 窄 窄 窄 险 险 险 险 险

诗 韵 虞 鱼 萧 齐 冬 元 豪 蒸 青 覃 盐 佳 肴 江 咸 严

韵段分类 C C C C C C C C C D D D D D D D

22
4 唐代诗歌平仄格式的研究

4.1 诗歌平仄概说

据研究,我国上古时期就出现了具有辨义作用的声调。中国古代文人很早就有意
识地运用字词声调的相互搭配,以求其作品的声调之美。范文澜[37]P555 说“魏、晋之
世,声律之学出兴,故子建、士衡虽悟文有音律,而未娴协调音律之定术,踯躅燥吻,
即谋音律之调谐耳。”可见,魏晋人已经知道运用字音的平仄来谋求诗文语句的谐和,
但他们还没有掌握音律的系统法则。到了齐梁时期沈约、周顒等人大讲音韵,提出四
声八病之说,初步总结了诗文平仄声律运用法则,并加以宣传推广。沈约在《四声谱》
中专门讲述了平上去入四声和文学的关系,认为在诗歌创作中“若前有浮声,则后须
切响。一简之内,音韵尽殊,两句之中,轻重悉异”,而且为了贯彻这一原则还制订
了各种细则,称为“八病”。这里沈约看到了汉语声调之间存在的差异,认为音韵在
横向和纵向上都要错落变化才能构成诗歌语言的音乐美,
“妙达此旨,始可言文”。这
可以看成是诗歌声律学说创立的标记,并在沈约等人的倡导下风行一时,但最终还是
没有得到全面的贯彻,还遭到很多非议,如钟嵘《诗品序》中就曾批评声病说“使文
多拘忌,伤其真美”。这可以看出,齐梁声律需要改造以适应诗歌内容的表达。
后人在发现四声的基础上,又有了新的进展,那就是将四声归结为平声和仄声(包
括上去入三声)两大类别,对四声作了合理的简化。梁朝的刘縚[16]P413 说“平声赊缓,
有用处最多。参彼三声,殆为大半”,他感觉到平声和其他三声是对立的。郭绍虞把
这称为“四声二元化”。区分平上去入四个声调在调声上不免限于苛细,而且注重病
犯也不利于创作的自由开拓,于是唐人超越各种消极的病犯禁例,将四声作了平仄二
元化的处理,利用平仄相间的原理,构造出一套明白易懂、切实可行的声律定式,不
仅适用于五七言诗歌,也对后世词曲产生了深刻影响。这种改造不仅来自于诗歌创作
的实践,而且也是诗歌形式逐渐适应并从属于内容表达的明证。
平仄反映了汉语声调的本质特点,古人发现并归纳了汉语四声的这个差别,有利
于语言声律的调配。诗歌的创作从此也就逐步走上了律化的道路。在平仄被发现并运
用于诗歌创作之前,诗体无所谓古、近,到唐初,平仄在诗歌创作中形成了严密的系

23
统,成为诗歌声律的主要依据,人们便把注意了平仄安排的诗歌,称为近体诗,而把
唐以前的诗歌以及唐人所做的不考虑平仄的诗歌称为古体诗。两者的平仄格式不同。

4.2 唐诗中平仄格式的分析

4.2.1 计算机辅助平仄格式分析的方法

为了不受字数、句数等其他形式方面的影响,我们从唐诗数据库中挑出了 14416
首五言八句的诗歌,这样形式统一,每首诗都是 8 句,每句 5 字,一共 40 个字。
要分析平仄格式,首先要区分出诗歌的体裁是古体诗还是近体诗,因为两者的平
仄格式是不同的。根据上面的论述,近体诗是押平声韵,偶句押韵,一韵到底,而且
平仄上有严格的规定。为了区分出古体诗和近体诗,我们又建立了 2 个标识:句型 style,
体裁名称 name。并制定了一些规则,让计算机自动的分析出诗歌的体裁。
(1)因为古体诗是可以转韵的,所以如果字段“同摄否 sameshe”为“No”,则
字段“体裁名称 name”为古体诗;
(2)因为近体诗是押平声韵且偶句用韵,所以如果字段“平仄格式 pzformat”
中的每句的末字不是“仄平仄平仄平仄平”或者“平平仄平仄平仄平”,则字段“体
裁名称 name”为古体诗;
(3)将字段“平仄格式 pzformat”中每句诗的平仄格式到“诗歌基本句型表”
中的字段“句型的平仄格式”中匹配,并将句型代码记入字段“句型 style”中。中间
有不能匹配的则字段“体裁名称 name”为古体诗;
(4)剩下的就是近体诗了,但是中间可能有些平仄格式不符合粘对的规则,我
们把它标成“变体”。
这一过程的流程图如下图 4.1(a),4.1(b)所示。
表 4.1 五言古体诗和律诗分期数量表

初 唐 盛 唐 中 唐 晚 唐 总 计

五言古体诗 592 1603 2184 501 4880

五言律诗 819 1645 3221 3851 9536

总 计 1411 3248 5405 4352 14416

24
开 始
C
打开唐诗数据库

读取诗歌数据表中的第 poem 移 向
一条记录,并赋 poem 下一条记录

No

No
该诗是否有相同的摄 诗 为古体 诗
最后一
(sameshe=TRUE) style=古體
首诗否

Yes Yes
读取 pzformat 字段中的内容
B 关闭数据库结束程序

No 第 二 句 开始 的末 Yes 读取该诗第一句的平仄
B 字平仄是否为"平 A
格式,并赋格 strPZ
仄平仄平仄平"

A 图 4.1(a)

在平仄格式句型表中找到 strPZ 所对应


的句式代码(找不到的用?代替),并赋给
strStyle, strStyle+=strStyle

No
strPZ 是 否 是 strPZ 移向下
B 一句
最后一句

Yes C
Yes
No

strStyle 中是 将 strStyle 赋给体裁;

否含有问号 style=strStyle 最后一首


诗否
No
Yes
在平仄類型表中找到 strStyle 所对应的格式名
稱(找不到的用變體代替),赋给字段 Name 关闭数据库结束程序

图 4.1(b)

25
区分出古体诗和近体诗之后,我们统计出,14416 首五言八句诗歌中五言律诗有
9045 首,五言古体诗有 4880 首,变体有 491 首。变体可以看成是失粘失对的律诗,
那么实际上律诗有 9536 首。各时期两种诗体的分类如上表 4.1。从数量上来说,初唐
律诗相对较少,因为那时律体正在形成之中。到了盛唐以后律诗数量逐渐增多,晚唐
则达到顶峰。而古体诗以中唐为高峰,到了晚唐就转向衰落,数量大大少于律诗了。
从我们的唐诗数据库中,我们可以搜索出五言律诗最早出现于初唐李世民的《帝京篇
十首(一)》(卷一)。

4.2.2 近体诗的平仄格式

近体诗有不同的平仄格式,但其内部结构有很强的规律性,那就是一句之间要平
仄交错,也就是说在一句的节奏点上平声字和仄声字要交替出现,这样诗歌的节奏才
匀称起伏。据前人总结,无论是律诗、绝句还是排律,都只有四种平仄基本句型。这
四种平仄基本句型的不同搭配,就构成了近体诗的各种不同平仄格式。这四种平仄基
本句型如下(以五言为例):
A 式:仄仄平平仄 B 式:平平仄仄平
C 式:平平平仄仄 D 式:仄仄仄平平
其中 A、C、D 三式的首字平仄可以不论,这样又多了 3 种句型。近体诗中,除
了上面 7 种是完全符合平仄规则的句型外,还有一些不合平仄规则的句子。既然不合,
就要补救,于是产生了拗救现象。归纳起来可以分为 5 类:
(1)A、B、C 三式五言第三字的平仄可以改变;(5 种)
(2)A 式第四字如用仄,则对句的第三字必用平;(2 种)
(3)A 式第三字、第四字如都用仄,则对句的第三字必用平;(2 种)
(4)B 式首句如用仄,则第三字必须改为平;
(1 种)
(5)C 式第三四两字的平仄可以互换;(1 种)
这样,我们就总结出五言近体诗的平仄基本句型,一共是 18 种。这 18 种句型按
照一定的规则排列,就形成了近体诗的平仄谱式。其规则有两点:第一,两句之间平
仄对立。平仄对立,指的是在一联两句之间的节奏点上平仄要相反,这样保证了出句
和对句的平仄有变化,如果违背就叫“失对”。第二,两联之间平仄相粘。平仄相粘,
指的是上联对句和下联出句的第二字平仄必须相同,这样使得上下联紧密相连成为一

26
个整体,也保证了全诗的平仄句型有变化。如果违背就叫“失粘”。
根据以上两条规则,我们可以整理出律诗的平仄谱式,一共是 4 种。
(1)仄起仄收:A B C D A B C D (2)平起平收:B D A B C D A B
(3)平起仄收:C D A B C D A B (4)仄起平收:D B C D A B C D

4.2.3 古体诗的平仄格式

古体诗,又称古风。唐代诗人在大量创作近体诗的同时也写了许多古体诗。唐代
以前的诗歌是一种不讲究声格律,也没有字数句数限制的诗体,入唐以后,由于近体
诗的产生,诗人为了将古体诗和近体诗区分开来,就有意的在某些方面加以限制,从
而形成了唐代古体诗的固定模式。
古体诗的平仄远比近体诗的复杂,诗句中的平仄只有两个,按排列组合在五言句
中就可以形成 32 种句型,七言句中可以形成 128 种句型,因此要把古体诗五言和七
言的平仄句型一一罗列出来,找出简单明晰的规律,是比较困难的。清代赵执信《声
调谱》、王士禛《古今平仄论》刻意找出古体诗的平仄规律,结果古体诗的平仄句法
竟多达百数,法式太多,无法遵从。所以也就有人认为古体诗的平仄是没有规律的。
李重华《贞一斋诗说》卷四就说“夫诗为天地元音,有定而无定,到恰好处,自成音
节,此中微妙,口不能言。……阮亭(王士禛字)不能以四仄三平之例缚之也。”
古体诗是自然的音节,以语言的气势为主,律诗是人为的声律,以文字的平仄为
主。但律体盛行之后,古体诗的音节自然不宜杂用律调。王力[14]P382 总结了前人关于
唐代古体诗与近体诗平仄的区别,包括二四两字、三五两字是否同声,出句是否用平
脚等。还指出关于古体诗的平仄虽众说纷纭,但赵执信提出的古体诗以每句的下三字
为主这一定理却为大家公认,认为古体诗的常轨有以下 4 种:
(1)平平平 (2)平仄平
(3)仄平仄 (4)仄仄仄
前人关于古体诗平仄格式的说法毕竟还是太笼统,好像所有的平仄句型都可以采
用,格式上也不如近体诗那么严格。我们的目的就是企图通过数理统计的方法来给古
体诗的平仄规律得出一些有意义的结论。具体做法是先把所有的古体诗列成一个表,
然后依次统计每首诗所用的平仄句型,考察一共用了多少种平仄句型,每种平仄句型
使用的频率是多少。

27
4.3 平仄格式表

区分出古体诗和近体诗之后,我们就可以来用数理统计的方法来统计每种体裁的
平仄句型,以及每种平仄句型的频率了。由于唐诗的个别字句在流传中已经缺漏,在
数据库中用“□”来表示,除去这些不完整的句型,五言八句诗歌的句型数量为 115226
次,其中古体诗为 42882 次,近体诗为 72344 次。我们整理出 14416 首五言八句诗歌
的平仄句型以及他们的数量、频率,列表如下:

表 4.2 平仄格式频率表
编号 平仄句型 古体诗 近体诗
1 平平仄仄平 5224 14841
2 平仄仄平平 4072 10625
3 仄仄平平仄 4261 9884
4 仄仄仄平平 3719 8802
5 仄平平仄仄 2937 7239
6 平平平仄仄 2669 5818
7 平仄平平仄 1884 4503
8 平平平仄平 1667 2598
9 平平仄平仄 2583 2580
10 平平仄仄仄 1347 1624
11 仄平平仄平 1139 1358
12 仄仄仄平仄 1017 1037
13 平仄仄平仄 847 812
14 仄仄平仄仄 669 200
15 仄仄仄仄仄 342 133
16 仄平仄仄仄 322 114
17 平仄平仄仄 374 88
18 平仄仄仄仄 270 88
19 平仄平平平 747 0
20 仄平仄仄平 334 0
21 仄仄平仄平 602 0
22 平仄平仄平 332 0
23 仄仄仄仄平 364 0
24 仄平仄平仄 636 0
25 仄仄平平平 1369 0
26 平平仄平平 912 0
27 仄平平平仄 562 0
28 仄平仄平平 387 0
29 仄平平平平 183 0
30 平平平平仄 470 0
31 平仄仄仄平 388 0
32 平平平平平 253 0
总计 42882 72344

28
通过表 4.2 我们可以看出,五言律诗一共采用了 18 种平仄句型,其中用的最多的

是“平平仄仄平”、“平仄仄平平”、“仄仄平平仄”、“仄仄仄平平”这 4 种句型,

合起来占了所有律诗平仄句型数量的 61%。相比起来,“仄仄平仄仄”、“仄仄仄仄

仄”、“仄平仄仄仄”、“平仄平仄仄”、“平仄仄仄仄”5 种句型使用得较少,合

起来只占所有律诗平仄句型数量的 3%。

而前人说的四种基本句型中的“仄仄仄平平”(8802)和“平平平仄仄”(5818)

在数量上都不如他们的变体“平仄仄平平”(10625)、“仄平平仄仄”(7239)多,

可见这两种句型是常用的正体,不需要称为变体。

另外,前人都把“平平仄平仄”这一句型看成是拗句,而王力[14]P108 认为这是非

常常见的句型,是与“平平平仄仄”一样任人择用的句型,所以把它称之为“子类特

殊形式”。通过表 4.2,我们可以看到“平平仄平仄”一共用了 2580 次,数量上还不

到前人所说的正体“平平平仄仄”(5818)的一半,可见这种格式在唐人看来是符合

律诗格式的,但还是没有正体使用的频繁。这与王力的观察有出入。

五言律诗的首句以仄起仄收最为常见,一共用了 4516 次,占五言律诗的 47%,

以平起平收最为少用,一共用了 746 次,占五言律诗的 8%。我们认为原因在于五言

诗歌以首句不入韵的居多。

古体诗方面,五言古体诗可能的 32 种平仄句型都用到了。其中用的最多的也是

“平平仄仄平”、“仄仄平平仄”
、“平仄仄平平”、“仄仄仄平平”4 种,占了古体诗平

仄句型数量总和的 40%。除律诗采用的 18 种平仄句型外,其他的 14 种古体诗特有的

平仄句型数量总和为 7539,占古体诗平仄句型数量总和的 18%。其中古体诗特有的三

平调,即尾三字是三个平声的平仄句型一共使用了 2552 次,占古体诗平仄句型数量

总和的 6%。

就前人认为最能体现古体诗平仄特色的尾三字的平仄数量来说,仄平平、平平仄、

平仄仄、仄仄平四种最多,占了平仄句型数量的 68%,相反前人认为是古体诗常轨的

平平平、平仄平、仄仄仄、仄平仄的数量较少,只占平仄句型数量的 32%。古体诗尾

三字数量分布见图 4.2。

29
10000 9090
9000
8000 7177
7000 6310 6649
6000 5083
5000
4000 3740
3000 2552 2281
2000
1000
0
平平平 仄仄仄 平平仄 仄仄平 平仄平 仄平仄 平仄仄 仄平平

图 4.2 尾三字数量分布

前人还提出一个古体诗的规律,就是看第二、四两字和第三、五两字是否同声,
有的认为同声的是正体,不同声的是拗体,有的意见正好相反。我们对二四、三五两
字的平仄情况进行了整理,形成图 4.3 如下。

33555
35000
29226
30000
25000
20000
同声
15000
13656 异声
10000 9327
5000 异声
0
二四 同声
三五

图 4.3 二四、三五字同异声数量图

根据我们的数据来看,五言八句古体诗第二、四两字和第三、五两字平仄相同的
数量较少,分别为 9327 次和 13656 次,平仄相反的数量较多,分别为 33555 次和 29226

30
次。另外,二四平仄相同的数量比三五的要少,而二四平仄不同的数量比三五的要多。
这样看来似乎五言八句古体诗的平仄和律诗的平仄类似,第二、四两字和第三、五两
字的平仄都是相反的。

31
5 计算机处理过程中的问题及其解决思路

计算机辅助使我们的工作进展很快。但也由于计算机的参与,我们的课题研究中
出现了一些新的问题,主要还是一个字形和字音的问题。所以最初我们的程序运行之
后,数据库标识中间出现了很多的问号,仍然需要我们利用自己的唐诗声律常识来手
工进行校对。在实际的工作过程中,我们积累了一些经验,下一步我们的做法就是想
把这些经验加入到我们的程序中,使之更加完善,也让计算机帮助我们多做一些自动
化的处理,这样就能省去很多案头工作的劳累。

5.1 计算机查找不出来的字的处理问题

在全唐诗数据库中,计算机是采用遍历的方法在各个表中来查找文本中每个汉字
的韵、摄和平仄。每首诗歌中的汉字都必须先到这个表中来找出它所属的韵,然后再
到“韵摄调表”和“调与平仄表”中查找,才能知道这个字的韵、摄、调和平仄等声
律信息。如果计算机不能查找到这个汉字的声律信息,这就只能是因为两种原因:
1)这些表中间根本就不包含这个汉字,所以它的韵、摄和平仄也就无法标出。因
为我们的韵字表中只有 25362 个汉字,唐诗中采用的某些汉字可能超出了这个范围,
所以无法标出。特别是一些超大字符集都没有的汉字,更是在韵字表中无法找到。比
如:[兌*攴],[/厓],[氵*(雨/品)],[姊-女+臼],这类的字在韵字表中都没有。但
是经过检查,这类汉字是比较少的。
2)异体字的问题。当时制作“韵与韵字表”的时候,主要的原则是保持韵书的原
貌,所以一些汉字的字形与唐诗中通用的字形不符合,以至于计算机查找的时候把它
们当成了两个不同的汉字来对待,所以就不能查找出正确的声律信息来。这一类的汉
字比较多,下面举一些例字。
郷/鄉。韵字表中的“乡”字用的字形是“郷”,区位码是 90F7,而唐诗中常用的
“乡”的字形是“鄉”,区位码是 9109,两者在计算机看来是不一样的。
丗/世。韵字表中的“世”字用的字形是“丗”,区位码是 4E17,而唐诗中常用的

32
“世”的字形是“世”,区位码是 4E16。
歩/步。韵字表中的“步”字用的字形是“歩”
,区位码是 6B69,而唐诗中常用的
“步”的字形是“步”,区位码是 6B65。
这类字形上有差别的汉字还有很多,根据我们的工作,将一些常用的部首和汉字
分为两类,整理如下(前面一个字表示是韵字表中的字形,后面一个字表示是唐诗中
的字形,中间用“/”隔开):
(1)字形上有小的差别。如髙/高、舎/舍、兊/兌兑、乗/乘、彔/录、亘/亙、吿/
告、幵/开、刄/刃、敎/教、旣/既、賔/賓、貟/員、帀/匝、衞/衛、眞/真、隂/陰、彥/
彦、賛/贊、涅/湼、聮/聯、緫/總、阱/井、窓/窻、勛/勳、彚/彙、奼/姹、葘/菑、踈/
疏、劔/劍、閒/間、虯/虬、査/查、穏/穩。
(2)部首位置上有差别。如崐/崑、峩/峨、嚻/囂、裠/裙、飊/飚、壠/壟、欻/歘。

对于这类问题我们提出了以后的工作思路,那就是增加韵字表中的汉字,把字形
上有差别的部首和汉字一一列出,这样计算机就能够识别了。

5.2 多音字的计算机自动筛选问题

还有一个困扰我们的问题就是多音字的问题。同样的一个字形,却有不同的读音,
也就是说分别属于不同的韵、摄,也有不同的平仄,这时计算机处理起来就出现了麻
烦。我们最开始的思路是不管这个字有多少个读音,把它都标出来,比如“乘”字,
有两种读音,一个是下平声十六蒸,意思是“駕也,勝也,登也,守也”;一个是去
声四十七證,意思是“車乗也”,两种读音都属于曾摄。那么碰到这样的字,就在后
面标出它的几种可能,中间用“/”隔开。然后再由人工来加以判断。比如碰到“濟潼
紆萬乘”这句诗,
“乘”字的韵计算机就会自动标为“十六蒸/四十七證”,然后我们人
工处理的时候,知道这个“乘”字在这里的意思是车辆,于是就把它的韵识别为四十
七證,而不是十六蒸了。
但是这个工作思路在实际的程序运行过程中却出现了问题,因为这个工作的前提
在于计算机处理的时候一定要遍历韵字表中所有的韵字,要不然计算机在碰到这个多
音字的第一个读音之后就把它记入一条空纪录中,然后就处理下一个字了。这样的话

33
就不能把这个字所有的读音都标识出来。比如上面例句中的“乘”字,计算机标注出
来的永远都是下平声十六蒸,因为在韵字表中平声出现在去声的前面。另外,这样处
理的时候,每个字都要搜索一遍韵字表中所有的汉字,运行起来速度就比较慢了。
这样的多音字字数虽然不多,但在诗歌中却是经常出现的,为了方便我们的工作,
也为以后类似的工作提供借鉴,我们提出了以下两点处理唐诗中多音字的方法。
(1)一般来说,多音字的读音中有平和仄的不同。根据上文 3.3 节,唐诗中押韵
的韵脚多是平声,占 92.4%,押仄声韵的诗歌很少,所以当这个多音字处于韵脚的位
置时,我们首先要考虑它的读音是平声的那个。
比如宋之问《答田徵君》
(卷五十三)“出遊杳何處,遲回伊洛間。歸寢忽成夢,
宛在嵩丘山。”其中“间”字有两个读音,上平声二十八山和去声三十一襉。正好这
个字处于韵脚的位置,而唐诗中多押平声韵,于是我们把它的平仄标为平声,韵为二
十八山。再来核对它的意思,
“间”字平声的意思是“隙也,近也,又中閒”,去声的
意思是“廁也,瘳也,代也,送也,迭也,隔也”,两相比较,我们发现诗中“遲回
伊洛間”的“间”字就是平声中间的意思。
(2)不管是古体诗还是近体诗,都要遵循押韵的原则,除了古体诗中间可以换
韵之外,一般来说唐诗的韵脚都是在一个韵中的,包括可以同用的韵。所以当这个多
音字处于韵脚的位置时,我们就可以比照其他的韵脚来判断这个多音字在这里应当是
属于什么韵的。原则就是应当选择和其他韵脚同摄的那个读音。
比如太宗皇帝《帝京篇十首(一)》
(卷一)“秦川雄帝宅,函谷壯皇居。綺殿千
尋起,離宮百雉餘。連甍遙接漢,飛觀迥凌虛。雲日隱層闕,風煙出綺疏。”其中的
“居”字有两个读音,七之和九鱼,两个都是平声,但是却属于不同的摄,一个是止
摄,一个是遇摄。正好这个字处于韵脚的位置,我们参考其他的韵脚“餘”、
“虛”、
“疏”
三个字都是属于上平声九鱼的,所以我们就把它的韵标为九鱼,摄为遇摄。核对意思,
七之的“居”是語助词,而九鱼的“居”是“當也,處也,安也”,正好符合诗意。
上面这个例子是韵脚属于同一个韵的,下面再举一个韵脚同摄不同韵却经常在一
起同用的例子。
“行”字有四种读音,十一唐(宕摄),十二庚(梗摄),四十二宕(宕摄)和四

34
十三映(梗摄),前两个是平声,后两个是去声。我们来看下面两首诗歌。姚合《送
邢郎中赴太原》(卷四百九十六)“上將得良策,恩威作長城。如今并州北,不見有
胡兵。晉野雨初足,汾河波亦清。所從古無比,意氣送君行。”根据第一点,处于韵
脚的字我们首先考虑平声,这样就排除了去声的那两个读音,然后我们再看其他的韵
脚“城”、“兵”、“清”,分别属于“十四清”、“十二庚”、“十四清”,都是梗摄的字,
所以我们就把这首诗中的“行”字标为十二庚,梗摄。而姚合的另一首诗歌《送張郎
中副使赴澤潞》(卷四百九十六)“曉陌事戎裝,風流粉署郎。機籌通變化,除拜出
尋常。地冷饒霜氣,山高礙雁行。應無離別恨,車馬自生光。”这首诗的韵脚“裝”

“郎”、“常”、“光”分别属于“十阳”、“十一唐”、“十阳”、“十一唐”,这两个韵在
《广韵》中是规定可以同用的,同属宕摄,这样我们就可以把这首诗中的“行”字标
为十一唐,宕摄。这里不同的诗歌中同一个“行”字的韵摄的归属,就是根据同一首
诗中其他韵脚韵摄的归属来确定的。
以上说的都是多音字处于韵脚时的方法,如果这个多音字处于诗句中间,我们则
可以根据多音字的字义和词组出现的频率来辨别。在实际的工作过程中,我们发现有
些字虽然是多音字,但在唐诗中往往只取其中的一个音,像这样的字可以当成是只有
一个读音的字,比如“枕”字,有平声二十一侵,上声四十七寑和去声五十二沁三个
读音,但平声的那个意义“繫牛杙也”在唐诗中没有出现过,所以我们可以把“枕”
字当成仄声字来处理。这类的汉字还有不少,比如“罷比弊洞凍但澹墮梵幾漸卷淨妓
控浪麗冷料令暖煖且淺若任冉氏尚勝扇示望惡縣獻羡醒戲怨院振枕只衆湛縱障折”,
这些字在唐诗中绝大多数采用的是仄声读音,而“傷緣”多采用平声读音,所以我们
可以采用计算机来统一处理。
另外,我们可以根据包含多音字的词组出现的频率来辨别其读音。比如“乘”字,
在遇到“万乘”这个词组时,我们就可以断定它是读去声四十七證的那个音。再如“更”
这个字,在有“三更”、“更漏”、“残更”、“更衣”等词组中都是读上平声十二庚韵,
其它时候读去声四十三映韵。这样的规律只能在实际的工作过程中才能发现,程序中
不好控制,所以课题中我们还是采用了传统的辨别字义法来确定。

35
6 结束语

我们创建了整个唐代诗歌的数据库,采用数理统计方法来处理唐诗,得出了以下
结论和成果:
(1)建立了唐代诗歌数据库,包括《全唐诗》和《全唐诗补编》收录的所有诗
歌 57379 首。其中五言诗歌为 29105 首,七言诗歌为 21433 首,两者共占唐代诗歌总
数的 88.1%。
(2)通过计算机编程对唐代诗歌进行声律地位的标识,包括韵、摄、调和平仄
句型和谱式的标识。
(3)对 29105 首五言诗歌和 21433 首七言诗歌的用韵情况进行穷尽式分析,整
理出唐代诗歌的首句用韵情况。首句入韵方面,我们证实了前人关于五言诗歌首句入
韵的较少,而七言诗歌首句入韵的较多这一结论;统计出五言首句入韵的比例和七言
首句不入韵的比例差不多,与前人结论不同。首句借韵方面,我们统计出唐代诗歌中
首句借韵的并不多,其中七言诗歌首句借韵的情况比五言诗歌首句借韵的情况要多。
而且从时代上来说初盛唐只是偶一为之,中晚唐逐渐增多。
(4)对 15370 首五言八句诗歌的押韵情况进行数量分析,并与诗韵宽窄情况进
行对比,整理出诗韵所辖字数和韵段数目对比表。一般说来,诗韵收字的多少和韵字
入韵的频率呈正比,与前人说的诗韵的宽窄相同,但也有例外的情况。如微文删三韵
虽为窄韵却很常用;而虞韵虽是宽韵但押韵上却不如其它的宽韵常用。
(5)编程实现对 14416 首五言八句诗歌体裁的区分,整理出古体诗和律诗分期
数量表。通过频率统计整理出古体诗和律诗采用的平仄句型以及他们的数量。
以上我们对唐诗声律的分析和研究还有待进一步的深入:
(1)观察诗歌的同用独用或者是邻韵是否和押韵的实际情况相同,是否建立在
实际的语音基础上。考订同用独用和邻韵订立的原则。
(2)观察所有五言诗歌的平仄格式,再加上对七言诗歌的分析,对唐代诗歌的
平仄格式做一个更加全面的分析。

36
致 谢

五月的武汉,户外虽骄阳似火,喻园里却是绿树成荫。不知不觉中三年的研究生
生涯就要结束了。面对电脑上我的论文和大量的数据资料,回首在喻园度过的青春岁
月,不由得感慨万分。
在喻园求学七载,要感谢很多人。首先要感谢我的导师尉迟治平先生,是他指引
我走上了学术的道路。对于学术上的疑难,先生既能高屋建瓴,从框架立意上予以指
导和把握,然于细小之处,也是字斟句酌,丝毫不马虎。每次讨论,先生渊博的知识,
敏捷的思维,严谨求实的治学态度以及宽厚待人的高尚品德都令学生没齿难忘。在此
我要衷心地感谢尉迟老师的教诲!
感谢李崇兴老师、董为光老师、黄树先老师、程邦雄老师、刘根辉老师、骆琳老
师,是你们的教诲使我变得丰富,你们永远是我的老师!也要感谢资料室的张建国老
师在提供资料方面给予的帮助!还有我的同门李雪、熊梅、张艳、甘勇、张帅,三年
内我们建立了深厚的友谊,互相讨论的日子让我增长了不少知识。
还要感谢我的朋友吴超群博士,在我的课题开展中,他给了我很多有益的帮助和
建议,我的论文中计算机辅助方法这一块就得益于他的指导。他理性的思维方法和不
厌其烦的治学态度,都给我留下很深的印象。
最后,要感谢我的父母和姐姐,长这么大你们一直都是我的精神支柱。谢谢你们
长久以来对我的支持和鼓励!

廖继莉
乙酉年五月四日于喻园

37
参考文献

[1] 明胡震亨. 唐音癸签. 上海: 上海古籍出版社, 1981


[2] 明王世懋. 艺圃撷馀: 历代诗话. 北京: 中华书局, 2001
[3] 明谢榛. 四溟诗话: 历代诗话. 北京: 中华书局, 2001
[4] 清周济. 宋四家词选. 上海: 古典文学出版社, 1958
[5] 清王士禛. 律诗定体: 清诗话. 上海: 上海古籍出版社, 1978
[6] 清王士禛. 古今平仄论: 清诗话. 上海: 上海古籍出版社, 1978
[7] 清何世璂. 然鐙记闻: 清诗话. 上海: 上海古籍出版社, 1978
[8] 清赵执信. 声调谱: 清诗话. 上海: 上海古籍出版社, 1978
[9] 清翟翬. 声调谱拾遗: 清诗话. 上海: 上海古籍出版社, 1978
[10] 清江永. 音学辨微. 台北: 广文书局, 中华民国五十五年一月初版
[11] 王力. 诗词格律概要. 北京: 北京出版社, 1979
[12] 刘福元、杨新我. 古代诗词常识. 石家庄: 河北人民出版社, 1980
[13] 李葆瑞. 诗词语言的艺术. 长春: 吉林人民出版社, 1981
[14] 王力. 汉语诗律学(增订本). 上海: 上海教育出版社, 1982
[15] 姜书阁. 诗学广论. 北京: 中国社会出版社, 1982
[16] 遍照金刚著, 王利器校注. 文镜秘府论校注. 北京: 中国社会科学出版社, 1983
[17] [日]泽田总清原. 中国韵文史(上、下册). 上海: 上海书店, 1984
[18] 张谷编. 王力诗论. 南宁: 广西人民出版社, 1988
[19] 蒋绍愚. 唐诗语言研究. 郑州: 中州古籍出版社, 1990
[20] 徐志刚编著. 诗词韵律. 济南: 济南出版社, 1992
[21] 陈伯海. 唐诗学引论. 上海: 东方出版中心, 1996
[22] 张伯伟. 全唐五代诗格校考. 西安: 陕西人民教育出版社, 1996
[23] 吴小平. 中古五言诗研究. 南京: 江苏古籍出版社, 1998
[24] 吴相洲. 唐代歌诗与诗歌. 北京: 北京大学出版社, 1999

38
[25] 启功. 诗文声律论稿. 北京: 中华书局, 2000
[26] 杨仲义、梁葆莉. 汉语诗体学. 北京: 学苑出版社, 2000
[27] 夏援道. 诗词曲声律浅说. 武汉: 湖北教育出版社, 2000
[28] 李浩. 唐诗的美学阐释. 合肥: 安徽大学出版社, 2000
[29] 王德明. 中国古代诗歌句法理论的发展. 桂林: 广西师范大学出版社, 2000
[30] 涂宗涛. 诗词曲格律纲要. 天津: 天津人民出版社, 2001
[31] 张福庆. 唐诗美学探索. 北京: 华文出版社, 2000
[32] 郭绍虞. 郭绍虞说文论. 上海: 上海古籍出版社, 2000
[33] 王锺陵主编. 诗词曲论卷. 石家庄: 河北教育出版社, 2001
[34] 罗时进. 唐诗演进论. 南京: 江苏古籍出版社, 2001
[35] 陶敏、李一飞. 隋唐五代文学史料学. 北京: 中华书局, 2001
[36] 朱承平. 诗词格律教程. 广州: 暨南大学出版社, 2001
[37] 刘勰著, 范文澜注. 文心雕龙注. 北京: 人民文学出版社, 2001
[38] 袁行霈. 中国诗歌艺术研究(增订本). 北京: 北京大学出版社, 2002
[39] 吴相洲. 唐诗十三论. 北京: 学苑出版社, 2002
[40] 黄天骥. 诗词创作发凡. 广州: 广东人民出版社, 2003
[41] Martin Samuel E. The phonemes of Ancinent Chinese. Supplement of the Journal of
the American Oriental Society, 1953: 73
[42] N·C· Bodman, A linguistic Study of Shih-ming, 1954
[43] R·Shafer, Bibliography of Sino-Tibetan Languages Ⅱ, 1963
[44] Chang. K and Betty Shefts Chang, The Proto-Chinese final system and the Ch’ieh-yun,
Academia Sinica, IHP Monographsser A. Taipei:Academia Sinica, Institute of History
and Philology, 1972(26)
[45] Chang. K, Ancien Chinese phonology and the Ch’ieh-yun, The Tsing Hua Journal of
Asiatic Studies, New Series, 1974, 10:61-82
[46] Chao Yuanren, A Grammar of spoken Chinese, California Berkeley University of
Califorlia Press, 1988

39
[47] Lanham, R. G. The electronic word: Democracy, technology, and the arts. Chicago:
University of Chicago Press, 1993
[48] Warschauer, M. Computer-assisted language learning: an introduction. In: Fotos, S.
(Ed. ), Multimedia. Language Teaching. Logos, Tokyo, 1996: 3-20
[49] Floyd Dickman, Maples in the Mist: Children's Poems from the Tang Dynasty, Book
Links. Chicago: Jan 1999, 8(3): 23
[50] Paul W Kroll, Studies in Chinese Poetry, Journal of the American Oriental Society.
New Haven: Jan-Mar 2000, 120(1): 157
[51] JI TAO, New approach to old Chinese poems, China Daily staff. China Daily (North
American ed. ). New York, N. Y. : Apr 16, 2001: 9
[52] Margaret A Chang, A Thousand Peaks: Poems from China, School Library Journal.
New York: Feb 2002, 48(2): 147
[53] J Shreve, Poems of the masters: China's classic anthology of T'ang and Sund dynasty
verse, Choice. Middletown: Jul/Aug 2004, 41(11/12): 2040
[54] Allen Gimbel, LONG: Poems from Tang; Rhyme of Taigu; Da Qu; Future of Fire,
American Record Guide. Washington: Mar/Apr 2005, 68(2): 126

40
附录 1 攻读学位期间发表论文目录

[1] 廖继莉. 中文超大字符集输入法的研究和开发. 语言研究, 2002. 11(增刊)


[2] 廖继莉. 娄底方言中的 BA 式形容词. 语言研究, 2003. 12(增刊)

41

You might also like