越南汉语学习者汉字语料库建设及习得状况分析

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 27

中文教学现代化学报 The Journal of Modernization of Chinese Language Education JMCLE

越南汉语学习者汉字语料库建设及习得状况分析
Le Thi Thanh Truc (黎氏清竹)
鲁东大学 国际教育学院 264025
2364491418@qq.com
摘要:越南汉语学习者在学习汉语中存在着不少问题,其中较为突出的就是汉字问题。对于大多
数的学生来说,学习汉语的时候都认为汉字是最难的一个部分,汉字是一幅画,是几条线的结合
等,有的学生学习汉语直接放弃了汉字。另外,学生写错、认错汉字是常见的现象,汉字偏误类
型与原因也非常复杂。出现这种情况,一方面是因为汉字本身的结构跟越南的拉丁字母大不相同,
另一方面是在越南汉字教学还没有得到足够的重视。除了一些正规的大学在初级综合课中有部分
汉字教学以外,没有单独开设“汉字课”的学校。而且,目前关于越南学习者汉字习得状况的研
究不充分。基于以上原因,本文将建设一个 30 万字左右的越南学习者汉字语料库,并且在语料
库的基础上结合中介语理论、心理学相关理论、第二语言习得相关理论重点进行越南学习者汉字
习得分析。
关键词:越南学习者;语料库;汉字习得;偏误分析
Vietnamese Learners' Chinese Characters Corpus Construction and Acquisition
Circumstance Analysis
Le Thi Thanh Truc
Ludong University International Education Institute, 264025
Abstract:Vietnamese Chinese learners have many problems in learning Chinese, and the most
prominent one is the Chinese character problem. For most students, when learning Chinese, Chinese
characters are considered to be the most difficult part. Chinese characters are a painting, a combination
of several lines, etc. Some students learn Chinese but directly give up Chinese characters. In addition,
it is a common phenomenon for students to write mistakes and recognize Chinese characters. The
types and causes of Chinese characters are also very complicated. On the one hand, this is because
the structure of the Chinese character itself is very different from the Latin alphabet of Vietnam. On
the other hand, the teaching of Chinese characters in Vietnam has not received enough attention.
Except for some formal universities that have some Chinese characters in the primary comprehensive
course, there is no separate school for Chinese characters. Moreover, the current research on the
status of Chinese learners in Vietnamese learners is not sufficient. Based on the above reasons, this
paper will build a 300,000 Vietnamese learner corpus corpus, and based on the corpus, combined
with the theory of interlanguage, psychology related theory, second language acquisition related theory,
the Vietnamese learners' Chinese character acquisition analysis .
Key words: Vietnamese learners, corpus, Chinese character acquisition, analysis of errors.

1 引言
语言文字是文化元素中最基本的部分,是文化的依托。世界上,各种文化的交流都离不开语
言。如果说,英语是大部分西方人的一种交流工具,那么汉语就是东方人的根基。近年来,第二
语言学习的需求蓬勃发展,因此二语学习与教学越来越受到重视,汉语也不例外。随着时代的变
化,社会需求的增长,在越南学习汉语也渐渐升温,汉语如今已成为越南第二大流行外语。
作为一名学习者,在学习汉字的过程当中本人自身曾经遇到了很多困难。作为一名有两年汉
语教学经验的教师,本人发现越南学习者也有同样的问题。因为,越南是非汉字圈的国家之一,
习惯使用拉丁字母。对越南学习者来说,汉字就是不知头尾的一幅画儿,难认、难学,造成很多
汉语学习者汉字习得状况不佳的状况。但是目前关于越南学习者汉字习得状况研究不多,因此,

JMCLE Vol.8 No.1 June. 2019 PP.76-102 ©Association for Modernization of Chinese Language Education
~76~
中文教学现代化学报 The Journal of Modernization of Chinese Language Education JMCLE

作为一名在校研究生,本人开始认真探讨该问题。

2 越南汉语学习者汉字语料库建设
2.1 语料来源
本论文搜集胡志明市孙德胜大学从一年级到四年级本科生以及商业华语中心综合一班到八班
学习者的手写作业。分为两次搜集,第一次从 2017 年 9 月到 2018 年 9 月;由于语料不平衡的原
因,2018 年 9 月暂停搜集,2018 年 10 月到 2019 年 2 月继续第二次搜集。
2.2 语料信息
输入语料的过程当中必须要把语料的各种信息明确标注。输入语料信息基本如下:
00001SDSU/201707[杜氏容 YN/4.1/F/000000]00000000/ZYZW/0000
其中 00001:序号
SDSU:学校
201707:学年
杜氏容:学生姓名
YN:国籍
4.1:学生班级
F:性别(F:女,M:男)
000000:出生日期
00000000:写作日期
ZYZW:语料种类(作业作文)
0000:作文题目
2.3 语料标注说明
语料从字的角度,对所收入的造句语料和作文语料中存在的越南学习者使用汉语的中介语偏
误进行标注。该标注方式及相应的辅助软件采用£££教授课题“多维参照的国别化汉语中介语语
料库库群构建与研究”相同的方法。具体如下:
[Y] 异体字 正确的字[Y 异体字]
[C] 错字 [C 错误的字]
[B] 别字 正确的字[B 别字]
[G] 不规范的字 正确的字[G 不规范的字]
[L] 漏字 [L 缺少的字]
字 [D] 多字 [D 多余的字]
[F] 繁体字 正确的字[F 繁体字]
[P] 拼音字 汉字[P 拼音]
[#] 无法识别的字 [# 无法识别的字]
[C]:错字标记,用于标示考生写的不成字的字。用[C]代表错字,在[C]前填写正确的字。

例如:积极[C](“极”是错 字)。
[B]:别字标记,用于标识把甲字写成乙字的情况。别字包括同音的、不同音而只是形似的、
既不同音也不形似但成字的等等。把别字移至[B]中 B 的后面,并在[B]前填写正确的字。
例如:确[B 却]认、考虑[B 虎]。

JMCLE Vol.8 No.1 June. 2019 PP.76-102 ©Association for Modernization of Chinese Language Education
~77~
中文教学现代化学报 The Journal of Modernization of Chinese Language Education JMCLE

[L]:漏字标记,用于标示作文中应有而没有的字。用[L]表示漏掉的字,并在[L]前填写所
漏掉的字。
例如:个[L](表示“个”在原文中是漏掉的字。)
[D]:多字标记,用于标示作文中不应出现而出现的字。把多余的字移至[D]中 D 的后面。
例如:我[D 我],表示括号中的“我”是多余的字(原文中写了两个“我”)。

[F]:繁体字标记,用于标示繁体字。把繁体字移至[F]中 F 的后面,并在[F]前填写简体字。
例如:里[F 裡[C]]

繁体字标记标示的是使用正确的繁体字,如果该繁体字同时又是别字,则先标繁体字标记,
再标别字标记。例如:俭朴[F 樸[B 僕]]
繁体字写错了,标为:后[F 後[C]]。
[Y]:异体字标记,用于标示异体字。把异体字移至[Y]中 Y 的后面,并在[Y]前填写简体字。
例如:偏[Y 徧]
[P] :拼音字标记,用于标示以汉语拼音代替汉字的情况。把拼音字移至[P]中 P 的后面,并
在[P]前填写简体字。
例如:尊[Pzūn]重[Pzhòng] 。

[G]:不规范的字
例如:上[G 短横不应该出头]
[#]:无法识别的字的标记,用于标示无法识别的字。每个不可识别的字用一个[#]表示。
例如:更[#][#]保存自己的生命。
2.4 语料加工流程
越南汉语学习者汉字语料库建设是本文最重要的一部分。为了使研究结果准确、可靠,语料
库建设过程中必须要非常仔细,尽量减少差错。以下是语料加工流程的基本步骤:
2.4.1 搜集材料
本文从越南胡志明市孙德胜大学和商业华语中心随机搜集一年级到四年级的学习者汉字书写。
搜集的汉字书写材料包括学生的作业(造句、翻译、回答问题、听写作业等)、HSK 模拟考试题、
自由写作短文等。汉字书写材料要有学生的姓名、所在学校和学习年级,搜集的过程中把全部材
料都拍下来,照片要清晰,以利于输入、标注与保存。
2.4.2 输入、标注语料
语料拍照后,进行语料手工输入。按学习者照片上的汉字书写一个字一个字地输入到电脑里
面。这个输入的过程费很多功夫,而且还容易把学生正确的字输入成错字或将错字输入为正字。
输入正字不用标注,而如果是错字要按照标注规则进行分类与偏误标注。输入与标注完成后,进
行校对。根据每一种偏误类型的特征进行截图以便于本文统计分析过程有明确、可靠的例证。一
般的错误都比较容易分类与标注,但是也有一些错误很难区分是哪一种偏误类型。在这些情况下,
本文会贴近学生的真实水平与真实语料来判断和标注偏误。例如:

:一般来说可以将“家”标注为:学[B 家](形近别字)

因为形状比较相近;也可以标为:学[B 家](任意别字)
。但是,如果按照原文,可以看见“家”
之前是“国”
,有可能学习者无意识中依据自己的习惯犯错,受“国家”一词影响,写完“国”后
接着写出“家”。而不是跟“学”字发生形近字混淆。因此,本文里面标注是:学[B 家](任意别

JMCLE Vol.8 No.1 June. 2019 PP.76-102 ©Association for Modernization of Chinese Language Education
~78~
中文教学现代化学报 The Journal of Modernization of Chinese Language Education JMCLE

字)

:可以标为别字:听[B 叻](形近别字)
,但是考虑到学生的真实水平,
“叻”
这个字在初级教材里面完全没有出现过,因此本文偏误标注过程把这个字标为错字:听[C]。

:如果只考虑“在”这个字,可以标为别字:在[B 右],又可以标为
不规范字:在[G](整字不规范)。不过,要是贴近语料根据真实原文,最大的可能性是学生把“在”
写得不规范,因此本文标为:在[G](整字不规范) 。

:在这种情况,
“题”字可以标为别字:题[B 是](形近别字)
,也可以标为
错字:题[C](部件删减)
。但是,根据原文,最大的可能性就是学生写“问题”这个词的过程中,
把“题”字右边的页字忘掉,因此本文标为:题[C](部件删减)。

:从字的本身来看没有什么错误,这种情况是词中的两个字颠倒了, “积极”写成
“极积” ,也可以标为别字:极[B 积]积[B 极](音近别字)
。不过,考虑到“积极”是一个词,记
这个词的时候,两个字发生了颠倒,因此不把它认为是错字而是词错,是临近字互相混淆。
2.4.3 保存语料
语料搜集、整理、输入与标注后要仔细地命名和保存,包括输入语料和拍下的照片。语料的
照片要跟已输入完的语料核对,统一命名和保存,否则会发生重复、丢失语料等问题。
2.5 语料库建设中的问题及解决方案
从 2017 年 9 月开始到现在,在搜集语料与建设语料的过程当中遇到了不少问题。为达到 30
万字的语料以及使各年级之间的语料相对平衡,本人将搜集过程分成两次,最长的一次时间是一
年多。语料的字数较多,因此经常出现混淆的问题,影响到输入语料与保存学生作业照片。虽然
如此,经过一年半的时间仔细输入与标注,越南汉语学习者汉字语料库已圆满完成,为接下来的
汉字偏误分析以及汉字习得状况分析创造了良好的前提。

3 越南学习者汉字语料库偏误统计分析
3.1 越南汉语学习者汉字书写偏误统计及分类
3.1.1 越南汉语学习者汉字书写偏误整体统计与类型
通过搜集越南胡志明市孙德胜大学和商业华语中心学生作业,按照语料汉字偏误标注,本文
进行全面统计。经过统计错字[C]平均错误率为 30%,别字[B]平均错误率为 15%,不规范字[G]
平均错误率为 43%,错字[C]平均错误率为,漏字[L]平均错误率为 4%,拼音字[P]平均错误率为
5%,多字[D]平均错误率为 0%,繁体字[F]平均错误率为 2%,无法识别字[#]平均错误率为 0%。

图 1 越南汉语学习者汉字书写偏误类型整体统计
根据图 3.1,越南学习者整体汉字错误率最高的是不规范字,其次是错字、别字。多字和无

JMCLE Vol.8 No.1 June. 2019 PP.76-102 ©Association for Modernization of Chinese Language Education
~79~
中文教学现代化学报 The Journal of Modernization of Chinese Language Education JMCLE

法认别字虽然也有但是错误率最低,基本不构成规律性偏误。
3.1.1.1 不规范字
不规范字指的是学生书写汉字不规范,包括笔画变形、草字笔画、笔画之间的关系掌握不当
以及字的整体不规范等。
(1)笔画变形
因为学习者没有掌握好笔画的本质或者写得“不到位”,容易出现笔画变形的问题。如下图:
表 1 越南学习者笔画变形正字错字表
正字 错字

笔画变形是最常见的一种不规范字。有的时候笔画只要长一点或者短一点也会造成错误,尤
其是在最初级的阶段,学习者还没有对笔画完全地了解。“那”字左边的部件和月字旁的几个横笔
经常随着学习者的心情而变化,该出头的不出头,不该出头的偏偏要出头。有些情况,笔画写得
不到位或者笔画一出头就变成了另外一个部件,比如:“刀”和“力”。
(2)草字笔画
学习者写汉字的过程当中有时候写得太快,或者模仿草字而产生了偏误。有的学习者为了好
看或为了方便故意而为,如下表:
表 2 越南学习者草字笔画正字错字表
正字 错字

JMCLE Vol.8 No.1 June. 2019 PP.76-102 ©Association for Modernization of Chinese Language Education
~80~
中文教学现代化学报 The Journal of Modernization of Chinese Language Education JMCLE

这种偏误初级阶段很少见,主要发生在学习的中高级阶段。由上表我们可以看到,学生连笔
书写形成了习惯。草字笔画虽然顺手,字写出来很有风味,但是跟正字有的时候差别太大,例如:

一般的学生是完全认不出来“忄字旁”的; ,或者直接替代,删减笔画,例

如: (辶字旁没有点,文字旁点写成横)
, (灬字旁写成一横)等。草字笔画有利于

学生汉字书写美术性和创造性,但不利于汉字习得。
(3)笔画关系掌握不当
这样的错误主要是因为学习者没有把握好笔画之间的不同点,误认了笔画之间的“相切”和
“相交”的关系。
表 3 越南学习者笔画关系掌握不当正字错字表
正字 错字

JMCLE Vol.8 No.1 June. 2019 PP.76-102 ©Association for Modernization of Chinese Language Education
~81~
中文教学现代化学报 The Journal of Modernization of Chinese Language Education JMCLE

可以说,这种错误是比较危险的。因为如果学习者没有真正了解和辨认笔画之间的关系,就
一直这么写,以后很可能变成化石化的错误。按照越南学习者的书写习惯,这些字 (竖弯

钩写成竖弯)
, (更字第一横写成撇)
, (子字旁横写成撇)等跟正字差不多,是可以接

的。如果老师不及时引导他们明确分析汉字笔画之间的关系,他们完全不知道自己写的字不规
范。再如:“常”字: ,从中国人的认知角度来看,如果把学字头写成党字头或党字头写

成学字头,都算是错字。但是,考虑到越南学习者的实际情况,他们总体上对这个汉字有了大体
的认知,只是一个部件出现局部的问题,而这个问题存在的原因出自于越南学习者的母语是拼音
文字,对他们来说,学字头和堂字头是差不多的。因此,在这种情况,本文把这些偏误归类于不
规范字。
(4)整字不规范
学习者汉字书写时,有的是整个字看起来很不顺眼,有的是部件之间离得太远、误认上下结
构与左右结构等。
表 4 越南学习者整字不规范正字错字表
正字 错字

JMCLE Vol.8 No.1 June. 2019 PP.76-102 ©Association for Modernization of Chinese Language Education
~82~
中文教学现代化学报 The Journal of Modernization of Chinese Language Education JMCLE

这种错误大部分出现在初级阶段学习者中。该阶段,他们对汉字笔画顺序与整体结构还没完
全把握,字虽然没有错误,但看起来很别扭。
包括以上的各种类型,在错误统计的系统中,不规范字的比例占比 43%。这个比例值得深入
思考,进一步研究这种情况出现的各种原因。
3.1.1.2 错字
错字指的是学习者汉字书写出现了错误,包括笔画错误、部件错误以及字的错误。在笔画错
误这一部分可以分成笔画增加与笔画减少两个小部分。部件错误的这一部分也分成两个小部分部
件增减与部件替换。字的错误还可以分为综合错误与整字错误。
(1)笔画增删
(a)笔画增加
学习者在汉字书写的过程当中,由于各种原因在正确的汉字上多加一个或者几个笔画。如:
表 5 越南学习者笔画增加正字错字表
正字 错字

JMCLE Vol.8 No.1 June. 2019 PP.76-102 ©Association for Modernization of Chinese Language Education
~83~
中文教学现代化学报 The Journal of Modernization of Chinese Language Education JMCLE

(b)笔画删减
删减某些笔画的现象是一种频率较高的错字偏误。出自于对汉字的记忆不牢固,或对汉字字
形的认识不清晰,学习者往往容易删减一些笔画。比如删掉“横”“撇”
“点”等。有时,在一个
字里面缺少一个或者两三个笔画。如:
表 6 越南学习者笔画删减正字错字表
正字 错字

(2)部件替、增、删
(a)部件增删
部件增减指的是在书写时,学习者增加或者减少一个或几个部件。如:
表 7 越南学习者部件增删正字错字表
正字 错字

JMCLE Vol.8 No.1 June. 2019 PP.76-102 ©Association for Modernization of Chinese Language Education
~84~
中文教学现代化学报 The Journal of Modernization of Chinese Language Education JMCLE

(b)部件替换
部件替换的错字偏误在越南学习者学习过程中也很普遍。由于字形相近,没有把握好每一部
件的意义,学习者容易把甲部件当成乙部件来使用。如:
表 8 越南学习者部件增删正字错字表
正字 错字

JMCLE Vol.8 No.1 June. 2019 PP.76-102 ©Association for Modernization of Chinese Language Education
~85~
中文教学现代化学报 The Journal of Modernization of Chinese Language Education JMCLE

(3)整字错误
(a)混合错误
这种错误类型是笔画错误和部件错误的混合。没有规律性是这种错误的特点。学习者随心添
加、减少、替换汉字里的笔画与部件。如:
表 9 越南学习者混合错误正字错字表
正字 错字

从上表可以看出这种偏误大部分都是笔画和部件的混合错误。除了这样,最后的例如比较特
别。
这个字不仅有部件替代,把“也”写成“亻”
,同时又出现镜像错误,颠倒两个部件的位
置。
(b)整字模糊
除了混合错误,整字模糊也是一种没有规律性的错误。整字模糊指的是学习者汉字书写整个

JMCLE Vol.8 No.1 June. 2019 PP.76-102 ©Association for Modernization of Chinese Language Education
~86~
中文教学现代化学报 The Journal of Modernization of Chinese Language Education JMCLE

字都不准确。如果没有临近字就很难确定是什么字。大部分出自于学习者没有形成正确的笔画、
部件意识,将汉字作为图画来画出。如:
表 10 越南学习者整字模糊正字错字表
正字 错字

大部分不成字的字,学习者顺手画了几笔,或者涂抹后让错字有的时候看起来不像正字,比

如 ,完全认不出来这是“懂”字。
3.1.1.3 别字
别字是指学习者汉字书写过程当中把甲字写成乙字。在偏误类型统计中占比例是 15%,别字
类型可以分为形近别字、音近别字和任意别字。
(1)形近别字
对越南学习者来说,形近字系统是学习汉字的主要障碍。有时,学习者分不清笔画之间、部
件之间甚至字与字之间的异同点,因此,形近字成为学习者学习的难点。比如,把“考虑”的“虑”
写成“虎” ,
“喜欢”的“欢”写成“饮” ,“饭店”的“店”写成“厅” ,
“生活”的“活”写成“话”

“一切”的“切”写成“动” ,
“己”“已”“巳”不分等。
(2)音近别字
在汉语里面,同音字、近音字非常丰富。一个音可能有几个汉字可以代表,因此音近别字是
常见的现象。比如,学习者把“确认”的“确”写成“却” ,
“历史”的“史”写成“使” ,
“封建”
的“封”写成“风” ,“老师”的“师”写成“是” ,的”
“得” “地”不分等。
另外,有一种特别情况就是汉字既是形近字,也是同音字,学习者很容易混淆。比如“那”
“哪” “娜” ,“住”
“主” “注”等。

JMCLE Vol.8 No.1 June. 2019 PP.76-102 ©Association for Modernization of Chinese Language Education
~87~
中文教学现代化学报 The Journal of Modernization of Chinese Language Education JMCLE

(3)任意别字
这种情况比较特别,或许出自于学习者的一时疏忽,或许有其他原因,学习者把一个字写成
另一个不相干的字,造成任意性别字。比如: “吗”写成“忙”;
“吗”写成“好”
;“是”写成“男”
等。
3.1.1.4 拼音字
拼音字在偏误统计里平均错误率为 5%。学习者在完全不记得汉字的情况下写出拼音来代替汉
字。越南学习者习惯用拉丁字母,很容易依赖于拼音。学习一个字的时候只记得拼音、意义和用
法,学习写汉字是最后一步。尤其是在“多认” ,
“少写”的教学模式下,学习者更容易把拼音作
为学习的重要辅助手段,忽略了学习写汉字。这对汉字书写有很大的影响。
3.1.1.5 漏字
漏字指的是学习者在汉字书写过程写漏了一个或者几个字。在偏误类型统计里面,漏字出现
的比例是 5%。例如:
漏“个”字

漏“果”字

漏“儿”字

漏“欢”字

漏“他”字

漏“是”字

在初级阶段常最见的漏字是漏量词和“是”字。有的时候由于太过紧张或不注意,学习者忘
写一个字,也有时候不记得那个汉字怎么写所以留空,比如“喜欢”只写“喜”没写“欢” ,
“他
们”只写“们”没写“他”等。
3.1.1.6 繁体字
在越南,汉语学习者情况比较复杂,他们的年龄不一,基础不同,习惯相异。汉语教学机构
也不同。各所大学里注重教简体字,但也有一些培训中心教繁体字或者“繁简结合” 。另外,一些
台湾国际学校也教繁体字。越南的一部分华人学习汉语的时候对繁体字很感兴趣,因此除了简体
字,他们还学习了繁体字。在混合学习繁体字和简体字的情况下,很容易造成汉字书写错误。偏
误统计表明,繁体字比例占 4%,里面有的繁体字是错字或者别字。比如:

[C] [C]“里”本来的繁体字是“裡”


, 学习者明显混淆“舞”与“無”
之间,但是“無”字有是“无”的繁体字。
3.1.1.7 多字

JMCLE Vol.8 No.1 June. 2019 PP.76-102 ©Association for Modernization of Chinese Language Education
~88~
中文教学现代化学报 The Journal of Modernization of Chinese Language Education JMCLE

多字指的是学习者汉字书写时一个字连续写了两次。统计结果显示,有 51 次出现多字,不过
这个数字对于总数来说特别少,几乎可以忽略不计。
3.1.1.8 无法识别字
无法识别字指的是学习者写出的汉字完全无法辨认、识别,共出现 53 次,是出现最少的偏误
类型。
3.1.2 心理学角度对越南学习者汉字书写偏误的分类
在输入、标注语料的过程中,笔者发现越南学习者的汉字偏误有其心理学背景。下面以认知
心理学与行为主义心理学为依据将越南学习者汉字典型偏误分为汉字认知偏误与汉字行为偏误两
大类。
3.1.2.1 汉字认知偏误
认知心理学:是一种心理学思潮,它研究人的高级心理过程,主要是认知过程,如注意、知
觉、表象、记忆、思维和言语等。纽厄尔(Alan Newell,1927)和西蒙(Herbert Alexander simon,1916)
认为: “人脑的信息加工系统是由感受器(receptor) 、反应器(effector)
、记忆(memory)和处理
器(或控制系统) (processor)四部分组成。首先,环境向感觉系统即感受器输入信息,感受器对
信息进行转换;转换后的信息在进入长时记忆之前,要经过控制系统进行符号重构,辨别和比较;
记忆系统贮存着可供提取的符号结构;最后,反应器对外界作出反应。 ” 在本论文里面提到的是
语言认知心理学。越南学习者汉字的典型偏误有些部分是由认知心理而引起的。
认知就是信息加工,包括感觉输入的编码、贮存和提取的全过程。本文通过观察汉字输入、
输出情况,把汉字认知偏误分为知错而错与不知错而错。
(1)知错而错
在输入过程中,学习者接受的是正确的信息,但是,信息加工过程出现了问题,所以输出时
提取出来的不是正确的汉字。这种情况跟学习者汉字记忆有着密切的关系。学习者本身也意识到
自己的错误或者不确定是否正确,但提取不出正确的字形,只好将错就错。前文提取的数据中绝
大部分部件错误或整字错误都属于知错而错。例如:

,正字“妈”
,学习者记不清“妈”由哪些部件组成,因此在书写时会犹豫,最后将女
和口两个可能的部件都写出来,造成部件增加的偏误。再如: ,正字“聪”
; :正

字“敢”; :正字“懂”
。学习者明显可以记住字的总体形状,但是笔画或部件很模糊,因此
明知不正确依然乱写、草写,出现了知错而错的问题。
越南学习者汉字偏误中还有一种特殊情况就是混淆词中的两个字,例如:积极写成“极积”

外婆写成“婆外”等。学习者不知道两个字哪个在前,哪个在后,只好凭自己的记忆书写,结果
出现偏误。漏字多数情况下也属于上述情况。学习者想不起来那个汉字怎么写,所以才留出空,
希望再次回忆确认,最后实在想不起来,只好漏字。另外,拼音字与无法识别字明显都是知错而
错。这种错误的特点就是学习者已经或大概意识到自己的错误,但无法自主改正。这类错误可以
通过继续学习加以改善,对学习汉字没有太大的障碍。
(2)不知错而错
汉字输入过程中输入的是正确的信息,但是加工过程出现错误,学习者接收到的是加工后的
错误信息,因此提取出来的汉字信息也是错误的。学习者在无意识的状态下造成错误或者没有意
识到自己的错误,因此称之为不知错而错。大部分不规范字属于不知错而错的类型。

例如: ,正字“雪”
(雨字旁不规范)
; ,正字“看”
(手字旁不规

范)
; ,正字“电”
(折笔不规范)
; ,正字“常”
(堂字头不规范)

JMCLE Vol.8 No.1 June. 2019 PP.76-102 ©Association for Modernization of Chinese Language Education
~89~
中文教学现代化学报 The Journal of Modernization of Chinese Language Education JMCLE

学习者写出来的大部分不规范字看起来似乎没有大的错误,但是严格讲这些字都不合格,最
主要的是反映出学习者认知过程的问题。学习者对自己出现的问题不经提示就意识不到,因此如
果无人加以纠正,很多学习者的不知错而错会伴随终身。
另外别字、多字等也有部分属于不知错而错。
3.1.2.2 汉字行为错误
“行为主义心理学(behavioral psychology)是美国现代心理学的主要流派之一,也是对西方
心理学影响最大的流派之一,其创始人是美国的心理学家华生。行为主义心理学主张以客观的方
法研究人类的行为,从而预测和控制有机体的行为。它可区分为古典行为主义学派和新行为主义
学派。古典行为主义的代表人物以华生为首,其次则有霍尔特、亨特、拉什里和魏斯。新行为主
义的主要代表则为托尔曼、赫尔、斯金纳、班杜拉等。 ” 就汉字偏误而言,如果忽略学习者的主
体性,主要考虑汉字书写行为的客观表现失当问题,就称之为汉字行为错误。按照汉字书写错误
出现的次数,我们将之分为一次性错误和多次性错误。按照学习对象的多寡可分为个体性错误和
整体性错误。而从偏误总体上来看,一次性错误和个体性错误属于偶发性错误,多次性错误和整
体性错误属于规律性错误。
(1)规律性错误
一种汉字错误多次出现(多次性错误)或者很多学习者出现同样一种汉字错误(整体性错误)
都称为规律性错误。
(a)多次性错误
一位学习者有时会多次出现一种汉字错误。这种多次性错误如果在初级阶段出现比较正常,
随着学习时间延长尚可纠正。如:

错字(笔画增加)
: ,正字为“买”
(多了一点)
,一共错了三次。

错字(整字错误) ,正字为“你”
(错在尔字旁)
,一共错
了五次。

错字(笔画错误) ,正字为“我”
(增减笔画)
:一共错了三次。
别字(形近别字)
,“给”写成“绍”
,一共别两次。
别字(形近别字)
:“共”写成“其”
,一共别两次。

不规范字(笔画变形)

(女字旁不规范)。这位学习者是四年级的学生,有女字旁的任何汉字他都写得不规范。可见,
错误已成为化石化的偏误,很难改正,这种偏误是汉字习得中最大的障碍。
大部分多次性错误,写错的汉字前后一致。但是也有同一个汉字出现的错误字形是不一样的。
如:

错字(整字错误): ,正字:“睡”:一共错两次。
别字(任意别字):“吗”写成“忙”
,“吗”写成“好”,一共别三次。
(b)整体性错误
整体性错误指的是,很多学习者出现了同样一个汉字错误。如:

不规范字(笔画变形)
: ,正字为“这”
(文字旁不规范)

JMCLE Vol.8 No.1 June. 2019 PP.76-102 ©Association for Modernization of Chinese Language Education
~90~
中文教学现代化学报 The Journal of Modernization of Chinese Language Education JMCLE

不规范字(笔画变形): ,同一个部件写得不
规范。
语料显示,很多学习者在初级阶段和中级阶段都出现了同样的错误。这种现象值得深思,是
不是越南汉字教学方法存在着某种问题,或者越南学习者在接受信息、加工信息的过程存在着某
些问题,导致不同学习阶段、不同学习者共同出现一种错误。这是很值得今后去深入挖掘探讨的
问题。
(2)偶发性错误
在书写过程当中,学习者犯了没有任何规律的汉字错误。这种错误占了很大的比例,可以分
为一次性错误和个体性错误。
(a)一次性错误
根据每个学习者错误行为的次数,这种错误一般只出现一次,不重复出现。多字错误比较典
型,学习者在没有注意的情况下多写了一个汉字,这种情况再也没有发生,可判定为一次性错误。
(b)个体性错误
个体性错误指的是同样是一个汉字写错,但每个学习者错误行为的性质与特点都不同。例如:

正字“忙”
,错字有很多不同字形:

正字“谁” ,错为 等。
个体性错误在初级阶段出现较多,因为初级阶段学习者尚未完全把握汉字书写规则、笔画顺
序和部件的意义,致使一个汉字会有各种各样的错误。
3.2 越南学习者汉字书写偏误典型特征及原因分析
3.2.1 越南学习者汉字偏误典型特征
根据第一节的统计,不规范字在偏误类型统计里面占的比例最高,达到 43%,其次是错字占
了 30%。这种现象很容易理解,因为越南学习者习惯了母语拼音文字的写法。最开始接触汉字的
时候,他们的反应是观察和模仿汉字的形状,不是去理解、掌握汉字字形的结构。有时他们会在
整个学习过程中保留这种汉字学习方法,导致了汉字化石化错误。如此可见,越南学习者汉字偏
误的基本特征是“画汉字” 。
“画汉字”错误根据越南学习者对汉字的笔画意识可以分成两类:笔
画随意代替和部分缺乏笔画意识。
3.2.1.1 笔画随意代替
因为对汉字的笔画知识掌握得不够正确,学习者的笔画之间出现了混淆现象,容易用甲笔画
代替乙笔画。这些错误第一眼看起来问题不大,因此学习者不容易发现自己的错误。如:
表 11 越南学习者汉字笔画随意代替
正字 错字

(子字旁横写成撇)

(最后一笔是横弯钩)

JMCLE Vol.8 No.1 June. 2019 PP.76-102 ©Association for Modernization of Chinese Language Education
~91~
中文教学现代化学报 The Journal of Modernization of Chinese Language Education JMCLE

(第一笔是竖笔)

(横弯钩写成横弯竖)

(提写成撇)

(提写成撇)

3.2.1.2 部分缺乏笔画意识
这种错误比笔画随意代替更为严重。学习者书写汉字过程中有一部分完全是画出来的。如:
表 12 越南学习者汉字书写部分缺乏笔画意识
正字 错字

JMCLE Vol.8 No.1 June. 2019 PP.76-102 ©Association for Modernization of Chinese Language Education
~92~
中文教学现代化学报 The Journal of Modernization of Chinese Language Education JMCLE

通过文献可以了解到, “画汉字”是非汉字圈国家学习者的汉字偏误特点。因此从初级阶段学
生开始接触汉字时,教师就应该有正确的汉字教学方法,音、形、义相结合,培养学生正确的笔
画和部件意识,可能会大幅度减少此类错误。
3.2.2 越南学习者汉字偏误典型特征原因分析
汉字的笔画繁多,据《现代汉语通用字表》统计,常用字笔画是 75290 笔,每个字的平均笔
画数为 10.75 笔,
而其中 9 笔到 11 笔的字最多。
多笔画使学习者对汉字的识记与提取产生了困难。
调查发现,笔画多的汉字,尤其是 10 画以上的,偏误出现的几率较高。因此,培养基本笔画意
识和正确认识笔画之间的关系,是学好汉字,减少汉字偏误的必要步骤。反之,基本笔画意识欠
缺、笔画之间结构意识薄弱,就成为多笔画字产生偏误的重要原因。
在越南现有汉语课中,大部分是先教词,然后要求学生学会词中出现的汉字。以词带字容易
使学生混淆临近字,造成别字较多的现象。
另外,如前所述,对越南学习者来说,汉字就像不知头尾的一幅画。如果教学过程中未将汉
字笔画、部件以及书写规则详细教给学生,学习者很容易随意“画字” 。因此应该从初级阶段开始
重视汉字特征,重视汉字的教与学。
小结:
越南学习者汉字偏误类型繁多,一般可以按照错字、别字、不规范字、多字、拼音字、漏字、
繁体字和无法识别字来归类。另外,本文还从心理学视角将越南学习者的汉字偏误分为汉字认知
偏误和汉字行为偏误两大类。认知偏误再分为知错而错和不知错而错;行为偏误分为规律性偏误
和偶发性偏误。同时强调,越南学习者汉字偏误的典型特征就是笔画随意代替以及部分缺乏笔画
意识。

4 越南汉语学习者汉字习得状况统计分析
最早区分学习与习得差别的是克拉申。一般认为,习得就是儿童通过交际过程大量接触语言,
然后自然地、不自觉地掌握母语,注重意义,不注重语言形式。掌握语言规律是无意识的,习得
过程由不自觉到自觉,多见于第一语言习得或儿童母语的习得;而学习指的是在学校环境中有意
识地掌握第二语言,注重语言形式,由自觉到不自觉,我们常说第二语言学习。但是,目前越来
越多的研究者使用第二语言习得这个术语。 第二语言习得的过程主要分为输入--接受/加工--输出
三个阶段。接受/加工信息这个过程在人的大脑里发生,如果没有实验证明,很难得出正确的结论。
因此,研究越南学习者汉字习得,本文只注重输入与输出这两个过程。
越南学习者以越南语作为母语,书写习惯不同于汉语。他们书写汉字出现的错误一方面反映
了不同语言书写习惯的不同,一方面也反映出汉字的特点。不管是暂时性还是顽固性的错误,都
有助于我们思考汉字及其教学问题。下面我们分四个年级来分析越南学习者汉字的使用情况。
4.1 越南汉语学习者汉字习得阶段分析
按照本文的第三章越南学习者汉字偏误类型统计,学习者基本的偏误分成八类:错字[C],
别字[B],不规范字[G],多字[D],漏字[L],拼音字[P],繁体字[F]和无法识别字[#]。越南学
习者阶段性偏误也根据这八种偏误类型进行统计分析。以下是分年级以后的偏误类型总表。
表 13 越南学习者偏误阶段性分析对照总表
汉语 偏误类型
水平 错字 别字 不规范 拼音字 多字 漏字 繁体字 无法识
字 别字
总计 3729 1842 5382 645 51 582 267 53
30% 15% 43% 5% 0% 5% 2% 0%

JMCLE Vol.8 No.1 June. 2019 PP.76-102 ©Association for Modernization of Chinese Language Education
~93~
中文教学现代化学报 The Journal of Modernization of Chinese Language Education JMCLE

一年 1359 456 1338 462 3 180 15 45


级 35% 12% 35% 12% 0% 5% 0% 1%
二年 1266 420 1218 33 21 192 9 0
级 40% 13% 39% 1% 1% 6% 0% 0%
三年 462 420 528 78 12 30 54 6
级 29% 27% 33% 5% 1% 2% 3% 0%
四年 642 546 2298 72 15 180 189 2
级 16% 14% 58% 2% 0% 5% 5% 0%
从上表,我们可以看见越南学习汉字各种偏误类型的分布极不平衡。虽然如此,四个阶段有
一个共同点,就是不规范字、错字、别字的比例明显高于其他偏误类型的比例,其中占比例最高
的是不规范字。占比例最小的是多字与无法识别字。以下是每个年级的具体偏误类型统计。

图 2 越南学习者一年级偏误类型统计
一年级学习者汉字偏误类型根据比例的顺序为:错字[C]与不规范字[G]占比最高,都为 35%;
其次为别字[B]与拼音字[P],都占 12%;再次是漏字[L]占 5%,占比例最少的偏误是无法识别字
[#]1%,多字[D]与繁体字[F]0%。

图 3 越南学习者二年级偏误类型统计
错字[C]是二年级学习者汉字偏误占比最高的类型,占 40%;其次是不规范字[G]39%,别字
[B]13%,漏字[L]占 6%,多字[D]1%,拼音字[P]占 1%,比例最少的偏误是无法识别字[#]0%与繁
体字[F]0%。

JMCLE Vol.8 No.1 June. 2019 PP.76-102 ©Association for Modernization of Chinese Language Education
~94~
中文教学现代化学报 The Journal of Modernization of Chinese Language Education JMCLE

图 4 越南学习者二年级偏误类型统计
三年级的学生汉字偏误不规范字[G]占比最高,为 33%;其次是错字[C]29%,别字[B]27%,
拼音字[P]占 5%,繁体字[F]3%,漏字[L]占 2%,多字[D]1%,比例最少的偏误是无法识别字[#]0%。

图 5 越南学习者二年级偏误类型统计
四年级的学生汉字偏误较为特别,不规范字[G]占比例最突出为 58%;错字[C]16%,别字
[B]14%,其他偏误比例分别为繁体字[F]5%,漏字[L]占 5%,拼音字[P]占 2%,多字[D]0%,无法
识别字[#]0%。
为了了解每个学习阶段的偏误情况,下面我们就把这些偏误情况进行逐项的对比分析。
4.2.1 错字的偏误情况

图 6 错字的偏误情况
从上图我们可以看出越南学习者错字偏误情况从一年级到二年级变化不大,比例略有减少。
这个阶段学习者刚刚经过了初步了解与接触汉字的阶段,开始掌握汉字的基本规律,因此错字缓
慢地减少。从二年级到三年级的这段时间,学习者基本上掌握了汉字笔画、部件等规则,能够更

JMCLE Vol.8 No.1 June. 2019 PP.76-102 ©Association for Modernization of Chinese Language Education
~95~
中文教学现代化学报 The Journal of Modernization of Chinese Language Education JMCLE

深入地了解汉字,因此这个阶段错字偏误明显地减少。四年级的错字偏误出现了反常的逆增长现
象,具体原因尚待研究,但从语料来看,四年级语料较长,可以看出以自由表达语料为主,学生
在关注书面表达的同时会部分忽略汉字书写问题,可能是造成四年级错字率比三年级更高的一个
原因。
语料输入过程中本人发现大部分一二年级的学生错字在于不完全掌握汉字笔顺以及各种笔画,
而三四年级的学生错字在于笔画和部件的替换,增减。如下图所示。

表 14 分年级错字类型
一、二年级 三、四年级

错字 正字 错字 正字

忙 槽

我 唯

朋 牺

你 奥

很 输

是 牲

从上表可以看到,一、二年级的学习者汉字笔画随意,错误没有规律性。而三、四年级学习
者已掌握汉字笔画,因此字形稳定,错误大部分属于笔画和部件的增、替、删。例如:笔画增加:

, ;笔画减少: , ;部件替换: , 。
另外,汉语高频字在一、二年级阶段经常出现错误,但是到了三、四年级,错误明显减少或
者不出现错误。如下表。
表 15 高频字抽样错字列表
错字 总次数 一年级 二年级 三年级 四年级
我 172 54 118 0 0

JMCLE Vol.8 No.1 June. 2019 PP.76-102 ©Association for Modernization of Chinese Language Education
~96~
中文教学现代化学报 The Journal of Modernization of Chinese Language Education JMCLE

是 85 81 4 0 0
的 66 22 38 6 0
跟 48 15 33 0 0
汉语中“我” “是”
“的”和“跟”都是高频字,几乎每一次书写学习者都会用到。从上表可
见,总体上错误集中在一、二年级,四年级对于这些字完全没有出现过错误,三年级除了“的”
字,其他的也没有错误。最需要留意的是,除了“是”字,其他字的错误次数在二年级高于一年
级阶段,这种情况是反常的。由此可见,越南学习者一、二年级的汉字习得都属于认识与模仿阶
段,三、四年级学习者才属于稳定加工与形成书写习惯阶段。
4.2.2 别字的偏误情况

图 7 别字的偏误情况
别字偏误情况在四个年级的比例比较平衡。汉语中存在着许多同音字、近音字和形近字,这
些情况在每个阶段都会遇到。学习者掌握字量更多的阶段,混淆的几率有时也会更高。根据本章
的第一节,越南学习者汉字字量统计表明,四年级的学习者字量最高,因此别字偏误的比例是最
高的。
另外,别字偏误在三、四年级阶段大部分都是形近别字或者音近别字,而一、二年级任意别
字出现得不少,例如:吗[B 忙];吗[B 好]。这说明在认识与模仿的一、二年级阶段,学习者对
汉字的认知还不够准确,汉字之间可以随意代替。而三、四年级阶段任意别字未出现。因此,虽
然从别字比例来看四个年级没有大的变化,但从别字类型上看,三、四年级阶段汉字习得状况明
显好于一、二年级阶段。
4.2.3 不规范字的偏误情况
在本文第三章偏误类型统计中,不规范字是占比最高的一种偏误,也是本人最在意的偏误类
型。

图 8 不规范字的偏误情况
从一年级到三年级,随着学生接受与了解汉字书写规则水平的提高,不规范字偏误比例逐渐
减少,三年级偏误比例最低。但是从三年级到四年级的这个阶段,偏误陡然增加到 3.5 倍,使四
年级成为四个年级中不规范字偏误比例最高的阶段。可以说,这些偏误有可能已经化石化了,因
此才随着学习者的字量增长而增加。四年级的学生要特别留意,因为严重的化石化错误会影响学

JMCLE Vol.8 No.1 June. 2019 PP.76-102 ©Association for Modernization of Chinese Language Education
~97~
中文教学现代化学报 The Journal of Modernization of Chinese Language Education JMCLE

习者的学习与应用整个过程。不规范字在四年级出现的比例较高,其中还有一个原因就是,在这
个阶段学生开始写草字。草字的模仿时候有不规范导致整个汉字不规范。
越南学习者不规范字类别繁多而且偏误规律性也不很明显。虽然如此,也有一些突出的偏误

点从一年级到四年级全程均有出现。例如:竖笔不规范(竖笔写成竖钩) , ;文字旁

不规范: ;
“那”左边的部件不规范: , ;辶字旁不规范: ;女字旁不规

范: ,具体如下:

表 16 越南学习者不规范字突出情况
不规范点 总次数 一年级 二年级 三年级 四年级
竖笔不规范 544 73 80 8 393
文字旁不规范 526 108 171 153 94
“那”左边的部件不规范 487 249 204 27 7
辶字旁不规范 376 12 42 5 323
女字旁不规范 91 39 3 6 43
造成不规范字的突出原因有的是笔画问题,有的是部件问题。需要格外关注的是,很多不规
范字不是出现在某一个阶段而是贯穿整个四年的学习过程。更为反常的是,除了“那”左边的部
件不规范随着学习者的水平提高而明显地减少,文字旁的不规范从一年级到二年级增加不少,到
了三、四年级慢慢减少外,女字旁、辶字旁和竖笔不规范四年级的错误次数高于其他阶段,尤其
是竖笔和辶字旁不规范,这两个不规范点主要集中在四年级。如果说三、四年级是稳定加工与形
成书写习惯的阶段,那么竖笔和辶字旁不规范有可能即将变成了化石化错误。这对于学习者汉字
习得来讲是非常不利的。
4.2.4 拼音字的偏误情况
越南语是一种拼音文字。对越南学习者来说,学习汉语最容易接受的是拼音,因此出现拼音
字偏误是可以理解的现象。

图 9 拼音字的偏误情况
从上图我们可以看出一年级阶段拼音字占的比例最高,明显高于其他阶段。发生这种情况是
因为,这是刚开始接触汉语的阶段,对学习者来说笔画、笔顺的知识很难接受,而拼音对他们来
说是接近汉语最简单的方式。因此,他们在书写过程中容易以拼音代替汉字,尤其是不记得汉字
的时候。从一年级到二年级,拼音字偏误大幅度减少。三年级阶段偏误比例有所上涨,再次下降。
虽然三四年级拼音字偏误超过二年级,但考虑到高年级自由表达的增加,这种现象尚在可理解范
围之内。

JMCLE Vol.8 No.1 June. 2019 PP.76-102 ©Association for Modernization of Chinese Language Education
~98~
中文教学现代化学报 The Journal of Modernization of Chinese Language Education JMCLE

4.2.5 漏字的偏误情况
漏字是偏误中比例较小的类型。如下图。

图 10 漏字的偏误情况
从上图我们可以看出,一年级、二年级以及四年级偏误比例相对平衡,唯独三年级的偏误比
例最低,而且低了差不多 4 倍。漏字偏误出现的原因主观性较强,具体原因尚待进一步研究。
4.2.6 繁体字的偏误情况
越南汉字教学跟其他国家不同,简化字和繁体字教学同时存在。很多越南学习者对繁体字非
常感兴趣。但是,繁体字与简化字两者共同使用常会出现错误。

图 11 繁体字的偏误情况
随着学习者水平的提高,字量的增长,使用繁体字相应地也有所增加。因此一、二年级使用
繁体字和繁体字偏误都较低,到了三、四年级,使用与偏误均大幅提高,特别是四年级的偏误比
例陡然升高。高年级学习者对繁体字的使用无可厚非,但繁体字笔画数量多,如果把握不准容易

引起错误、混淆,例如:学习者用繁体字写“里”字(里[F 裡]),将正字的“裡”写成了错字 ;
将“跳舞”的“舞”写成别字“無” (
“无”的繁体)等。如何在尝试繁体字和减少偏误之间找到
平衡,是汉字教学应该重视的问题。
4.2.7 多字与无法识别字的偏误情况

JMCLE Vol.8 No.1 June. 2019 PP.76-102 ©Association for Modernization of Chinese Language Education
~99~
中文教学现代化学报 The Journal of Modernization of Chinese Language Education JMCLE

图 12 多字与无法识别字的偏误情况
多字和无法识别字是偏误类型中比例最少的两种。多字偏误大部分是无意识偏误,因此比例
较不平衡,也没有一定的规律。最高的比例是二年级,而最低是一年级阶段。无法识别字是书写
过程中,学习者写出完全认不出来的汉字。偏误比例最高在一年级阶段,学习者刚接触汉字所以
乱写,乱增减、搭配,导致出现无法辨认的汉字。二年级阶段语料未出现这种偏误类型。三年级
与四年级的无法识别偏误比例较低。
4.2 越南汉语学习者汉字字量增长统计
字量(Character quantity ;Words the amount of)一般指的是在某一特定范围使用到汉字的
数量。在这里特定范围使用以每一学年为单位。经过不断地学习,学习者掌握的汉字数量也应不
断增长。如下图:

图 13 越南学习者汉字字量增长统计
从上图我们可以看出,学习者的字量是随着学习时间的延长不断增长的。从一年级到三年级
字量均衡增长。一年级比较重视汉字教学,所以一年级的字量提高比较快,二、三年级重点转移
到听力、口语的学习,所以字量增长比较缓慢。但是从三年级到四年级的这段时间,字量明显地
增长。这可能是因为,在这段时间,学习者已经具有了自学的能力。好学的学生通过自己的喜好
寻找增加词汇量的办法,因此,字量也随之增加,造成四年级的增长幅度跳高。
北语版《汉语水平词汇与汉字等级大纲》中规定,每个级别习得的字量为:甲级 800 字;乙
级 804 字;丙级 590 字(+11)
;丁级 670 字(+30)
。四个级别之间的字互相不重复。如果将每一
级别的字量都套叠计算,那么大纲中规定的字量与越南学习者汉字库中的字量对照如下:
表 17 字量增长对照
越南学习者汉字字量统计 汉语水平汉字等级大纲
一年级 670 800 甲级
二年级 731 1604 乙级
三年级 838 2194(+11) 丙级
四年级 1243 2864(+30) 丁级

JMCLE Vol.8 No.1 June. 2019 PP.76-102 ©Association for Modernization of Chinese Language Education
~100~
中文教学现代化学报 The Journal of Modernization of Chinese Language Education JMCLE

总计 1602 2905 总计
总体上来看,越南学习者四个年级的字量明显少于大纲规定字量。越南学习者四个年级的总
字量为 1602 字,与大纲的乙级字字量基本相同,与大纲总字量 2905 字相差很远。这说明越南学
习者四个年级汉字的掌握情况只相当于乙级字,粗略估计相当于在中国学习 2 年左右的学习者。
在字量的掌握上,越南学习者表现明显较弱,应引起足够的重视。

图 14 字量增长对照图表
从上图可以看出,一年级越南学习者掌握的字量最接近汉字大纲规定字量。到了二、三、四
年级学习者的字量跟汉字大纲对比差不多低 1 倍。到了四年级,越南学习者的字量还略低于汉字
大纲规定的二年级字量。可以说,如果按照汉语水平汉字大纲来分级别,越南学习者是完全达不
到要求的。这与越南汉语教学还没有共同或特定的教材,教学中也未考量选用教材是不是符合汉
字等级大纲的规定等有关。
小结:
越南学习者汉字习得可以分为两个阶段:认识与模仿(一、二年级)和,稳定加工与形成书
写习惯(三、四年级)。认识与模仿阶段出现一些高频字和整字错误,并且拼音字错误也是最高。
稳定加工与形成书写习惯阶段随着学习者汉字字量的增长,别字错误与繁体字也随之增加,同时
学习者的一些不规范字在这个阶段即将化石化,应特别留意。

5 结论
5.1 研究的不足
本论文在越南汉语学习者汉字语料库建设的基础上进行统计分析及研究。语料库的语料从越
南胡志明市孙德胜大学和商业华语中心两个地方随机搜集。这两个教学场所性质不一样,教材不
一样,学习对象也不一样,因此语料存在一定的不同质性。
另外,越南汉语学习者汉字语料库容量超过 30 万字,蕴含着丰富的信息,可以展开很多研究。
但由于本人研究经验不足,不能深挖与详细分析现有语料的所有内容,造成遗憾。
5.2 下一步的研究计划
本人会用更多的时间去积累研究经验,充分利用语料,更完美地完成“越南汉语学习者汉字
语料库建设及习得状况分析”这个题目,并且在学习者习得状况分析的基础上进一步提出相应的
教学策略。
另外,语料库还应搜集一年级到四年级的学习者汉字书写跟踪语料,进行越南汉语学习者汉
字习得个案研究,跟本论文已有的研究结果对比分析,以期将个性化汉字偏误与整体性汉字偏误
更好地区别开来,为加强越南汉字教学提供更为科学的佐证。

参考文献

JMCLE Vol.8 No.1 June. 2019 PP.76-102 ©Association for Modernization of Chinese Language Education
~101~
中文教学现代化学报 The Journal of Modernization of Chinese Language Education JMCLE

[1]白利莉,陈宝国.汉字习得的年龄对词类信息加工的影响[J].心理科学,2011(2)
[2]蔡玉梅.从汉字字形理论探究留学生汉字习得规律[J].时代经贸(下旬),2013(5)
[3]杜渊天庄.越南的汉字教学与汉字习得调查研究[C].北京语言大学硕士学位论文,2009
[4]郭圣林.汉字的笔画特点与外国学生汉字笔画偏误[J].暨南大学华文学院学报,2008(4)
[5]郝丽霞.留学生汉字习得过程研究述评[J].语文学刊(外语教育教学)
,2010(4)
[6]何小雪.外国学生汉字习得比较研究[J].兰州教育学院学报,2013(2)
[7]何欣潼.对外汉字教学研究综述[J].亚太教育,2016(31)
[8]胡宪丽.对外汉字教学序列模式与教学策略[J].河北师范大学学报(教育科学版)
,2015(7)
[9]江 新.不同母语背景的外国学生汉字知音和知义之间关系的研究[J].语言教学与研究,2003(6)
[10]江 新.汉字频率和构词数对非汉字圈学生汉字学习的影响[J].心理学报,2006,38(4)
[11]江 新.“认写分流,多人少写”汉字教学方法的实验研究[J].世界汉语教学,2007(2)
[12]江 新,赵 果.初级阶段外国留学生汉字学习策略的调查研究[J].语言教学与研究 2001(4)
[13]李禄兴.影响留学生汉字习得因素的调查与分析[J].现代语文(语言研究版),2014(12)
[14]李 蕊,叶彬彬.外国人汉字习得与教学[M].广州:中山大学出版社,2014
[15]李运富.汉字的特点与对外汉字教学[J].世界汉语教学,2014(3)
[16]米 娜,用汉字习得规律教学生学汉字[J].新课程(小学报)
,2016(1)
[17]缪丽珺,谢旭慧,牟玉华.母语非汉语大学生对汉字字音认知的特点[J].开封教育学院学报,2016(11)
[18]施正宇.现代汉字的几何性质及其在汉字教学中的意义[J].语言文字应用,1998(4)
[19]王 骏.留学生汉字习得的相关因素研究[J].语言教学与研究,2009(1)
[20]王 骏.外国人汉字习得数据库的建设与汉字习得分析[J].语言教学与研究,2015(3)
[21]尤浩杰.笔画数,部件数和拓扑结构类型与非汉字文化圈学习者汉字掌握的影响[J].世界汉语教学,2003(2)
[22]张家权,阮氏秋姮.越南学生学习汉字的方法,学生书写汉字的偏误问题及汉字教学建议——以胡志明市国家大
学中国语文系为例[C].胡志明市国家大学所属人文暨社会科学大学中国语文系,2017
[23]朱亚姣.字形特征对留学生汉字习得的影响[J].青年文学家,2017(30)

JMCLE Vol.8 No.1 June. 2019 PP.76-102 ©Association for Modernization of Chinese Language Education
~102~

You might also like