You are here

學多少字詞才夠?Part 3

第一篇系列提到英語學習者可以2570個word families為首要學習目標,想要更進一步學習,5000個應該可以包涵99%以上的生詞。

第二篇系列提到中國人所具有的字數約4000-5000字,許多作家在自己作品所使用的,也不外乎這個數字。

那華語/漢語學習者,應該要會多少字呢?我們先來看看華語教材有多少字好了。以台灣的《實用視聽華語》為例,第一冊(舊版第一冊,新版一、二冊)的字數為617,第二冊(舊版第二冊,新版三、四冊)為1225字,第三冊(舊版第三冊,新版第五冊)統計資料從。總共加起來為1842字(這些數字是以新版的為準,但用舊版的冊數,畢竟這個大家比較熟悉)。

那大家當然會好奇:1842字到底涵蓋多少呢?依照這份資料(現代漢語單字頻率列表),涵蓋率為96.48,所有樣本字數將近一萬。如果依照教育部的字頻表,1842的涵蓋率為95.333,但字數只有5731字。如果取整數95%的涵蓋率好了,學會這些字「看起來」涵蓋率較英語2570 word families的90%為高。這樣的比較其實意義不大,因為中文看得懂字不代表看得懂詞,比方說看得懂「電」和「腦」,並不一定了解「電腦」這個詞的意思(雖然電腦的頻率應該比「腦」高)。如果要用英文90%的涵蓋率,要學的字大約為1244。

但在中文裡,詞的涵蓋率要達到90%,依據平衡語料庫的詞頻統計,要 18298詞。就算英語以5000來比較,似乎多了三倍多。等一下,你注意到了嗎?比較的單位是不一樣的!中文是以「詞」,但英文不是以word,而是用word family。所以這樣比較起來,結果其實是差不多的。此外,雖然中文裡字與詞是不同的概念,詞的意義也不等於詞素的相加。但不可否認的,學會比較多字對學習詞彙較有幫助。

那《實用視聽華語》有多少詞呢?第一冊為930(449+481),第二冊為2445(1195+1250),第三冊為677,共為4052。中文詞彙的特性不似英文有很多詞類變化或衍生詞,像national, national, nationality, 中文只有少數的詞根可賦予詞這樣的特性,像:現代、現代化;工業、工業化。如果學完視華三的學生程度是高級,那這個結果與英文的5000 word families是滿相似的。但這需要更進一步調查,才能知道學多生詞才夠。

最後再回到鄭錦全老師的詞涯八千理論(這篇似乎非學術論文而是演講,如果有全文的話,麻煩請告訴我)。「鄭錦全說,單字之外,再加上兩三千個非衍生性、需要記憶的詞語,算出人所能掌握運用的詞語數量大約七八千,此即「詞涯八千」的由來。他進一步解釋為什麼不
說「字涯八千」,因為詞典收錄的幾個萬詞,從字的組合就可以理解,事實上從字詞、詞組到句子、篇章的理解,那是人的語言組合能力,並不是記憶能力。」對於這段話,我自己是有點質疑。我同意「詞涯」而非「字涯」,但是對「八千」怎麼來的仍舊覺得沒有很清楚。「單字之外,再加上兩三千個非衍生性」,如果從八千算回去,他的依據就是一般人所擁有的字數在5000左右。但前面分析過,事實上華語/漢語學習者毋須學會那麼多「字」,應該就可以學會超過四千詞,所以鄭錦全教授所提出的「八千」,這是我第一個質疑的地方。第二個質疑之處,什麼叫「兩三千個非衍生性、需要記憶的詞語」,這個定義太籠統。「白菜」不等於「白」+「菜」,並非所有白色的菜都叫「白菜」,這是否算是衍生性的詞語?現代漢語雙音節詞彙較單音節詞彙多的多,依照他的算法,那豈不是5/8是「字」,3/8是「詞」嗎?除非他認為許多詞像「白菜」、「火車」「黑板」都是可衍生,不需要另外記憶的。

雖然沒有任何根據或分析(如果有針對華語學習者的詞彙研究,請告訴我),但《視聽華語》的數據和英語方面的研究,我想2000字(正/繁體字)與5000詞應該是給華語學習者所設立的目標。

加油站主題: