使用凡例

漢語多功能字庫:

古文字繫形、部件樹、形義通解、說文索引、廣韻、成語彙編、英漢索引、粵語審音配詞

  1. 宗旨:本網頁旨在建立一個多功能漢語資料庫,為中文教學提供豐富的參考資源。本資料庫結合傳統小學、西方認知語言學與現代資訊科技,為教師和不同程度的學生提供一個學習,乃至研究漢語的平台,以期成為有助未來漢語教育的一項基礎建設。

     

  2. 收字範圍:本資料庫於2014年夏首度開放,至2018年夏共收錄15,395個字頭。其中1,065個字頭有甲骨文,1,970個字頭有金文,2,241個字頭有簡帛文字,2,453個字頭有其他古文字,7,360個字頭有小篆,959個字頭同時有甲骨文和金文,765個字頭同時有甲骨文、金文和簡帛文字。

     

  3. 使用模式
    • 本網頁提供「檢索」和「瀏覽」兩種使用模式。

      甲、檢索模式(Search Mode)

      1. 漢字字頭檢索
        1. 漢字字頭檢索:本網頁可直接輸入漢字檢索字頭,以取得本資料庫於該字下所儲存的所有訊息。
        2. 普通話拼音檢索:本網頁可選取普通話聲母、韻母、聲調搜索漢字,-表示零聲母,即沒有聲母,聲調以數字表示,0表示輕聲,1表示陰平,2表示陽平,3表示上聲,4表示去聲。若只選取聲、韻、調之中的其中一項,檢索結果會列出所有包括此音值的漢字。
        3. 粵語拼音檢索:本網頁可選取粵語聲母、韻母、聲調搜索漢字。-表示零聲母,若只選取聲、韻、調之中的其中一項,檢索結果會列出所有包括此音值的漢字。本網頁設有七套粵語注音系統可供選擇,包括香港語言學學會粵語拼音方案、黃錫凌、耶魯、廣州話拼音方案、國際音標、香港教育學拼音方案、劉錫祥。其中國際音標又根據聲調的不同標法分為調值和調型兩類,調值指用數字標示聲調的音值,調型指用符號標示聲調的音值。
      2. 全文檢索:本網頁設有全文檢索,可搜索「形義通解」一欄之中的單字或詞語。
      3. 英文檢索:本網頁可輸入英文單字或詞語搜索經本網站界定為與之有關的漢字的字頭。如搜索celestial一詞可取得包括「天干」在內的相關字頭信息。

      乙、瀏覽模式(Browse Mode)

      1. 字形瀏覽:包括「漢字部首索引」和「漢字筆畫索引」。「漢字部首索引」採用《康熙字典》的部首分類。在字形瀏覽模式下所列的字頭,可選按「甲金文字」以檢視各字頭下所收的古文字資料;又可選按「粵音分類」檢視該字頭的粵音種類,如圖一。
      2. 在選取「甲金文字」後,字頭的背景顏色為金色表示該字有金文,灰色表示該字頭有甲骨文,金、灰兼備者,表示該字頭既有甲骨文,也有金文。如字頭本身為棗紅表示該字有小篆,如字頭為綠色,則表示該字沒有小篆,很可能是較晚出的字。如字頭為藍色,表示該字是Unicode 擴展A或B區用字,如字頭是粗體,表示該字頭下附有相關圖片,如字頭是斜體,表示該字頭下有竹簡、帛書或其他古文字。
      3. 在選取「粵音分類」後,字頭的背景顏色為黃色表示該字是破音字,綠色表示該字是異讀字,粉紅色表示該字是異讀破音字。
      4. 語音瀏覽:可按「粵語音節表」、「粵語聲母表」、「粵語韻母表」查閱同音、同聲母或同韻母的字。在「分類字表」中,可選按「總字表」,或者選擇根據粵音分類的「單讀音字」、「破音字」、「異讀字」、「異讀破音字」、「破音和異讀破音字」來瀏覽漢字字頭。在「注音系統對照表」一欄,還有「聲母」、「韻母」、「聲調」的各家系統對照表,可供參考。
      5. 古文字部件瀏覽:可按「甲骨部件表」、「金文部件表」、「形義源流通解」三種方法查閱與古文字有關的材料。
    • 甲骨文部件表」、「金文部件表」:可按「類別」和「層級」排列古文字部件。「類別」包括人體及其部份、肢體活動/生理現象、自然現象、動物植物、生活文化、指事符號、多義或未定七大類。「層級」是按部件的等級分類。若一個部件不予再分拆者,就是一級部件。如「」象手形,不能再分拆,所以是一級部件。部分部件雖然也不能分拆,但需要進一步定義,所以歸入二級部件。如「」甲金文象右手形,手是「」字的字形本義,但是「」的字形本義(即手義)並沒有保留在「」字的用法當中,故一般讀者看到「」並不知道是象手形,需要以「」來定義「」。所以「」是二級部件。二級部件由一級部件組成。三級部件表示該字的組成部件中有一個或以上的二級部件。四級部件表示該字的組成部件中有一個或以上的三級部件。如此類推。
    • 形義源流通解」:列出同時有甲骨文和金文的漢字字頭及其形義通解。

       

  4. 每字頭下的基本資訊
    • 本網頁所收錄的字頭各有專頁。每專頁的頂部記載該字頭的基本資訊,包括:
      1. 部首和該部首在「漢字部首索引」中的編號、部首以外筆畫、總筆畫(書於括號內)。
      2. 繁、簡、港:「繁」表示該字為繁體字,「簡」表示該字為簡化字,「港」表示該字為香港字。
      3. 粵音分為單讀音字和多讀音字兩大類,多讀音字包括破音字、異讀字、異讀破音字,詳參下文第八 (VIII.)部分
      4. 其他有用資訊:UTF-8、大五碼、倉頡碼、字頻、漢語大字典頁碼、康熙字典頁碼、unicode、GB2312、四角號碼、頻序、Matthews頁碼、普通話讀音。
      5. 連結:國語辭典、中文字譜、unihan、康熙字典。
    • 每字頭的專頁下,視乎資料是否具足,將依次序提供以下與字頭相關的主要資訊:
      1. 古文字繫形+部件樹
      2. 《說文》條目
      3. 《廣韻》條目
      4. 形義通解
      5. 粵語審音配詞
      6. 配搭點
      7. 其他方言讀音
      8. 《讀史方輿紀要》地名
      9. 成語彙輯
      10. 英文字義
      11. 相關圖片:附上與字義所涉及的與歷史、文化、生活等有關的圖片。點擊圖片即可放大顯示。
      12. QR碼:方便讀者以手提電話提取資訊。

     

  5. 古文字繫形
    • 本網頁所收錄的古文字包括甲骨文、金文、簡帛文字、其他古文字、小篆。
      1. 小篆:小篆包括《康熙字典》中的小篆、《說文》中的小篆、篆文和今文。一般採用《康熙字典》中的字形,當滑鼠移至小篆字形之上,圖片資料便會顯示為「小篆(康熙圖)」。凡是《康熙字典》小篆與《說文》小篆字形不同的字條,則採用《說文》小篆,圖片資料改為「說文小篆」。
      2. 金文:圖片一般由「漢達文庫」(CHANT)的「金文文庫」提供,個別字形經本中心重新切圖。部份字形採自最新出版的學術刊物。每字頭下按時代先後次序排列從商代至戰國晚期的金文字形。當滑鼠移至金文字形之上,「圖片資料」便會顯示「器名」、「時代」以及該器物在「漢達文庫」中的編號,亦即在《殷周金文集成》中的編號。
      3. 甲骨文:圖片主要由「漢達文庫」的「甲骨文文庫」提供,部分字形掃描自《甲骨文編》、《甲骨文字典》、《甲骨文字詁林》、《甲骨文合集》、《小屯南地甲骨》、《甲骨文合集補編》、《英國所藏甲骨集》等。當滑鼠移至甲骨文字形上,「圖片資料」便會顯示「書名出處」和該字形在「漢達文庫」中的編號或其他相關資料。
      4. 字形圖片數目:甲骨文、金文圖片下的數字分別是已選取的圖片數目和本資料庫所保存的圖片數目。如「中」字下金文圖片數目為「21/239」,表示本資料庫共收239個金文字形,已選擇21個字形給讀者參考。
      5. 部件樹:甲金文圖片旁邊是該甲骨文或金文的「部件」,以樹形圖的形式列出該甲骨文或金文所從的部件。部件分為「主要部件」和「其他部件」。「主要部件」即樹形圖中的部件,是該字甲骨文或金文基本的、常見的組成部件。「其他部件」則排列於樹形圖之下,是指部份甲骨文或金文異體所從的、不同於「主要部件」的部件。當部件樹頂端顯示為,表示樹形圖未打開,按一下即可打開。如頂端是,表示樹形圖已擴展,按一下便會收起。部件樹中所列各部件均設有超連結,以通往從該部件之相關漢字的頁面。
      6. 簡帛文字:收錄從戰國至漢初的竹簡和帛書上的文字。包括郭店竹簡、上海博物館藏竹書、包山楚簡、望山楚簡、雲夢睡虎地秦墓竹簡、馬王堆漢墓帛書等。其中睡虎地秦墓竹簡和馬王堆漢墓帛書的圖片由「漢達文庫」提供,再由本中心逐字切圖,其他字形圖片由本中心掃描製作。當滑鼠移至此類傳世古文之上時,「圖片資料」會顯示該圖之來源。
      7. 其他古文字:包括傳鈔古文字、璽印文字、古陶文字、貨幣文字、石刻文字(如詛楚文、石鼓文、侯馬盟書等)。傳鈔古文字包括《說文》中的古文、籀文、或體、俗字、《汗簡》、《古文四聲韻》和《康熙字典》中的古文。凡《說文》中的古文、籀文、或體、俗字與《康熙字典》所收的古文字形相同者,則採用《康熙字典》的字形圖片。當滑鼠移至此類古文字之上時,「圖片資料」會顯示該圖之所由出。

     

  6. 形義通解
    • 一般包括「略說」和「詳解」兩部分。「略說」以簡明的文字概括該字的構形初義。「詳解」進一步分析該字的字形演變和具體用法,輔以傳世文獻,解釋字形字義。
    • 引用各家說法,或直接說明出自某家,或於文後括注人名出處。
    • 凡「形義通解」中以單引號(「 」)括起來的單字,一般附有超連結。以滑鼠點擊此字,即可開啟該字頭的專頁。凡引用古文字材料,□表示引文中缺一字或該字不清晰,難以辨認。假借字和古體字一般隨文注明,用來注釋的字外加(  )號;補字外加[  ]表示,而無法輸入的生僻古文字亦以[  ]括注其部件。錯別字之後以〈 〉括注其正字。
    • ◎符號:本資料庫除清楚列出的各主要部件外,於指示部件中設有帶「百搭」意義的◎符號,用以代表於各字形構中有特殊認知意義,但為免煩瑣而沒有進一步細分的部件。其意義隨不同字形之構造而更改,如「」中的◎指血滴,「」中的◎指紋身,「」中的◎指雙乳等。
    • 術語解釋(部分說明參考了裘錫圭先生的《文字學概要》、王力先生的《同源字典》):
      1. 「詞」是語言的基本單位,指最小的音義結合體。
      2. 「象形」指依據事物的形象描畫而成文字的造字方法。例如「」象太陽之形,「」象月牙之形。
      3. 「指事」指以象徵性的符號來表示意義的造字方法。例如甲金文「」字作「」形,從一短畫在一長畫之上,以示「」之意。
      4. 「部件」指一個字的基本組成部分。「部件」包括兩種:一、可獨立成字,如「」是「」的部件。二、不可獨立成字,這種部件多是一些形態多樣的表意符號、筆畫、小點等,其意義是依靠與同一字中可獨立成字的部件的組合關係而起作用的,本網頁以◎表示這種部件。例如甲金文「」字從「」上畫有眉毛之形(即後來隸定為「」的部件),這些象眉毛的筆畫以◎表示。
      5. 「偏旁」指漢字形體中常常出現的某些組成部分。例如「」、「」中的「亻」,「」、「」中的「」。本網頁中「部件」、「偏旁」一般通用無別。
      6. 「意符」指與該字所代表的詞有意義上的聯繫的字符。「意符」又可分為「形符」和「義符」兩類。
      7. 「形符」作為象形符號,通過自己的形象來起表意作用。例如古文字裏的「」象一個站立人形的側面,「」象太陽。
      8. 「義符」是不依靠自己的形象來起作用的,而依靠本身的字義來表意的字符。「義符」通常都是由已有的字充當表意偏旁。例如:「」由「」、「」二字組成,它的意思就是「不正」。「」、「」依靠它們的字義來表意,所以是「義符」。
      9. 「聲符」、「音符」、「聲旁」是表示讀音的字符。例如「」是「」的聲符。
      10. 「會意」指合成兩個或以上的字表示一個意義的造字方法,例如甲骨文「」字從「」從「」,「」象幼苗或草,會幼苗在田中生長之意,是苗圃的「」的初文。
      11. 「形聲」由意符和音符組合而成,意符表義,音符表聲。例如「」從「氵」(即「」)為意符,表示河流,「」為音符。
      12. 「會意兼形聲」、「形聲兼會意」指形聲字的聲旁既表音,又表意。例如「」從「」從「」,會把女子取過來之意,「」同時是「」的聲符。
      13. 「亦聲」表示該部件既是意符,亦是聲符。
      14. 「雙聲字」、「雙聲符字」表示該字包含兩個聲符。
      15. 「本義」、「初義」、「字形本義」、「構形初義」、「造字本義」、「構形本義」表示從古文字最初的字形所見的、造字時想表達的意義。如「」字甲金文象以繩索編在一起的竹簡之形,本義是簡冊。字形本義與實際辭例所見的用義未必一致,亦即是說,有些字形本義並沒有保留在實際用法之中。如「」字造字時應指「蝎子」,但最早的用例均已借作萬千的「」。
      16. 「本字」指表示本義的字。當一個字通行的寫法和表示本義的字形不同,原來的字形稱為「本字」。這又分兩種情況:一、指一個字比較原始的書寫形式,例如「」甲骨文象太陽在草叢中落下,是「」的本字。二、指與假借字相對的本字。如「」是假借字「」的本字(詳下文「通假」條之說明)。此外,「本字」又指分化字所從出的母字。造字之初,文字不多,一個字往往兼表多種意思,如以拿取的「」來表示嫁娶的「」,「」是「」的本字。
      17. 「初文」指一個字的初期寫法,相對於後起字而言。「初文」即是上述第一種「本字」,指一個字比較原始的書寫形式。
      18. 「象形初文」指一個字比較象形的初期寫法,例如「」是麥子的「」的象形初文。
      19. 「後起字」指一個字的後起寫法,這包括「後起分化字」(即「分化字」)、「累增字」和「後起本字」。
      20. 「後起分化字」、「分化字」是為了分散多義字的職務而產生的。把一個字分化成兩個或幾個字,使原來由一個字承擔的多種意義或音義,由兩個或幾個字來分擔。我們把用來分擔職務的新造字稱為「分化字」,把分化字所從出的字稱為「本字」。

        分化字主要有四種:一、異體分工。把一個字的多種意義分派到不同的異體字。例如在較早的時代,「」可以用來表示謀猷的「」和猶如的「」。「」和「」本是偏旁位置不同的異體,用法並無區別。後來謀猷的意義專用「」字表示,猶如的意義則用「」字表示,異體變成了用法不同的字。二、和本字只有筆畫上的細微差別的分化字。例如古文字本來假借「」字表示否定詞「」。到戰國時代,有人把「」字的兩點改成一畫,分化出「」字來專門表示否定詞(但戰國時代一般仍以「」表「」,到秦漢時代才普遍使用「」字)。三、在本字的基礎上加注或改換偏旁來表示本字的其中一個引申或假借意義。這又分兩種情況,(一)、加注意符:例如嫁娶的「」甲骨文用「」字來表示,後來加「」旁造「」字來專門表示嫁娶之義,「」是「」的分化字。又如表示死去的母親的「」字甲骨文用「」來表示,後來加「」旁造「」字專門表示亡母之義,「」是「」的分化字。 (二)、加注或改換聲符:例如飲食的「」引申有餵食的意思,後來加注聲符「」,分化出「」字來表示這一意義。四、和母字在字形上沒有聯繫的分化字。例如「」表示死而復生,南北朝時另造「」字來表示「」的復蘇之義。本網頁「形義通解」所談的「分化字」,主要是指第二和第三種。

      21. 「一字之分化」主要指以上所說第二種分化字,即是指兩個古文字本來用同一個字形表示,後來在原來的字形的基礎上添加或省略一些筆畫或符號,使字形產生細微差別而造出新字,專門表示其中一個意思。例如古文字本來假借「」字表示否定詞「」。到戰國時代,有人把「」字的兩點改成一畫,分化出「」字來專門表示否定詞(但戰國時代一般仍以「」表「」,到秦漢時代才普遍使用「」字)。
      22. 「累增字」、「孳乳字」指在「本字」的基礎上增加偏旁而不改變其字義的後起字。相當於以上所說第三類加注偏旁的「分化字」。例如「」是水中的孑孓,後來加注「」旁作「」字,「」、「」都可表示孑孓這種水蟲。
      23. 「後起本字」指有些無本字的詞假借另一個字來表示,後來在所假借的字的基礎上加注意符,為這個詞造出後起的本字。有的後起本字一直沿用至今,例如「」的本義是內臟,借用來表示說話,後來才加「」旁造出本字「」。有的後起本字沒有保存下來,例如「」本義是跳舞,借用來表示沒有,後來才加「」造出本字「」,專門表示沒有的本義。「」是有無的「」的後起本字,現已廢棄。
      24. 「同形字」指外形雖然相同,但實際上是不同的字。例如犯罪的「」本來是用「辠」字表示的,到了秦代,統治者嫌「辠」的字形近於皇帝的「」(篆文或從「」作「」),借本來表示「捕魚竹网」的「」字來代替它。表示捕魚竹网的「」和犯罪的「」是「同形字」。
      25. 「異體字」指彼此音義相同而外形不同的字。狹義異體字是指用法完全相同的字,如「」和「羣」,「緜」和「綿」。廣義異體字還包括「部分異體字」,即包括部分用法相同的字。例如「」字有「」、「」、「」、「」四個異體。「」字主要有三種意義:一、一種凶猛的鳥(本義),二、雕刻、雕飾(假借義),三、雕零(假借義)。「」只在第一種意義上與「」是異體。「」只在第二、第三兩種意義與「」是異體。「」只在第二種意義上與「」是異體(參看呂叔湘《語文常談》,北京:生活.讀書.新知三聯書店,1980,頁26-27)。「」只在第三種意義與「」是異體。
      26. 「古今字」指兩字的關係一古一今,一個是該字古代的寫法,一個是該字現今的寫法。「古今字」包括本字和後起字,如「」是「」的古字,「」是「」的今字。又包括有古今關係的異體字,如「」是「」的古字,「」是「」的今字。
      27. 「通假」表示在本有其字的情況之下,借用另一個讀音相同或相近的字,兩者在意義上並沒有關係。例如古漢語中,「」是早晨的「」的本字,「」常常通假作「」,《禮記‧內則》:「孺子蚤(早)寢晏起」。又如金文中,「」是寶貴的「」的本字,「」通假作「」,如格伯簋:「鑄保(寶)簋」,表示鑄造寶貴的簋(簋是古代食物的器皿,今天廣東話仍有「九大簋」一語,即保留此義)。
      28. 「假借」表示在本無其字的情況之下,借用另一個讀音相同或相近的字來表示。例如「」字甲金文象蝎子之形,由於表示十千的數詞「」本無其字,本義是蝎子的「」假借來表示數詞,久假不歸,後來蝎子之本義另造「」字來表示。廣義的「假借」也包括本有其字的「通假」。
      29. 「讀作」、「讀為」、「通讀為」表示某字應該釋讀為另一字,兩字之關係包括通假、假借、本字和分化字等。如《禮記‧內則》:「孺子蚤(早)寢晏起」一句中的「」讀為「」,「」和「」是通假關係(也是廣義的假借關係)。又如甲骨文「比庚」的「」讀為「」,「」和「」是本字和分化字的關係。至於《說文》「讀若」只表示某字的讀音,與本條無涉。
      30. 「引申」、「引伸」指由字的本義推演出來的、與本義有關的新的意義。例如「」的本義是絲帶,絲帶可以用作編織,故「」又有編織之意,編織就是「」的引申義。
      31. 「訛變」、「變」、「訛寫」是在傳抄過程中,古文字字形的錯誤改變,訛變後的字形多與原字字形相近。例如古文字「」象腳趾之形,金文「」用作偏旁時常常誤寫成形體相近的「」,參見「」。
      32. 「轉注」是六書中向來爭議最多的。在芸芸眾說之中,近人孫雍長的理論最合乎認知原則。古代假借成風,使漢字產生了許多歧義。孫氏認為轉注是為了排除歧義而在轉注原體字上加注意符,構成新字。這正是按照認知上的需要,創造出轉注字,如「」曾有多用,為了專門表示父丂之「」,乃加注「」而成「」。孫氏認為轉注極具創造性,能孳乳出許多同從一個聲符的字,如「」轉注為「」、「」、「」、「」、「」、「」等。
      33. 「籀文」指西周晚期宣王時太史籀所作的十五篇文字,保留在《說文解字》中。
      34. 「古文」主要指《說文解字》中所收錄的古文,來源於孔子壁中書和張蒼所獻《春秋左氏傳》,其主體為齊系文字中的魯文字,夾雜有少量楚文字的寫法,也有時代早於戰國的古文字,也有少量非六國文字的成分。
      35. 「篆文」即是小篆。
      36. 「或體」指《說文解字》中所收的異體字。
      37. 「今文」指《說文解字》中所收的漢朝的文字。
      38. 「重文」指《說文解字》中所收的古文、籀文、篆文、或體等古文字。
      39. 「同源」指兩個或多個字音義皆近,音近義同,或義近音同。這些字都有同一來源。或者是同時產生的,或者是先後產生的。同源字常常是以某一概代為中心,而以語音的細微差別(或同音),表示相近或相關的幾個概念。例如「」表示洪水缺堤,「」表示玉環有缺口,「」表示器皿有缺口,「」、「」、「」皆有缺漏之意。
      40. 「類化」、「同化」指文字在發展演變中,受所處的具體語言環境和受同一文字系統內部其他文字的影響,或受自身形體的影響,在構形和形體上相應地有所改變的現象。例如「展轉」的「」受「」字影響,也增加「」旁,類化為「」。
      41. 「聲化」指在原字的基礎上加注聲符,或把原字形的一部分改變為聲符(即是「變形音化」),使該字的部件起表音作用。
      42. 「變形音化」指將一個字的形體的一部分,改寫成可以代表這個字的讀音的形體,而新舊字形也十分接近。
      43. 「隸定」指把古文字轉寫為隸書,即是把原來較象形的字形轉寫為線條化的字形。
      44. 「隸變」指把古文字轉寫為隸書以後,所造成的字形變化。隸變往往使字形失去了原來的表意作用。
    • 書目簡稱全稱對照如下:
       簡稱 書名全名
       說文 說文解字
       段注 說文解字注
       合集 甲骨文合集
       屯南 小屯南地甲骨
       合補 甲骨文合集補編
       英藏 英國所藏甲骨集
       集成 殷周金文集成
       睡虎地   睡虎地秦墓竹簡
       馬王堆   馬王堆漢墓帛書
       郭店簡 郭店楚墓竹簡
       清華簡 清華大學藏戰國竹簡
       新蔡簡 新蔡葛陵楚墓竹簡
       上博竹書   上海博物館藏戰國楚竹書
       北大漢簡   北京大學藏西漢竹書
    • 撰寫「形義通解」時所依據的主要參考書目有以下幾種:
      1. 許慎撰,徐鉉校定:《說文解字》(北京:中華書局,1963)。
      2. 許慎撰,段玉裁注:《說文解字注》(上海:上海古籍出版社,1981)。
      3. 季旭昇:《說文新證》(台北:藝文印書館,2002-2004)。
      4. 董蓮池:《說文解字考正》(北京:作家出版社,2004)。
      5. 黃德寬主編:《古文字譜系疏證》(北京:商務印書館,2007)。
      6. 李圃主編:《古文字詁林》(上海:上海教育出版社,1999-2004)。
      7. 王輝:《古文字通假字典》(北京:中華書局,2008)。
      8. 劉志基等主編,潘玉坤分冊主編:《古文字考釋提要總覽》第1冊(上海:上海人民出版社,2008)。
      9. 劉志基等主編:《古文字考釋提要總覽》第2冊(上海:上海人民出版社,2010)。
      10. 徐中舒主編:《甲骨文字典》(成都:四川辭書出版社,1989)。
      11. 劉興隆:《新編甲骨文字典》(修訂本)(北京:國際文化出版公司,2005)。
      12. 馬如森:《殷墟甲骨文實用字典》(上海:上海大學出版社,2008)。
      13. 崔恒昇:《簡明甲骨文詞典》(增訂本)(合肥:安徽教育出版社,2001)。
      14. 松丸道雄、高島謙一:《甲骨文字字釋綜覽》(東京:東京大學東洋文化研究所,1993)。
      15. 于省吾主編,姚孝遂按語編撰:《甲骨文字詁林》(北京:中華書局,1996)。
      16. 張世超、孫凌安、金國泰、馬如森:《金文形義通解》(京都:中文出版社,1996)。
      17. 陳初生編纂,曾憲通審校:《金文常用字典》(西安:陝西人民出版社,1987)。
      18. 周法高主編,張日昇、徐芷儀、林潔明編纂:《金文詁林》(香港:香港中文大學,1974-1975)。
      19. 周法高主編:《金文詁林補》(台北:中央硏究院歷史語言硏究所,1982)。
      20. 李孝定:《金文詁林讀後記》(台北:中央研究院歷史語言研究所,1982)。
      21. 何琳儀:《戰國古文字典》(北京:中華書局,1998)。
      22. 白川靜著,蘇冰譯:《常用字解》(北京:九州出版社,2010)。
      23. 裘錫圭:《文字學概要》(北京:商務印書館,1988)。
      24. 李守奎、曲冰、孫偉龍編著:《上海博物館藏戰國楚竹書(一─五)文字編》(北京:作家出版社,2007)。
      25. 孫雍長:《轉注論》增補本,(北京:語文出版社,2010)。
      26. 李學勤主編:《字源》(天津:天津古籍出版社,2012)。
      27. 季旭昇:《說文新證》(臺北:藝文印書館,2014,第二版)。

       

  7. 英漢索引
    • 儘管漢語對詞類的分別及使用與英語於不盡相同,但誠如洪堡特所指,使用漢語時還是有潛在的詞類分辨的。本字庫乃於每字頭下,設想其使用時之各種情況,於相應的英語詞類下列出該字的一些可能的英文翻譯。這項工作除讓一些英語使用者得以循英文這一途徑使用字庫外,也為廣大的漢語使用者別闢蹊徑,俾能借他山之石,從另一角度窺探漢語豐富的意義世界
    • 以英文搜索,可取得於意義上可能與該英文概念相關的一系列漢字。如以 sad 搜索,可得「哀」、「忡」、「悲」、「悴」、「悽」、「憂」「戚」等近30個漢字。使用者可點擊之以進入相關字頭。
    • 用以解釋的所有英文單字同時會被建立為超連結,使用者可自行隨機點擊,以連續追蹤各種不同義項。
    • 建議參考的搜索英文字:stop, bird, fish, constellations, element

     

  8. 粵語審音配詞
    • 漢字分為單讀音字和多讀音字兩大類。一字的不同讀音往往區別不同的意義。「粵語審音配詞」,顧名思義,旨在審察讀音,配搭詞語,以辨別不同的意義和用法。
    • 本網頁預設的注音系統採用香港語言學學會的系統,但用者可以在主頁頂端「注音系統」的欄目中,根據自己所熟習者選取適合的注音系統(詳見下條)。
    • 本網頁左欄附有粵語注音系統對照表,排比七種注音系統,包括香港語言學學會(《粵語拼音字表》)、黃錫凌(《粵音韻彙》)、耶魯(Parker Po-fei Huang: Cantonese dictionary; Cantonese-English, English-Cantonese)、廣州話拼音方案(《廣州音字典》)、國際音標、香港教育學院(《常用字廣州話讀音表》)、劉錫祥(《實用粵英詞典》)。
    • 「同音字」一欄,字例的背景顏色為黃色,表示該字有金文,灰色表示該字有甲骨文。
    • 配詞原則:我們力求為本字庫收錄的所有漢字配詞。我們配詞的時候會遇上四種情況,分別是「單讀音字」、「破音字」、「異讀字」和「異讀破音字」。以下分別舉例,並說明我們配詞的原則:
      1. 「單讀音字」-- 由於其讀音無爭議,是以我們只略為配上常用的詞。當某讀音構成單音節詞時,我們將以備註方式加上簡略的解釋。
      2. 「破音字」--指多讀音字的讀音當中至少有兩個表示不同的意義;而且其讀音之間並未構成下文所述之異讀關係。我們會為各個不同讀音配上相應的詞,配詞時以常用者為主。
      3. 「異讀字」--指多讀音字的讀音之變化並沒有構成字義之分別。我們會挑選有最充份根據的讀音配詞。所謂「有最充份根據的讀音」,是指直至目前,在我們使用的資料中,最多音韻學家認同的讀音。以「」字為例,在[cyu5]、[syu5]和[syu6]三個注音中,有三個音韻學家注上[cyu5],兩個注[syu5],一個注[syu6],因此詞例只配在[cyu5]一欄,而在其餘兩欄的備註中註明是「曙cyu5的異讀字」。
      4. 「異讀破音字」--指多讀音字的讀音當中至少有兩個表示不同的意義;而且其讀音中至少有兩個構成上述異讀關係。我們先根據字義劃分不同的讀音,假如該漢字用以表達某一意義時,讀音沒有爭議,我們即配上相應的詞;假如讀音出現爭議,我們則會按處理「異讀字」的原則來配詞。例如「」字,當用以表達「踐踏」之意時,讀[zik6],此讀音廣為音韻學家採納,故即配以「狼藉」、「慰藉」等詞;當用以表達「依靠」之意時,則有[ze3]和[ze6]兩個不同的注音,我們根據處理「異讀字」的原則,選出「有最充份根據的讀音」來配詞。在這情況下,我們在[ze6]一欄中配上「藉口」、「藉故」等詞,而在[ze3]一欄的備註中註明是「藉ze6的異讀字」。

      [註:我們必須提醒使用者,所謂「有最充份根據的讀音」,是一個統計概念,而非價值評判。我們無意抹煞任何音韻學家的研究成果和意見,相反,我們為每一個讀音提出根據,希望使用者能夠明白自己所讀之音是否廣為音韻學家認同。]

    • 配搭點:若漢字 X, Y, Z... 能夠與某一既定的漢字 C 慣常地連用,並且組成詞語,則 X, Y, Z... 就可稱為漢字 C 的配搭點。
    • 參考書目:本字庫收錄字音和選取配詞的工作,廣集眾家之長。依據的主要參考書目有下列各種:
      1. 黃錫凌:《粵音韻彙》(重排本)(香港:中華書局,1991)
      2. 李卓敏編纂:《李氏中文字典》(第二版)(香港:中文大學出版社,1989)
      3. 周無忌、饒秉才編:《廣州話標準音字彙》(香港:商務印書館,1988)
      4. 何文匯、朱國藩編著:《粵音正讀字彙》(第二版)(香港:香港教育圖書公司,2001)
  9.  

  10. 工具
    • 其他方言讀音(下詳)
    • 《廣韻》中古音(下詳)
    • 《說文解字》全文索引(下詳)
    • 《讀史方輿紀要》地名(下詳)
    • 成語彙輯(下詳)
    • 「繁簡對照表」列出本資料庫所收繁體字及其對應之簡化字。

     

  11. 其他方言讀音
    • 「方言」一語,最早源自西漢揚雄 (53 BCE-18 CE)收集中國各地域言語的同名著作。有謂「通語便於溝通,方言用於傳承」。中國幅員廣大,生民以來,言語各異;由於方音承載地域傳統,實乃中國文化的重要元素。漢語諸方言依音韻條件可分為官話、吳語、贛語、湘語、閩語、粵語、客家話七大方言區。本資料庫參考學界發表的各大方言研究材料,於「漢語七大方言區」選取共20個方言點,據有關材料編成字表,標註讀音音標,並重新錄製字音,旨在為各地方音留下書面記錄與有聲資源,以利語文教育與學術研究。
    • 本資料庫在「粵語審音配詞」基礎上增設漢字在中國20個不同地區之方言讀音,以擴大漢字語音信息量。
      1. 第一、選點標準
        • 據中國方言的基本分區原則,漢語諸方言依音韻等條件可分為官話、吳語、贛語、湘語、閩語、粵語、客家話七大方言區。本資料庫方言點選取以「漢語七大方言區」為參考,各方言區選取相應方言點,錄製音檔及標註讀音。各大方言的收錄及其選取依據說明如下。
          1. 官話區選取5個點,包括濟南、太原、南京、武漢、西安。濟南話代表冀魯官話,西安話代表中原官話,南京話代表江淮官話,武漢話代表西南官話。太原話代表晉語。
          2. 吳語區選取3個點,包括上海、杭州、溫州。上海話是新的高威望吳語方言。杭州話是高度官話化的吳語,有人認為能部分地反映北宋通語。溫州話代表南部吳語。
          3. 贛語區選取2個點,包括南昌、黎川。南昌話是贛語的權威方言。黎川話代表南部贛語(屬於撫廣片)。
          4. 湘語區選取2個點,包括長沙、湘潭。長沙話是最有威望的湘語方言,湘潭話則代表南部湘語。
          5. 閩語區選取4個點,包括廈門、福州、建甌、汕頭。福州話代表閩東話,廈門話代表福建閩南話,建甌話代表閩北話,汕頭話代表粵東閩南話。
          6. 粵語區選取2個點,包括南寧、封開南豐,加上本字庫已有的香港一點(即粵語審音配詞字庫),實際上有3個點。南寧代表廣西粵語,封開南豐代表比較古老的粵語勾漏片。
          7. 客家話區選取2個點,包括梅縣、南雄珠璣。梅縣話在眾多客家方言中較有代表性。南雄珠璣則代表存古較多的老客家話。
        • 資料庫選點總的原則是兼顧漢語七大方言,同時根據方言面積和複雜程度略作調整。各大方言點數量大致為2~3個點,只有官話、閩語例外。官話面積廣大,我們選取了5個點。閩語的複雜程度在漢語方言中獨樹一幟,我們選取了4個點。

      2. 第二、字音來源
        本資料庫漢字讀音的音標標註主要參考已發表的各大方言音檔,材料來源如下:
        1. 濟南 錢曾怡、朱廣祁編寫,1998,《濟南話音檔》,上海:上海教育出版社。
        2. 西安 王軍虎編寫,1997,《西安話音檔》,上海:上海教育出版社。
        3. 南京 劉丹青編寫,1997,《南京話音檔》,上海:上海教育出版社。
        4. 武漢 劉興策、趙葵欣編寫,1997,《武漢話音檔》,上海:上海教育出版社。
        5. 上海 游汝杰編寫,1994,《上海話音檔》,上海:上海教育出版社。
        6. 杭州 鮑士杰編寫,1998,《杭州話音檔》,上海:上海教育出版社。
        7. 溫州 潘悟雲編寫,1998,《溫州話音檔》,上海:上海教育出版社。
        8. 南寧 楊煥典編寫,1997,《南寧話音檔》,上海:上海教育出版社。
        9. 肇慶封開南豐 詹伯慧、張日升主編,1998,《粵西十縣市粵方言調查報告》,廣州:暨南大學出版社。
        10. 厦門 周長楫編寫,1996,《厦門話音檔》,上海:上海教育出版社。
        11. 福州 梁玉璋、馮愛珍編寫,1996,《福州話音檔》,上海:上海教育出版社。
        12. 建甌 林連通、潘渭水編寫,1998,《建甌話音檔》,上海:上海教育出版社。
        13. 汕頭 施其生編寫,1997,《汕頭話音檔》,上海:上海教育出版社。
        14. 梅縣 黃雪貞編寫,1997,《梅縣話音檔》,上海:上海教育出版社。
        15. 南雄珠璣 林立芳、莊初升著,1995,《南雄珠璣方言志》,:廣州:暨南大學出版社。
        16. 南昌 魏剛强、陳昌儀編寫,1998,《南昌話音檔》,上海市:上海教育出版社。
        17. 黎川 顔森編著,1993,《黎川方言研究》,北京:社會科學文獻出版社。
        18. 長沙 侯精一主編、鮑厚星編寫,1997,《長沙話音檔》,上海:上海教育出版社。
        19. 湘潭 曾毓美編寫,1997,《湘潭話音檔》,上海:上海教育出版社。
        20. 太原 溫端政編寫,1999,《太原話音檔》,上海:上海教育出版社。

      3. 第三、描寫體例
        • 送氣符號。聲母的送氣符號一律用 ʰ,而不用單引號 ‘。
        • 在每一方言點下,如果某個字有兩個或以上的中古音,且方言中有不同的破讀音,則各讀音會分行 (rows)列出,每一破讀音下該字的字義,通常附上簡單配詞。如遇一字有文白二讀的情況,則於該行的顯示中,會先列出白讀,後列出文讀,中間以 “/” 符號隔開。
        • 俗讀。俗讀(例如廈門、長沙)一律放在最末,位於文白讀之後。
        • 原文字音的註釋一律照錄。偶遇原文有不盡合理之表述,本中心會標以 (sic),以示保留,用者宜自行判斷。
        • 原文的排印錯誤。對於材料來源中個別明顯的排印錯誤,本文徑直改正,並以「中心按」的形式稍作說明。
        • 聲調標註。聲調標註調類、調型兩種,例如:陰平55。
        • 難以顯示的字。如原文注釋中有顯示困難的例字,其中左右結構的,用【XY】分別表示。例如,【女子】表示「好」字。如非左右結構,一般在【】內對該字進行說明。

      4. 第四、錄音規範
        • 字表設計: 根據各方言點已整理之字表,設計適用於錄音的顯示獨立音節的字表。
        • 背景噪音: 不大於-35dB,沒有明顯的其它噪音(比如汽車喇叭聲、電流聲、門外的說話聲等)。
        • 錄音硬件: 外置音效卡+指向性話筒+筆記型電腦。
        • 錄音軟件: 斐風。
        • 錄音參數:
          • 聲道:單聲道(斐風默認如此)。
          • 取樣速率:44100Hz(斐風默認如此)。
          • 採樣精度:16bit(斐風不可設置,應是默認)。
          • 格式:Windows PCM(*.wav)(斐風不可設置,應是默認)

     

  12. 《廣韻》中古音
    • 本字庫提供的中古音信息以《廣韻》收字為底本,參考網絡資源「小學堂中古音」、「東方語言學網中古音查詢」,核對各字的中古音韻地位,展現各字在《廣韻》中之「頁碼」、「反切」、「註解」的同時,以列表形式,簡明清晰展現各字的聲韻學信息。如一字只有一個聲韻地位 (Phonological status),即以一行表示,如一個字有多個聲韻地位,則分列多行。每行所列資料如下:
      • 頁碼:標示漢字在通行本《廣韻》書中的頁數。使用版本為余迺永校注:《新校互註宋本廣韻》(香港中文大學出版社),1993年。
      • 反切:為《廣韻》反切,一個字可同時有多個反切。
      • 註解:即為《廣韻》對各收字的語義註釋。為節省熒幕空間,註釋內容先予隱藏,使用者可以 mouse over 方式讀取。
      • 聲母:即中古聲母,也即輔音。
      • 清濁:清濁實際上是對聲母類型的歸併,中古聲母的清濁情況分:全清、次清、全濁、次濁四類。
      • 部位:即聲母發音部位,分唇、舌、齒、牙、喉。
      • 聲調:分平、上、去、入四類。
      • 韻攝:中古韻母依照韻腹與韻尾關係可分為十六攝,分别是:通、江、止、遇、蟹、臻、山、效、果、假、宕、梗、曾、流、深、咸攝。
      • 韻目:即為漢字中古韻母。
      • 開合:即對中古韻母有無u介音分類的結果,無u介音稱「開」,有u介音稱「合」。
      • 等第:此為等韻學概念,與韻母類型相關,分為四等。

    • 聲母與“清濁”對應表:

      全清
      次清
      全濁
      次濁
        全清     全濁  
      CLEAR
      Unvoiced unaspired
      Sec. CLEAR
      Unvoiced aspired
      MUDDY
      Voiced
      Sec. MUDDY
      Nasal, Liquid, ...

     

  13. 《說文解字》全文索引
    • 《說文解字》(簡稱《說文》)是東漢許慎所撰,並經後世增訂,乃中國第一部有系統地分析漢字形、音、義的字書。傳統文字學以《說文》為基礎。歷代對於《說文》的研究非常多,到了清代更達到高峰,例如著名的《說文》四大家:段玉裁、桂馥、王筠和朱駿聲。隨著出土古文字材料的發現,《說文》所收的小篆、古文和籀文,以及許慎對字形的分析都成為考釋古文字很重要的參考和依據。此書在傳統小學和古文字學方面都是非常重要的著作。
    • 根據《說文解字.敘》,全書分為540部,共收9,353個字頭。經過歷代傳鈔,傳世的大徐本《說文》共有字頭9,430個,一般認為多出來的部分是後人所加。此外,徐鉉以「新附」的形式在《說文》各部首正文之後增加了402個字頭;徐鍇《說文解字繫傳》也增補了10個字頭。本資料庫收錄的《說文解字》是在復旦大學出土文獻與古文字研究中心施謝捷教授《說文解字》電子檔的基礎上重新校對而成。此次校對主要以1963年和2013年中華書局影印陳昌治校刊本為依據。除了《說文》的字頭外,兼收《說文新附》和《說文解字繫傳》增補的字頭,三個部分加起來總共有9,842個字頭。減去若干重複收的字頭,本資料庫實際所收字頭為9,826個。在《說文》的解釋後會以括注形式注明中華書局影印本的頁碼,同時也在《說文》重文的基礎上補充了相關的異體,以方便使用者查找。
    • 本資料庫所收《說文解字》分為四個欄目:一、字頭;二、解釋;三、部居;四、相關異體。
      1. 字頭: 字頭之上顯示出處,來源有三:今本《說文》、《說文新附》或《說文繫傳》。 字頭主要依據2013年中華書局出版的《說文》隸定字頭,偶爾根據解釋所用字略作調整,或者選取較為通行的字形取代部分冷僻的隸定作為字頭。
      2. 解釋: 分為四個部分:(1)《說文》的解釋;(2)徐鉉注;(3)反切;(4)頁碼。一般按原文引錄,遇有不能顯示的難字,以「[ ]」符號括起該字的部件。若原文有誤,則用「( )」括起錯字,隨即以「[ ]」補上正確的字。
        1. 《說文》的解釋:主要根據2013年中華書局出版陳昌治校刊本,偶爾依據徐鍇《說文繫傳》、段玉裁《說文解字注》等以作校訂。
        2. 徐鉉注:共有568則,皆以「【 】」號括起來。徐鉉注文常會引錄其弟徐鍇的意見(共141則),一般以「徐鍇曰」開始,但仍屬徐鉉所撰注文,兩者不宜混淆。
        3. 徐鍇於《繫傳》中留下的註文為數並不多(一共只有 6 則),一般以「臣鍇曰」開始,亦以「【 】」號括起來。
        4. 反切:以全形「[]」號括起來。部分字頭沒有反切,也有不少字頭有多過一個反切。
        5. 頁碼:以「( )」號括起來,列於最後。前後兩個數字分別為1963年和2013年中華書局出版的《說文》頁碼。
      3. 部居: 列出字頭在《說文》中所屬的部首。點擊相關超連結可列出同一部首下的所有《說文》字頭。
      4. 相關異體: 主要收錄《說文》所收的或體、異體,偶爾收錄一些《說文》以外的異體字。
    • 《說文》全文索引功能:
      • 提供搜索功能,範圍可包括《說文》所有內容,也可以選擇「字頭」、「解釋」、「相關異體」、「徐鉉注」、「徐鍇注」、「反切」或「部居」。請注意,「解釋」、「徐鉉注」、「徐鍇注」、「反切」這四個部分在網頁中為了節省空間雖然被安放於「解釋」這同一個欄 (column) 之下,但四者於資料庫中其實各自獨立地佔據不同欄位 (fields),故可以獨立地用作搜索範圍。
      • 建議搜索例子:「」、 「」、「」、「」、 「周禮」、「賈侍中」、「孟子
    • 「部首索引」:可按照兩種方式排列:(i)按原書的標目排列;(ii)按部首的筆畫排列。
    • 每個部首之下會列出《說文》、《說文新附》和《說文繫傳》分別收錄的漢字,並顯示該部首總收字數,本資料庫已收和未收的字數。

     

  14. 《讀史方輿紀要》地名
    • 《讀史方輿紀要》130卷乃明末清初處士顧祖禹 (1631-1692) 以一人之力所獨撰,向來號稱「海內奇書」。本書以歷史為經,地理為緯,開史地一家之先河,尤重地理之掌握與歷代興衰之關係。本書成於康熙年間,但論列之地理狀況則以明末為止,內容廣及疆域之演變、政區之沿革、州縣之從屬、城鎮之羅列、山形之分佈、河漕之防治,而特重軍事之腰領,與形勢之遠近,只間及前代之掌故,或貨殖之流通等。本書內容以博通奇特見著,近世名人如左宗棠、張之洞、梁啟超、丁文江、錢基博、錢穆、錢鍾書等莫不予以口碑。
    • 本網頁單元得以推出,得感謝南京三江學院歷史與文化地圖中心許盤清教授之玉成。許教授對《讀史方輿紀要》研究不下二十年,並曾把全書之章節與段落予以電子標記 (markup),為該書的全文處理訂立一結構平台。後來許教授與北方文藝出版社及臺灣中央研究院人文社會科學研究中心組成相關合作項目,經過多次商議,許教授及其合作人最後同意本中心使用《讀史方輿紀要》全文中標記為縣級以上的材料。本中心遂得以在這基礎上作進一步的資訊處理,乃有此網頁單元之製作。
    • 明代行政單位因襲元代之行中書省制,但改「行省」為「承宣布政使司」(簡稱「布政使司」),並把其中最重要之兩單位訂為北直隸與南直隸,乃有所謂「兩京十三布政使司」之格局。布政使司下轄府、州,及縣,或下轄直隸州及縣。凡此種種,本網頁使用者於搜獲所需地名後,無論屬何層級,均可上循下溯。由於明代地名與今日有異,本網頁特提供兩種地圖,以備參考。一者乃三江學院提供的明代地圖(附今日略圖作為底色),一者為按有關地名之經緯度而隨機取得的谷歌地圖。古人治學有謂「左圖右史」,希望本網頁之製作對廣大用家帶來方便。於此謹向三江學院許教授及其合作人致謝。

     

  15. 成語彙輯
    • 成語乃漢語的核心元素,對語文教育和文化傳承都有重大意義。為方便用者,本網站選取了一些有代表性的成語辭典,編列其條目(不含解釋部分),務求把傳世之成語盡量羅列。所收的成語辭典包括:
      1. 冷玉龍、楊超、韋一心主編:《成語辭海》,上海:上海辭書出版社,2014年8月。
      2. 劉潔修:《漢語成語源流大辭典》,北京:開明出版社,2009年12月。
      3. 漢語大詞典編纂處編:《漢語成語大辭典》,上海:上海辭書出版社,2009年6月。
      4. 王濤等編:《中國成語大辭典》(新一版),上海:上海辭書出版社,2017年1月。
      5. 商務印書館編輯部主編:《商務成語大詞典》,香港:商務印書館,2016年4月。
      6. 陳鐵君主編:《遠流活用成語辭典》,臺北:遠流出版事業股份有限公司,2017年1月。
    • 六部成語辭典所收成語數量:
      《成語辭海》 60948
      《漢語成語源流大詞典》 51968
      《漢語成語大辭典》 24797
      《中國成語大辭典》 17111
      《商務成語大詞典》 10265
      《遠流活用成語辭典》 5179
      綜合總數: 84953
        
    • 首四部成語辭典以簡體編就,書中所用簡體字現一律轉為繁體。為貫徹搜索,部分異體字也被統一,如「床」統一為「牀」、「瓮」統一為「甕」等。
    • 各辭典對成語的定義不同,有的只收錄四字成語,如《成語辭海》、《中國成語大辭典》和《商務成語大詞典》;有的則包括各種俗語、諺語,如《漢語成語源流大辭典》、《漢語成語大辭典》和《遠流活用成語辭典》。
    • 成語之排列:
      • 本字庫所收之84953個成語分別由6051個字元構成。這些成語字元可以如下三種方式排列:
        1. 「按筆畫排」:按字元的筆劃排列。
        2. 「按詞數排」:按含字元之成語數量以遞升或遞減的順序排列。
        3. 「按部首排」:按字元的部首排列。
    • 成語之搜索:
      • 「成語搜索」可搜索單字或字串。搜索字串時,若輸入「天地」,可檢查「天地」二字連用的成語,如「別有天地」、「經緯天地」;如輸入「天 地」(中間加上空格),可檢索包含「天」和「地」但不一定連用的成語,如「冰天雪地」、「天南地北」等。
      • 「搜索範圍」可搜索指定一本或多本成語辭典,亦可選擇搜索所有辭典。選擇「AND」邏輯運符表示只顯示所有標選的辭典都有收錄的成語;「OR」運符表示任何一本已標選的辭典有收錄的成語都會顯示。
      • 搜索結果有兩種排序及顯示方式:
        1. 「成語/UTF8」:按照UTF-8(8-bit Unicode Transformation Format)字元編碼排序。
        2. 「通用度」:按照每個成語在六本成語辭典中收錄的情況計算而成。收錄的辭典越多,該成語的通用度數值越高,排序越前。在本資料庫的設計下,6部成語辭典中收詞較少的辭典會給予較大的加權比重。

     

  16. 非字頭之追蹤
    • 本字庫建立的字頭,到2018年夏為止達15,395 個。若使用者所搜查之漢字並不在此列,字庫仍會儘量追蹤有關漢字的可能資料。首先,如所查漢字屬簡化字,則本字庫會提供與其相應的繁體字的超連結,以備參考。如所查者是極為冷僻的漢字,而該字又未被本字庫訂立為字頭者,則字庫會按追蹤所得之結果,儘量提供與該字有關的下列資料:
      1. 《漢語大字典》第一版及第二版中之頁碼
      2. 《康熙字典》通行版頁碼及超連結,指向由本字庫多年前自行開發的頁面,頁碼後會附上該字於該頁中出現之序號,以便查考
      3. Unicode編碼及超連結
      4. 若該字乃《說文解字》之字頭,則提供相關超連結

     

    香港中文大學‧人文電算研究中心
    2018.07.31