當前位置:縱橫輸入法首頁>>教學經驗交流>>第二屆縱橫碼教學經驗交流會論文集 縱橫碼如何掛接在WINDOWS 95下 縱橫漢字編碼法是一種具有直觀性和科學性的漢字編碼法,它又是按照字形對漢字進行分類的一種分類法,採用「 0」-「9」十個數字作為基本碼元,同時它也作為筆形、部首及整個漢字的編碼,有點與四角號碼相似。它將漢字分為兩類:一類是無部首的漢字;一類是有部首的漢字,同時對漢字的部首又進行了挑選,選出了55個部首作為主部首,並對其進行編碼。縱橫漢字編碼法的取碼規則有:無部首的漢字取該漢字的四個角上的筆形編碼;有部首的漢字取該漢字的主部首編碼,再取字身編碼,若沒有主部首,則取副部首,再取字身編碼。詞的取碼規則:二字詞,取每個漢字的前三碼;三字詞,取每個漢字的前兩碼;四字詞,取第一、第四個漢字的前兩碼, 第二、第三個漢字再各取前一碼;多字詞,取第一個漢字的前兩碼,再取第二、三、四、五字的第一碼。 WINDOWS 95提供的輸入法生成器,可以讓您生成自己的WINDOWS 95中文輸入法。具體步驟如下:
在以上的步驟中,我們只需要一個縱橫漢字編碼的碼表源文件就能生成WINDOWS 95下的縱橫輸入法了。那麼如何建立碼表源文件(.txt文件)呢?根據WINDOWS 95中的「輸入法生成器」提供的「逆轉換」功能,我們可以將WINDOWS 95本身自帶的輸入法轉換成其對應的碼表源文件。利用寫字板觀察可以看出,碼表源文件由三個部分組成:〔Description〕段、〔Rule〕 段和〔Text〕段。介紹如下: 1.〔Description〕段
2. 〔Rule〕段 該段描述輸入法詞組的構成規則。規則表達式如下:
其中〔描述符〕可以為a、b、e中的任一個,p也可以用n代替。(WINDOWS 95碼表源文件中規定) 3.〔Text〕 段 該段是碼表正文部分,格式如下:〔漢字〕〔編碼〕〔構詞碼〕。〔漢字〕與〔編碼〕 之間無空格,〔編碼〕與〔構詞碼〕之間有一空格,〔構詞碼〕可以為空。〔漢字〕部分不允許有超過2個以上(包括2個)的單字或詞組,對於重碼的詞組需拆分成兩行以滿足格式的需要。 知道碼表源文件的格式,我們就可以構建縱橫漢字編碼的碼表源文件了(txt文件) 。假設文件名為zhhz.txt,構建如下:
對於編碼部分,可以根據縱橫漢字系統中的編碼庫文件(設為gaok.txt)利用FOX編碼來轉換得到。編碼思想:建立一個庫文件1(兩個字段word,c,6; code,c,30),利用數據庫命令append from gaok.txt type sdf向這個數據庫文件添加記錄,另建一個庫文件2(含一個字段,c,50),其中已有13條記錄(碼表源文件除去編碼部分後的內容)。對庫文件1中的兩個字段進行相加處理添加到庫文件2中,如果有重碼,則對code字段進行拆分處理。處理後,對庫文件2用命令copy to zhhz.txt type sdf生成文本文件(即縱橫漢字編碼的碼表源文件)。 有了這個碼表源文件,就可以把縱橫漢字輸入法掛接在WINDOWS 95下了。 利用這種方法其優點是簡單、方便,缺點是不能實現縱橫碼特有的功能,如自定義詞輸入、縮碼輸入、聯想輸入。另外,由於受系統限制,用該方法字詞碼本的記錄數不能超過65,700條,否則系統會出錯。
|
|||