ENGLISH  |   聯絡我們  |   中央研究院
首頁 簡介 徵求授權對象 制式契約 研發人員專頁 相關網站 育成暨萌芽中心 聯絡我們
  首頁 -> 徵求授權對象 列印本頁 網站更新日期: 
國際電腦漢字及異體字知識庫

本院覽號:05T-1041205

創作人:何建明

智財權:專門技術 KNOW-HOW

摘要:

本系統提供使用者利用字形相關資訊或直接用電腦編碼查詢到所要需的漢字,進而得到此字體的相關屬性以及相關異體字,首先使用者需先對漢字構形以及中文編碼有基本的認識,以下是簡略的介紹。

【部件與構字式】:漢字可以說是由許許多多的小部件所組成,部件就像是小小的建築積木,每一個漢字都是由數個部件堆砌而成;根據中央研究院文獻處理實驗室的統計,所有的基本部件總數為1316個,也就是說,每一個漢字都可以由這些基本部件來組成;當一個漢字用一組部件來表示的時候,這一組部件我們稱之為構字式。
稍微了解電腦資料處理的人都應該知道,在電腦開始使用的時候,所有的字都只用 1byte 來儲存, 1byte 包含 8bits,每個 bits 都只能表示 on/off, 也就是 1byte 只能表示 0000 0000 到 1111 1111 的編碼範圍, 只有 256 個編碼空間,這對中文而言,是不夠的。

我們知道中文字在目前常見的電腦上是由兩個位元組(two bytes) 所編碼組成的。 最常見的編碼方式有台灣地區所通行的 Big5 編碼,及大陸地區所使用的 GB 編碼。而且開頭的位元組幾乎都是大於 128 的數值,也就是所謂 non-ASCII 碼的範圍(ASCII 是指小於 128 的編碼)。

可能的應用範圍:

中文字處理

此項發明的優點:

雖然常用的 Big5 已經使用 2bytes 來表示中文字,但是 2bytes = 16bits = 2^16 = 65536 個編碼空間, 以 Big5 的標準而言,為了要和 ASCII 能夠相容,只能使用兩萬多字, 現存的中文字最少在七萬以上,造成許多字在 Big5 的系統下, 無法使用。在加上中文標準繁多,卻又沒有最後的標準規格, 各家廠商所實做產品也就未必相容。 最明顯的例子就是日文平假片假名, 在這些中文編碼中並不是每個都包含, 當遇到所謂的「Big5日文」時,就會產生許多問題。

為了解決編碼字數不足的問題,我們可以使用國際標準ISO/IEC 10646-1: 1993廣用多八位元編碼字元集(unicode),此為一套用來表示、傳輸、交換、處理、儲存、輸入和表達等多用途的全球編碼標準。目前因為有Unicode Consortium組織的全力推廣與實作介紹,故得到全球各大廠商與資訊界的重視。這套編碼字元集,幾乎已包括了全球已定義好完整字集的各種語言文字,並且仍在持續擴充中。

智財技轉處聯絡人:翁嘉煌 chweng@gate.sinica.edu.tw 02-27872509

95年度中央研究院最佳網站
資訊科學研究所
讀者喜好文章深度偵測技術
中文剖析系統
Micro Air Pollution Sensing System (MAPS)
中文知識表達系統-廣義知網
補助審查專案管理系統
臺北歷史地圖散步
國際電腦漢字及異體字知識庫
Bounty Workers - 線上微型案件媒合平台
次世代定序線上分析平台1.0版
中文詞知識庫
中文分詞語料庫
快速全域最佳樣板比對演算法
用於自然語言事件辨識的方法跟電腦程式產品
個人化的網頁瀏覽系統
自半結構化主文中摘取資料之系統及方法
結合即時視訊與螢幕展示的同步遠距教學系統
數位化浮水印
電腦系統主要圖框處理裝置
視訊資料之編碼與解碼
XML文件編輯器
資料庫檢索方法與系統
行動網路代理器
可容忍幾何處理的數位影像赫序方法與系統
供多人共同操作單一電腦螢幕之主動是操作控制權轉移裝置及方法
非對稱數位影像浮水印技術
檢索輸入法
基於中文字型架構之反向人機辨識碼之辨識方法
建立迴路電力資訊模型之方法
電腦輔助影像故事創作系統
影像放大方法
高速列車用移動路由器系統及其無縫換手控制方法
基於高斯多項組合模型之音樂標籤自動標記技術
基於同質段落偵測與分類器集成之音樂標籤自動標記技術
使用LIBOR Market Model與Proportional Hazard Model的雙因子Monte Carlo評價法
客製化並納入專家觀點的投資組合建議模組
金融商品評價模組
中文句結構樹資料庫
語意分析暨文件分類技術
「應用群體運算之位置感知服務平台」(PLASH)
SQLMR 雲端資料庫管理系統
紀錄片穩定化技術
視訊監控系統
ASQA 中研院開放式中文問答系統
資料隱私保護軟體 Cellsecu
數位典藏影音資料庫
中文電腦缺字解決方案(漢字構形資料庫)
具有新詞辨識能力的中文斷詞系統
漢語平衡語料庫
線上會議註冊管理系統
多媒體及文件辨識、檢索與管理系統
多媒體及文件辨識、檢索與管理系統

  智財技轉處  Copyright © 2005 智財技轉處 版權所有
  11529 台北市南港區研究院路二段128號  |  電話:+886-2-2787-2554  |  傳真:+886-2-2651-8049  |