甲骨文字形動(dòng)態(tài)描述庫及其字形生成技術(shù)研究ppt課件

甲骨文字形動(dòng)態(tài)描述庫及其字形生成技術(shù)研究ppt課件

ID:27542117

大?。?95.00 KB

頁數(shù):24頁

時(shí)間:2018-12-03

甲骨文字形動(dòng)態(tài)描述庫及其字形生成技術(shù)研究ppt課件_第1頁
甲骨文字形動(dòng)態(tài)描述庫及其字形生成技術(shù)研究ppt課件_第2頁
甲骨文字形動(dòng)態(tài)描述庫及其字形生成技術(shù)研究ppt課件_第3頁
甲骨文字形動(dòng)態(tài)描述庫及其字形生成技術(shù)研究ppt課件_第4頁
甲骨文字形動(dòng)態(tài)描述庫及其字形生成技術(shù)研究ppt課件_第5頁
資源描述:

《甲骨文字形動(dòng)態(tài)描述庫及其字形生成技術(shù)研究ppt課件》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。

1、甲骨文字形動(dòng)態(tài)描述庫及其字形生成技術(shù)研究2012.11.4安陽師范學(xué)院栗青生甲骨文數(shù)字化工作簡介甲骨文綴合——圖像處理(中美聯(lián)合智能信息處理實(shí)驗(yàn)室)甲骨文編碼——字形描述庫(數(shù)字化甲骨文工程技術(shù)研究中心)甲骨文考釋——圖文資料庫(中文信息處理實(shí)驗(yàn)室)甲骨文數(shù)字化工作簡介主要內(nèi)容1、甲骨文數(shù)字化問題2、甲骨文字形動(dòng)態(tài)描述庫3、字形生成技術(shù)4、應(yīng)用展望1、甲骨文數(shù)字化問題甲骨文數(shù)字化問題多年來,在甲骨文數(shù)字化過程中,一直存在兩個(gè)難以解決的問題:一是甲骨文難以定形,即甲骨文不像現(xiàn)代漢字,很難確定每一個(gè)甲骨文字的字形結(jié)構(gòu)和類

2、型;二是甲骨文字難以輸入計(jì)算機(jī)。由于過度“規(guī)范化”,其中很多字形已經(jīng)脫離了原始字形所表達(dá)的意義,有的還存在著部件結(jié)構(gòu)和位置的錯(cuò)誤2、甲骨文字形動(dòng)態(tài)描述庫例如:甲骨文合集中的第29529和27667片,如果不利用拼合區(qū)的兩個(gè)殘字來綴合,很難說明這兩片原來是在一起的。舉例3、利用漢字字形描述庫進(jìn)行殘字綴合和識(shí)別字形描述庫的由來源于對(duì)我國古代文化的深入研究。三千多年前,商朝人就知道借助動(dòng)物的骨頭(龜甲)來計(jì)算(占卜)未來,到了周朝,演繹出了舉世聞名的“易經(jīng)”。龜甲本身不能計(jì)算未來,但通過人工在甲骨上進(jìn)行鑿洞和灼燒的方法使龜

3、甲產(chǎn)生不同的紋理,可以判斷未來的天氣狀況,我外星人的數(shù)學(xué)悖論驚人相似。數(shù)學(xué)悖論:悖論的故事說,外星人可以只在鐵棍上劃一道痕,就可以記錄全人類的知識(shí)信息——怎么做到的呢?理論上可以用【無理數(shù)】來進(jìn)行無限的數(shù)據(jù)存儲(chǔ)。劃痕的長度比例是一個(gè)無理數(shù):0.21873619876538173591873561835……由于無理數(shù)的小數(shù)點(diǎn)后數(shù)位容量是無限的,故可以用于編碼存儲(chǔ)無限量的信息。關(guān)于字形描述庫字形描述庫是根據(jù)文字計(jì)算的需求,按照文字的表征特性,對(duì)文字特征進(jìn)行可行性編輯和編碼后形成的新的數(shù)據(jù)表,從而依據(jù)新的數(shù)據(jù)表對(duì)字形進(jìn)行一

4、系列計(jì)算的過程。目前,我們已經(jīng)建立了甲骨文字形動(dòng)態(tài)描述庫、小篆字形動(dòng)態(tài)描述庫和部分現(xiàn)代漢字的動(dòng)態(tài)描述庫和漢字字庫的區(qū)別(以甲骨文為例)甲骨文拓片字庫制作系統(tǒng)字庫編碼方案字形采集輪廓提取字形編輯字模生成文字編碼字形輸入甲骨文拓片特征提取算法字形采集骨架抽取DDLJCR字庫特征庫字形生成字庫的形成及使用字形描述庫的形成及使用甲骨文字形動(dòng)態(tài)描述庫是我們最早建立的動(dòng)態(tài)描述庫使用這一描述庫我們開發(fā)了甲骨文圖文編輯系統(tǒng),開發(fā)了甲骨文特征輸入方法,并生成了刀體甲骨文,軟件筆體甲骨文和曲線體甲骨文等數(shù)十種字形,三體甲骨文三體甲骨文刀

5、體軟筆體曲線體甲骨文字形描述庫的建立漢字字形描述庫的建立規(guī)則:(1)漢字描述庫由漢字向量組成。(2)庫中的每一個(gè)字向量由點(diǎn)集和關(guān)系組成,其中:字、點(diǎn)集和關(guān)系的表達(dá)式是:字:=其中:P(i)表示特征點(diǎn)元向量集,漢字筆畫的起始、交叉、拐點(diǎn)等都可以成為特征點(diǎn)元向量Q表示特征點(diǎn)元向量集之間的關(guān)系,特征點(diǎn)關(guān)系有兩種,一是包含(B),二是連接(J)。筆段:當(dāng)且僅當(dāng)P(i)非空,且特征點(diǎn)元向量之間是包含關(guān)系.筆元:當(dāng)且僅當(dāng)P(i)非空,且特征點(diǎn)元向量之間是連接關(guān)系。特別地,i=2時(shí)筆元是特殊筆元,稱孤立筆元。舉例如

6、圖所示的前兩個(gè)筆元第一個(gè)筆元:特征點(diǎn)元向量集為{p1,p2,p3,p4,p5,B},有四個(gè)筆段。第二個(gè)筆元:特征點(diǎn)元向量集為{p6,p7,p8,p9,p10,B}有四個(gè)筆段?!璓1P2P3P4P5P6P7P8P9P10筆元的逆向工程——筆畫的再生由筆畫抽象成筆元從而生成的字形描述庫,在應(yīng)用過程中可以通過筆畫的再生動(dòng)態(tài)生成漢字庫、錯(cuò)字庫和其它字形庫。甲骨文筆元的再生過程示意圖4、應(yīng)用展望使用字形描述庫對(duì)甲骨文字進(jìn)行建模 從而實(shí)現(xiàn)甲骨文字形的綴合字形動(dòng)態(tài)描述殘字特征分析、特征匹配、分類、識(shí)別輸出殘字字形建模系統(tǒng)應(yīng)用一:

7、甲骨文字形查詢系統(tǒng)輸入殘字的特征值查找相似甲骨文,進(jìn)而查詢對(duì)應(yīng)甲骨文拓片。錯(cuò)字的動(dòng)態(tài)生成和建模由筆畫抽象成筆元從而生成的字形描述庫,在應(yīng)用過程中可以根據(jù)需要?jiǎng)討B(tài)生成漢字庫、錯(cuò)字庫和其它字形庫。應(yīng)用三:文字綴合游戲謝謝!請(qǐng)各位專家提出寶貴意見

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。