畢業(yè)設計(論文)-現(xiàn)代漢語標注語料,樹庫文檔”_轉換成XML文檔

畢業(yè)設計(論文)-現(xiàn)代漢語標注語料,樹庫文檔”_轉換成XML文檔

ID:35583066

大?。?.48 MB

頁數(shù):57頁

時間:2019-03-30

畢業(yè)設計(論文)-現(xiàn)代漢語標注語料,樹庫文檔”_轉換成XML文檔_第1頁
畢業(yè)設計(論文)-現(xiàn)代漢語標注語料,樹庫文檔”_轉換成XML文檔_第2頁
畢業(yè)設計(論文)-現(xiàn)代漢語標注語料,樹庫文檔”_轉換成XML文檔_第3頁
畢業(yè)設計(論文)-現(xiàn)代漢語標注語料,樹庫文檔”_轉換成XML文檔_第4頁
畢業(yè)設計(論文)-現(xiàn)代漢語標注語料,樹庫文檔”_轉換成XML文檔_第5頁
資源描述:

《畢業(yè)設計(論文)-現(xiàn)代漢語標注語料,樹庫文檔”_轉換成XML文檔》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。

1、摘要隨著Internet的興起與發(fā)展,大量科技論文轉化成Internet上的信息資源。傳統(tǒng)的基于HTML(HypertextMarkupLanguage,超文本標記語言)的網頁搜索實現(xiàn)效果并不理想,原因在于HTML只是一種表達的技術,并不揭示文檔內容的語義特性。XML的出現(xiàn)把網絡表達的語言集合推進了一大步。利用XML語言標注科技論文,可以精確地表達信息含義,使得不同的應用系統(tǒng)理解相同的意義,從而為信息的查詢、交換和計算提供新的載體。XML最大的特點在于內容和顯示的分離。由于內容和顯示分開,一個XML文檔就可以配上不同

2、的樣式表進行顯示。XML通過數(shù)據(jù)文檔、XML模式(DTD或Schema)、樣式單三個分離的部分來描述數(shù)據(jù)。我們這里只是用到了XML模式-----DTD,主要是討論一下DTD和數(shù)據(jù)文檔結合起來生成XML文檔。我的論文主要做了以下三個工作:1.對于漢語語料庫的文本文檔,進行轉換,生成XML文檔。2.對于符合樹庫標準的文檔,進行轉換,生成XML文檔。3.將XML文檔,根據(jù)DOM標準,以樹形顯示在屏幕上。關鍵字:XML,DTD,DOM,漢語語料庫,樹庫.57——ABSTRACTAlongwiththeInternetrise

3、anddevelopment,largequantitytechnologythesisconversioninformationontheInternetresources.WebpagethattraditionofaccordingtotheHTML(HypertextMarkupLanguage)searchfortorealizetheresultandthedisregardthink,andthereasonjustconsistintheHTMLthetechniqueofakindofexpress

4、ion,notannouncetopublicthetextfilethecontents'slanguagerighteousnessthecharacteristic.XMLthatemergencethatlanguageexpressesthenetworkgatherpushforwardedabigstep.MakeuseofingtheXMLthelanguagemarktonotethetechnologythesis,andcanbythesquareexpressesinformationmean

5、ing,makethedifferentandappliedsystemtocomprehendsameofmeaning,frombutfortheinformation'ssearch,exchangewithcomputeofferingnewcarry.BiggestcharacteristicsoftheXMLconsistinsthecontentswiththemanifestation'sseparation.Becauseofthecontentswithshowseparate.PartthatX

6、MLpasssinglethreeseparationsesofmode(DTDorSchema),stylesoffile,XMLofdatatextstodescribethedata.WejustusedtheXMLthemodedhered-----DTD,primarilyisadiscussiononceDTDiswiththedatatextfiletheknotputtogetherthefileofbornXMLtext.Thedesignofmypaperprimarilydidedbelowth

7、reework:1.FortheChineselanguage“l(fā)anguagemarkedbank”'stextthistextfile,proceedconversion,fileofbornXMLtext.2.Formatchthetreebankthetextofthefile,andproceedconversion,fileofbornXMLtext.3.XMLtextfile,accordingtotheDOMstandard,showattoholdtheacttopwiththetreeform.K

8、eywords:XML,DTD,DOM,LanguageMarkedBank,Treebank,ViewasTree.57——目錄緒論8第一章 XML簡介91.1標記語言91.2XML的起源和目的101.3XML的語法121.3.1標記語法121.3.2字符121.3.3命名131.3.4元素131.4小結16第二章文檔類型定義(DTD)簡介1

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內容,確認文檔內容符合您的需求后進行下載,若出現(xiàn)內容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。