資源描述:
《畢業(yè)設(shè)計(jì)(論文)-現(xiàn)代漢語標(biāo)注語料,樹庫文檔”_轉(zhuǎn)換成xml文檔》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、摘要隨著Internet的興起與發(fā)展,大量科技論文轉(zhuǎn)化成Internet上的信息資源。傳統(tǒng)的基于HTML(HypertextMarkupLanguage,超文本標(biāo)記語言)的網(wǎng)頁搜索實(shí)現(xiàn)效果并不理想,原因在于HTML只是一種表達(dá)的技術(shù),并不揭示文檔內(nèi)容的語義特性。XML的出現(xiàn)把網(wǎng)絡(luò)表達(dá)的語言集合推進(jìn)了一大步。利用XML語言標(biāo)注科技論文,可以精確地表達(dá)信息含義,使得不同的應(yīng)用系統(tǒng)理解相同的意義,從而為信息的查詢、交換和計(jì)算提供新的載體。XML最大的特點(diǎn)在于內(nèi)容和顯示的分離。由于內(nèi)容和顯示分開,一個(gè)XML文檔就可以配上不同的樣式表進(jìn)行顯示。XML通過數(shù)據(jù)文檔、XML模式(DTD或Schema)
2、、樣式單三個(gè)分離的部分來描述數(shù)據(jù)。我們這里只是用到了XML模式-----DTD,主要是討論一下DTD和數(shù)據(jù)文檔結(jié)合起來生成XML文檔。我的論文主要做了以下三個(gè)工作:1.對于漢語語料庫的文本文檔,進(jìn)行轉(zhuǎn)換,生成XML文檔。2.對于符合樹庫標(biāo)準(zhǔn)的文檔,進(jìn)行轉(zhuǎn)換,生成XML文檔。3.將XML文檔,根據(jù)DOM標(biāo)準(zhǔn),以樹形顯示在屏幕上。關(guān)鍵字:XML,DTD,DOM,漢語語料庫,樹庫.57——ABSTRACTAlongwiththeInternetriseanddevelopment,largequantitytechnologythesisconversioninformationontheIn
3、ternetresources.WebpagethattraditionofaccordingtotheHTML(HypertextMarkupLanguage)searchfortorealizetheresultandthedisregardthink,andthereasonjustconsistintheHTMLthetechniqueofakindofexpression,notannouncetopublicthetextfilethecontents'slanguagerighteousnessthecharacteristic.XMLthatemergencethatla
4、nguageexpressesthenetworkgatherpushforwardedabigstep.MakeuseofingtheXMLthelanguagemarktonotethetechnologythesis,andcanbythesquareexpressesinformationmeaning,makethedifferentandappliedsystemtocomprehendsameofmeaning,frombutfortheinformation'ssearch,exchangewithcomputeofferingnewcarry.Biggestcharac
5、teristicsoftheXMLconsistinsthecontentswiththemanifestation'sseparation.Becauseofthecontentswithshowseparate.PartthatXMLpasssinglethreeseparationsesofmode(DTDorSchema),stylesoffile,XMLofdatatextstodescribethedata.WejustusedtheXMLthemodedhered-----DTD,primarilyisadiscussiononceDTDiswiththedatatextf
6、iletheknotputtogetherthefileofbornXMLtext.Thedesignofmypaperprimarilydidedbelowthreework:1.FortheChineselanguage“l(fā)anguagemarkedbank”'stextthistextfile,proceedconversion,fileofbornXMLtext.2.Formatchthetreebankthetextofthefile,andproceedconversion,fileofbornXMLtext.3.XMLtextfile,accordingtotheDOMst
7、andard,showattoholdtheacttopwiththetreeform.Keywords:XML,DTD,DOM,LanguageMarkedBank,Treebank,ViewasTree.57——目錄緒論8第一章 XML簡介91.1標(biāo)記語言91.2XML的起源和目的101.3XML的語法121.3.1標(biāo)記語法121.3.2字符121.3.3命名131.3.4元素131.4小結(jié)16第二章文檔類型定義(DTD)簡介1