基于雙向lstmn神經(jīng)網(wǎng)絡(luò)的中文分詞研究分析

基于雙向lstmn神經(jīng)網(wǎng)絡(luò)的中文分詞研究分析

ID:35188101

大小:7.26 MB

頁數(shù):74頁

時(shí)間:2019-03-21

基于雙向lstmn神經(jīng)網(wǎng)絡(luò)的中文分詞研究分析_第1頁
基于雙向lstmn神經(jīng)網(wǎng)絡(luò)的中文分詞研究分析_第2頁
基于雙向lstmn神經(jīng)網(wǎng)絡(luò)的中文分詞研究分析_第3頁
基于雙向lstmn神經(jīng)網(wǎng)絡(luò)的中文分詞研究分析_第4頁
基于雙向lstmn神經(jīng)網(wǎng)絡(luò)的中文分詞研究分析_第5頁
資源描述:

《基于雙向lstmn神經(jīng)網(wǎng)絡(luò)的中文分詞研究分析》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、:一r曾玲變...巧;.f../巧聲:;麵.;7年:J.運(yùn)霞.蒙.掉%馬^.蔡雜韓敏心,嘯..xf£.V:帶兵>.r襄:技覆擁賣募識(shí)暴當(dāng).蘇S/.:#材MV產(chǎn).警.r說泣.-;i讚私..調(diào)-...賣麗!細(xì)以堿/暴藏r知削藻烹’麵為緣.;.;鮮:繁庫V藝槪A變.;.生論b研究:t心;祖\少瑞節(jié).#申扛杉立.戶箸讀為苗,:-:.‘,々.-.,P..。一?:.,.瓣身^^鼓4巧麵神琴題昇,滿':戶^:I麵;暢5uC;K;\姓名讀:屬蘿?。浚牐牐荆堂琮gI.部.u.;轉(zhuǎn)-.,:.方向義訊魄

2、,尸-;J.接教師?。媸冢牐牐。埽?,:.!.r暮誨—V分。當(dāng)咳八禱i;第篡繞如狼苗養(yǎng)狼占.v-t:巧;.游:?:雲(yún).^:.^鍵滬言,於,#i:讀^:巍—-^.^i.滅..讀譯^聲.帶編:^d想藥I象|嚇¥續(xù).學(xué)號(hào):MGB32006論文答辯日期:2016年5月25曰指導(dǎo)教師;(簽字)若心或一、基于雙向LSTMN神經(jīng)網(wǎng)絡(luò)的中文分詞研究分析作者:黃積楊指導(dǎo)教師:趙志宏教授南京大學(xué)研究生畢業(yè)論文(申請(qǐng)工學(xué)碩±學(xué)位)

3、南京大學(xué)軟件學(xué)院2016年5月ChineseWordSegmentationAnalysisbasedonBidirectionalLSTMNRecurrentNeuralNetworkHuanJiYang,gSubminartialfulfllmthrirtrittedpientofeequemensfothedegreeofMasterofEnineeringgSuervisedbpyProfessorZhaoZhiHon,g

4、SoftwareInstituteNANJINGUNIVERSITYNaningChinaj,Ma16y,20南京大學(xué)碩±論文^摘要,利用算法實(shí)現(xiàn)分詞的方法基本上是基于字典在2002年之前、詞庫匹配的。一在2002年發(fā)表了第篇基于字標(biāo)注的分詞論文,首次把中文分詞抽象成序列生一成序列的問題,隨后在些模型上實(shí)現(xiàn)的基于字標(biāo)注的分詞系統(tǒng)取得了不錯(cuò)的效果,如:最大滴模型、隱含馬爾可夫模型、條件隨機(jī)場(chǎng)模型、支持向量機(jī)模型等。目前主流的分詞系統(tǒng)使用的是條件隨機(jī)場(chǎng)模型。在

5、2006年深度學(xué)習(xí)的概念被提出,隨后應(yīng)用于計(jì)算機(jī)視覺、自然語言處理、語音識(shí)別等領(lǐng)域,,成功地取得諸多突破性的進(jìn)展其中的遞歸神經(jīng)網(wǎng)絡(luò)更是被廣泛運(yùn)用于解決詞性標(biāo)注、翻譯、命名實(shí)體識(shí)別等自然語言處理問題。把多數(shù)自然語言處理問題抽象成序列生成序列,并采用合適的遞歸神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)處理,成為當(dāng)前的熱點(diǎn)和主流。基于字標(biāo)注的分詞本質(zhì)上是序列生成序列的問題,因此本論文中,采用改進(jìn)的雙向長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)中文分詞。改進(jìn)的長(zhǎng)短期記憶單元與標(biāo)準(zhǔn)的長(zhǎng)短期記憶單元不同在于,采用存儲(chǔ)帶來保存過去的信息,并通過注意

6、力機(jī)制合理利一用這些信息,個(gè)隱藏狀態(tài)向量而造成的信息壓縮避免僅僅向后傳遞。標(biāo)準(zhǔn)的長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)能很好地解決詞與詞之間遠(yuǎn)距離的依賴關(guān)系,而雙向長(zhǎng)短期記一憶神經(jīng)網(wǎng)絡(luò)能捕獲到句子中個(gè)詞的上下文信息,從而網(wǎng)絡(luò)結(jié)構(gòu)能更好地理解語義并正確實(shí)現(xiàn)分詞。同時(shí)提出標(biāo)準(zhǔn)雙向長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)層加注意力機(jī)制層的。方式實(shí)現(xiàn)中文分詞,研究在不同位置上添加注意力機(jī)制對(duì)中文分詞的影響關(guān)鍵詞:深度學(xué)習(xí)、長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)、中文分詞、注意力機(jī)制I南京大學(xué)碩±論文abstractAbstractBefor

7、e2002themethodofwordsementationthatusinanalorithmtoimplement,ggg.isessentiallbasedonadictionarandthesaurusmatchingIn2002thefi巧taeraseyy,ppbonthewordlabeltosementationispublished.ForthefirsttimetheChinesewordg,segm

8、entationisabstractedastheproblemofsequencegenerationsequence.SubsequentlythewordsegmentationsystemthatimplementedbasedonwordlabelonsomemodeiltMEM.lshasachev

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。