基于語義的網(wǎng)絡流行語趨勢分析.pdf

基于語義的網(wǎng)絡流行語趨勢分析.pdf

ID:50073927

大?。?.56 MB

頁數(shù):56頁

時間:2020-03-04

基于語義的網(wǎng)絡流行語趨勢分析.pdf_第1頁
基于語義的網(wǎng)絡流行語趨勢分析.pdf_第2頁
基于語義的網(wǎng)絡流行語趨勢分析.pdf_第3頁
基于語義的網(wǎng)絡流行語趨勢分析.pdf_第4頁
基于語義的網(wǎng)絡流行語趨勢分析.pdf_第5頁
資源描述:

《基于語義的網(wǎng)絡流行語趨勢分析.pdf》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在學術論文-天天文庫

1、、'X一:,占:輪^.戶Vr.峨年、心於巧種百‘.;>::-於.—心,;:,,説1:,每爲^&;參歌護嘆導題嶋羣蕉奪裝茲敏論誦攀蘇VM,乂乂於薄瞧雜靡‘議’^J.;々%護碩丈研巧生學位論支.氣'''''方-治二T>::繁劈:#沿滬黃;r滬;獵'■'.占■心巧---'■躬::..■、巧T2\'K節(jié)實y.矜穀^f準豕'-’'、.巧;金粹皆;心,;苦^巧堿獻二\^雜、輪績義書每^:幾^、;、.謂譯麵齡或‘殘館纖釋鈍桑為..'.一''護.’:,v味心,:;知如雄早

2、鍵睹冷.嚴:基于語義的網(wǎng)絡流行語趨勢分柄;普勞巧反:f,—^.::■'‘'’':-.:''-取'^命'1::苗馬繡拓迄< ̄讀等衰更巧-議養(yǎng)靡讓編戀挈網(wǎng)’峰學'掙等付請子常鍵義霉難崇議誦賺義m-,爾‘學爭2〇141104010^務方誇;.?輪品;苗,,唉\苗£;皆遠雜雀娩觸辨);,^苗發(fā)雜辦績資荀韋:’;軟件工程V./^八巧教S向V.v,心說葬逼單.-、.段建勇:山,編部設:;取辦一八嘴夢瑪賴觀藏I‘'。.';.''.、.^’、'^^/V.'切、;;^:'鐘;>:皆聲碼.

3、V巧兵‘r.:?v;::打:3^;域為始,而,呼;;;2蚊案6月12鼻辦麗義薪.纖燙I.私龍職該:辨響巧乂.皆3敎婷舞;巧滬f爾蠟訟興V;與私祥琪斬茂讀為挺誤議緯麵議議議騎藝攀‘:議猶論議接論論變變卿,雜蕊權額屬置擁我"'■-■\:^r;V^KV..北方工業(yè)大學學位論文原創(chuàng)性聲明本人鄭重聲明:所呈交的學位論文,是本人在導師的指導下,獨立進行硏究工作所取得的成果。除文中己經(jīng)注明引用的內(nèi)容外,本論文不含任何其他個人或集體己經(jīng)發(fā)表或撰寫過的作品成果。對本文的研究做出重要貢獻的個人和集

4、體,均己在文中W明確方式標明。本人完全意識到本聲明的法律結果由本人承擔。學位論文作者簽名:日期:2>0/)年月作日學位論文使用授權書學位論文作者完全了解北方工業(yè)大學有關保留和使用學位論文的規(guī)定.即:研究生在校攻讀學位期間論文工作的知識產(chǎn)權單位屬北方工業(yè)大學。學校有權保留并向國家有關部口或機構送交論文的復印件和電子版,義許學位論文被查閱和借閱;學校可W公布學位論文的全部或部分內(nèi)容可W允許采,用影巧、縮印或其它復制手段保存、匯編學位論文(保密的學位論文在解密.后適用于本授權書)。□保密論文注

5、釋;經(jīng)本乂申請批準,學校,本學位論文定為保密論文,密級:期限:曰起至年月曰.年,自年月止后適用本授權書。,解密^非保密論文注釋:本學位論文不屬于保密范圍.適用本授權書。<本人簽名:付末〇日期:WA/心■、導師簽名;日期:I。!—!叫、戶I基于語義的網(wǎng)絡流行語趨勢分析摘要在自然語言處理方面,構建可計算的詞語、文本語義特征是多數(shù)自然語言一處理任務的基礎。本文提出種詞語語義相似度計算方法,通過結合文本之外的先驗知識,提高在特征稀疏情況下的模型準確率;同時結合詞語語義相似

6、度entn-Mean計算與LDA(LatDirichletAllocatio定義文本間的語義距離,通過Ks聚)類獲取語料中的事件。兩個方法可W結合外部知識改進對詞語、文本向量化的過程,提升基于向量的相似度計算的效果。論文的兩個主要方面分別為:。改進詞語語義相似度計算:向量化是詞語的語義可計算的關鍵本文提出一了種結合詞語關系的改進詞語語義向量計算法。該方法基于Word2Vec的思路,在通過當前詞語預測上下文詞語的基礎上,同時預測詞語在詞語關系中的鄰接位置。模型將詞語經(jīng)過編碼矩陣得到語義向量,再經(jīng)過

7、解碼矩陣得到對上下文詞語與詞語關系等稀疏特征的預測。通過模型參數(shù)對誤差的梯度來迭代調(diào)整模型,最終得到詞語到語義向量的映射方法。該方法可W用過添加額外的詞語關系網(wǎng)來緩解文本本身的特征稀疏情況,提高詞語語義相似度計算的準確性。改進基于LDA的事件發(fā)現(xiàn):基于LDA的事件發(fā)現(xiàn)是通過LDA模型得到文本。的主題詞向量,并通過主題詞向量之間的余弦距離聚類得到文本簇的方法本文提出了一種融合了詞語語義相似度計算與詞語在頻域特征的文本語義距離計算方法,進而改進了基于LDA的事件發(fā)現(xiàn)算法。首先將文本根據(jù)時間窗分割后進

8、行LDA計算得到文本的主題詞向量,并根據(jù)融合詞語語義相似度的距離定義進行K-Mean聚類得到時間窗粒度的事件后根據(jù)主題詞的詞頻特征合并時間s;然。>窗粒度的事件,最終得到事件該方法可^1通過融合1額外文本中的詞語語義相似度信息,改善對短文本事件發(fā)現(xiàn)的準確性。

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。