基于dbscan的文本聚類算法研究

基于dbscan的文本聚類算法研究

ID:35056224

大?。?.01 MB

頁數(shù):64頁

時間:2019-03-17

基于dbscan的文本聚類算法研究_第1頁
基于dbscan的文本聚類算法研究_第2頁
基于dbscan的文本聚類算法研究_第3頁
基于dbscan的文本聚類算法研究_第4頁
基于dbscan的文本聚類算法研究_第5頁
資源描述:

《基于dbscan的文本聚類算法研究》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、校代^巧財巧義學(xué);^—JIANGXIUNIVERSITYOFFINANCEANDECONOMICS中圖分類號UDC碩+學(xué)位論文MASTERDISSERTATION論古顯目基于DDSCAN的文本聚類算法研究(中文)論奇邸日民ese過rchonTextClusteringAlgorithmBasedon【英文)DBSCAN劉宏超煉輝副教授作者導(dǎo)師碩壬軟件與通信工程學(xué)憐控兼里位申請學(xué)位堂科專#軟件工程研究方向數(shù)據(jù)挖據(jù)二〇—六年六月獨(dú)

2、創(chuàng)性聲明本人聲明所呈交的論文是我個人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作及取得的研究成果.盡巧巧知,除了文中特別加k乂標(biāo)注和致巧的地方外,論文中不包含其他人己祭發(fā)表或巧寫的研究成果,化不包含為獲得江西財經(jīng)大學(xué)或其他教育機(jī)構(gòu)巧學(xué)位或證書所一使用過的材料.與我同工作的同志對本研究所做的任何巧獻(xiàn)新己在論文中作了明巧的說明并表示了?;荨#崳姡桑崳姾灻掌谌绶浚崳?;的關(guān)子論文使用授權(quán)的說明本人完全了#注西財經(jīng)大學(xué)有關(guān)保留、使用學(xué)位論文的規(guī)定:學(xué)棱有權(quán)保留送交論文的義巧件,義許論文坡查巧和借,巧^閑1k乂采用影巧、;學(xué)??蓙V公布論文

3、的全部或部分巧容,可巧巧或其他義制手致保存論文?(保密的論文在解密后遵守此規(guī)定)簽名:巧簽名;日期;X若巧畔崎)目錄1緒論11.1研巧背景與意義1.21國內(nèi)外研究現(xiàn)狀21.3研究內(nèi)容和目的4.13.1研究內(nèi)容41.32研究0的.5.41論文組織結(jié)構(gòu)和內(nèi)容52文本挖掘的相關(guān)基礎(chǔ)概念72」文本挖掘72.2文本預(yù)處理72.2.]分詞技術(shù)72.2.2去停用詞82.3文本特征選擇方法92.4文本表示方法212.5相似度量方法1426.本章小結(jié)17

4、3常用的聚類方法183.1基于劃分的聚類方法183.2基于分層的聚類方法193.3基于密度的聚類方法193.4基于網(wǎng)格的聚類方法203520.基于模型的聚類方法36.本章小結(jié)214基于輸入?yún)?shù)確定的DBSCAN的文本聚類算法224.1問題描述2242DBSCAN22.算法介紹4-.3DDBSCAN算法介紹244.3.1特征空間選?。玻矗崳姡墸矗常泊_定掃描半徑R2643328..確定聚類最少對象數(shù)M4.4>.3算法流程^及細(xì)節(jié)2814.4實(shí)驗(yàn)過程

5、與結(jié)果分析304130.4.實(shí)驗(yàn)設(shè)置4.3].42評判標(biāo)準(zhǔn)432.4.3實(shí)驗(yàn)結(jié)果分析435.5本章小結(jié)5基于K-均值策略優(yōu)化的DBSCAN的文本聚類算法365.1問題描述365-36.2K均值算法介紹5S-DBSCAN法介紹37.3K算-、5.3.371確定K均值的初始中屯5.3.2確定對象掃描半徑R39451.3.3DBSCAN類簇合并方法425.3.4算法流程及細(xì)節(jié)455.4實(shí)驗(yàn)過程與結(jié)果分析5.45.41實(shí)驗(yàn)設(shè)置45.4.2評判標(biāo)準(zhǔn)545

6、5.43.實(shí)驗(yàn)結(jié)果分析485.5本章小結(jié)6總結(jié)與展望49496.1總結(jié)6250.展望5參考文獻(xiàn)1致謝55ContentsroducI1Inttiona.rchrnfi111民ese區(qū)ackgoundandSigicance1.2民esearchProgressinDomesticandOverseas21.3民esearchCon化nPurs4tsandpoe1.3.1ResearchContents413.2民esearchPurpos

7、e51.4OutlineoftheDiss州ai5ton2…………Textminingrelatedbasicconcets7p2.]Textmining72Ti7.2extPreprocessng2.2.]ChineseWordSegmentation72.2.2民emoveS化pWords82.3TextFeatureSelectionMethods922.4Text艮epresentation1Mea2.5MethodofS

8、imilaritysure142.6Summary17uMe……3CommonlUsedClst

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。