資源描述:
《基于海量數(shù)據(jù)和Web挖掘的個性化推薦系統(tǒng)研究-論文.pdf》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、第31卷第3期山西大同大學(xué)學(xué)報(自然科學(xué)版)V01.31.No.32015年6月JournalofShanxiDatongUniversity(NaturalScience)Jun2015文章編號:1674-0874(2015)03-001卜cr7基于海量數(shù)據(jù)和Web挖掘的個性化推薦系統(tǒng)研究吳海霞,連瑋,李慧芳(長治學(xué)院計算機系,山西長治046011)摘要:推薦系統(tǒng)是學(xué)術(shù)界和工業(yè)界研究熱門的課題,能有效解決互聯(lián)網(wǎng)海量數(shù)據(jù)中“信息過載”.首先介紹個性化推薦技術(shù)的發(fā)展、應(yīng)用和相關(guān)問題,重點分析多種經(jīng)
2、典的推薦算法及其特點,并給出推薦系統(tǒng)的性能評價方法與指標(biāo),最后對個性化推薦的未來發(fā)展做出展望。關(guān)鍵詞:個性化推薦;海量數(shù)據(jù);web挖掘;推薦算法中圖分類號:TP391文獻(xiàn)標(biāo)識碼:A互聯(lián)網(wǎng)加速了電子商務(wù)的應(yīng)用和推廣,促進(jìn)了智能的推薦系統(tǒng)快速發(fā)展。商業(yè)模式的變化。傳統(tǒng)商業(yè)認(rèn)為,抓住20%主流市1推薦系統(tǒng)簡介場的產(chǎn)品或服務(wù)就能占據(jù)絕大部分市場,但根據(jù)Chris的長尾理論n一21,被忽略和輕視的80%反而更推薦是根據(jù)用戶資料信息、歷史行為記錄及物加重要。如果匯聚大量市場價值較小的部分,有效品的特征屬性來
3、分析用戶對物品的偏好而生成個開發(fā)“長尾市場”,將會創(chuàng)造極大的經(jīng)濟和社會價性化推薦列表,為用戶提供信息推薦的一種過濾和值,也能更好滿足不同用戶群的個性化需求。挖掘技術(shù)。推薦系統(tǒng)是一個綜合眾多學(xué)科的研究Web2.0的出現(xiàn)促進(jìn)了社會網(wǎng)絡(luò)的發(fā)展和社交領(lǐng)域,涉及統(tǒng)計分析、信息檢索、數(shù)據(jù)挖掘、機器媒體的成熟,用戶通過論壇、博客、微信、朋友圈學(xué)習(xí)、人工智能、自然語言處理、語義網(wǎng)、流數(shù)據(jù)、等豐富的應(yīng)用產(chǎn)品積極參與各種在線活動:發(fā)表日市場營銷等。志、上傳照片、轉(zhuǎn)載微博、分享鏈接或評論信息。1.1推薦系統(tǒng)的特點與目
4、標(biāo)在充滿海量數(shù)據(jù)的社交網(wǎng)絡(luò)中,用戶通過UGC(Us.推薦系統(tǒng)與搜索引擎技術(shù)在處理對象、檢索方erGeneratedContent)的信息資源創(chuàng)作模式,既是信法、某些評測指標(biāo)等方面非常相似,但二者存在顯息的分享者和消費者,還是信息的生產(chǎn)者和創(chuàng)造著區(qū)別。搜索引擎對數(shù)據(jù)和信息進(jìn)行連接,而推薦者。作為世界上規(guī)模最大的公共數(shù)據(jù)源,Web文檔引擎對人與信息進(jìn)行精準(zhǔn)連接實現(xiàn)完備的服務(wù)。在以每天數(shù)十億的速度持續(xù)增長。在電子資源極Google、Baidu、Yahoo等搜索引擎被動地檢索文檔、度豐富的數(shù)據(jù)時代,“信
5、息過載”日益嚴(yán)重,用戶往商品、音樂等,側(cè)重于數(shù)據(jù)的查詢,結(jié)果固定而龐往迷失其中而無法確定真正需求和選擇,即“選擇雜,與用戶對象無關(guān)聯(lián);推薦引擎主動為顧客推薦困難癥”日漸明顯,需要一種快速搜索和定位的機好友、影片、服務(wù)等,注重知識的發(fā)現(xiàn),結(jié)果動態(tài)制。變化,與興趣相匹配,充滿個性化。但推薦引擎開Web數(shù)據(jù)挖掘基于信息檢索、人工智能、機器發(fā)難度大,不僅需要龐大的數(shù)據(jù)庫、快速的搜索算學(xué)習(xí)和知識管理技術(shù),分析大量文檔獲得隱含知識法,還需要合理的用戶模型和精準(zhǔn)的預(yù)測決策算和模式,幫助人們搜索信息并制定決策p
6、1。近年出法?,F(xiàn)的推薦技術(shù),如同善解人意的私人秘書,根據(jù)用推薦系統(tǒng)的基本框架為信息獲取、用戶建模、戶興趣偏好和行為習(xí)慣自適應(yīng)地發(fā)現(xiàn)和挖掘,進(jìn)行模型學(xué)習(xí)、行業(yè)應(yīng)用、實驗評測和模型優(yōu)化。系統(tǒng)分析和推薦。由于媒體的碎片性和文化的多樣性,以用戶為中心主動獲取相關(guān)信息,一般為隱式獲取用戶需求日趨個性化,推動著高效能、高精度、高而無需用戶參與。利用機器學(xué)習(xí)等技術(shù)建立合理收稿日期:2015-03—24基金項目:山西省基礎(chǔ)研究青年科技研究基金項I~[2012021015];長治學(xué)院校級科研項g112014181
7、作者簡介:吳海霞(1978一),女,山西晉城人,碩士,講師,研究方向:數(shù)據(jù)挖掘和信息處理。山西大同大學(xué)學(xué)報(自然科學(xué)版)2015鉦模型,判定用戶的興趣偏好和行為傾向,構(gòu)建支持樂產(chǎn)品,餐飲、住宿、交通等社會服務(wù),網(wǎng)站、微用戶決策的系統(tǒng),進(jìn)行信息過濾和智能推薦,為大博、論壇、社區(qū)等社交平臺,職業(yè)推薦、學(xué)習(xí)資源規(guī)模用戶提供高質(zhì)量服務(wù),甚至超越本領(lǐng)域?qū)<业耐扑][61、高考志愿推薦[71等教育推薦,新聞資訊、旅經(jīng)驗和決策。個性化推薦服務(wù)具有很強的針對性、游產(chǎn)品、會議推薦、移動應(yīng)用,及各種知識管理等主動性、
8、智能性。應(yīng)用。其中在搜索引擎、社交媒體、金融服務(wù)等領(lǐng)推薦系統(tǒng)追求過程的快捷性與智能化,推薦效域應(yīng)用最廣。成功的推薦應(yīng)用包括Amazon的Kin—果的精準(zhǔn)化、個性化和信任度。比如,系統(tǒng)從數(shù)十dle電子書、PanDoRa音樂電臺、Hulu視頻推薦、百萬部影片中即時自動抽取一批符合用戶口味的精度的“音樂隨心聽”私人頻道,“猜你喜歡”新聞資訊彩作品,用戶輕松選擇之后獲得滿意體驗和真誠反頻道等[81。圖書、音樂和電影三個領(lǐng)域?qū)崿F(xiàn)了較高饋。通過高匹配度和個性化的推薦,將瀏覽和訪問準(zhǔn)確度的推薦,NETFLIX