面向數(shù)據(jù)挖掘云端實(shí)施計(jì)劃方案

面向數(shù)據(jù)挖掘云端實(shí)施計(jì)劃方案

ID:28615295

大?。?31.00 KB

頁(yè)數(shù):13頁(yè)

時(shí)間:2018-12-12

面向數(shù)據(jù)挖掘云端實(shí)施計(jì)劃方案_第1頁(yè)
面向數(shù)據(jù)挖掘云端實(shí)施計(jì)劃方案_第2頁(yè)
面向數(shù)據(jù)挖掘云端實(shí)施計(jì)劃方案_第3頁(yè)
面向數(shù)據(jù)挖掘云端實(shí)施計(jì)劃方案_第4頁(yè)
面向數(shù)據(jù)挖掘云端實(shí)施計(jì)劃方案_第5頁(yè)
資源描述:

《面向數(shù)據(jù)挖掘云端實(shí)施計(jì)劃方案》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。

1、-面向數(shù)據(jù)挖掘的云端實(shí)施方案摘要:云端運(yùn)算是一種基于互聯(lián)網(wǎng)的新興應(yīng)用計(jì)算機(jī)技術(shù),數(shù)據(jù)挖掘是商業(yè)智能的重要環(huán)節(jié),DataMining與云端運(yùn)算的結(jié)合將極大提高數(shù)據(jù)挖掘的應(yīng)用與統(tǒng)計(jì)科學(xué)的發(fā)展。本文提出了云端的數(shù)據(jù)挖掘即服務(wù)(DMaaS,DataMiningasaServes)的概念,分別從IaaS、PaaS與DMaas給出了面向數(shù)據(jù)挖掘的云端實(shí)施方案;設(shè)計(jì)出商用DM軟件與開(kāi)源DM軟件的云端實(shí)施平臺(tái),引入R中平行運(yùn)算技術(shù)對(duì)Cloud-R進(jìn)行改進(jìn)。關(guān)鍵詞:云端運(yùn)算;DataMining;DMaaS;平行運(yùn)算中圖分類號(hào):C81文獻(xiàn)標(biāo)識(shí)碼:ATheCloud

2、ComputingProgramforDataMiningTechnologyAbstract:CloudcomputingisakindofnewlyemergingtechnologyofcomputerapplicationbasedonInternet.DataMiningisakeystepinBusinessIntelligence.ThecombinationofDataMiningandCloudcomputingwillgreatlyenhancetheapplicationofDataMiningandthedevelopme

3、ntofStatisticsScience.ThepaperproposestheconceptofDMaaSandprovidesimplicationprogramsofcloudcomputingfromtheaspectofIaaS,PaaSandDMaaSrespectively.ThepaperdesignsthecloudcomputingplatformsofCommercialDMsoftwareandopensourceDMsoftware,andintroducesparallelcomputinginRtoimproveC

4、loud-R.Keywords:CloudComputing;DataMining;DMaaS;ParallelComputing引言數(shù)據(jù)挖掘也是商業(yè)智能的重要環(huán)節(jié),數(shù)據(jù)倉(cāng)庫(kù)是數(shù)據(jù)挖掘得以發(fā)展的基礎(chǔ),也是商業(yè)智能的支撐,由此可見(jiàn)數(shù)據(jù)倉(cāng)庫(kù)對(duì)于商業(yè)智慧來(lái)言具有很重要的作用,它集成了企業(yè)的最核心的數(shù)據(jù),隨著企業(yè)對(duì)數(shù)據(jù)的再次利用和深入挖掘,海量數(shù)據(jù)的高效計(jì)算問(wèn)題成為企業(yè)最為關(guān)注的一個(gè)問(wèn)題之一。在商業(yè)智慧(BI)活動(dòng)中,數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘要求的費(fèi)用支出龐大,很多中小企業(yè)望而卻步。云端運(yùn)算的出現(xiàn),對(duì)中小企業(yè)來(lái)講,是一個(gè)振奮人心的好消息。如果云端運(yùn)算應(yīng)用在商業(yè)

5、智能上,由于云端運(yùn)算具有按需使用、按使用收費(fèi)特性,這將大大減少企業(yè)應(yīng)用商業(yè)智能的成本。此外,一方面,我們可以通過(guò)云的數(shù)據(jù)倉(cāng)庫(kù)實(shí)現(xiàn)海量數(shù)據(jù)的高效計(jì)算。另一方面,云端運(yùn)算可以實(shí)現(xiàn)在線支付使用數(shù)據(jù)挖掘工具和商業(yè)智能相關(guān)分析處理軟件。數(shù)據(jù)挖掘(DataMining)具備更多的工具與更成熟的功能,與領(lǐng)導(dǎo)品牌的BI解決方案并駕其驅(qū),但投資成本卻更低;DataMining大幅提升的效能與新增強(qiáng)化的功能,吸引我們?nèi)嫔?jí)以發(fā)揮新技術(shù)的效益。例如,臺(tái)灣廣達(dá)電腦有限公司以Intel搭配SQLServer,所耗費(fèi)的成本卻低于Unix的三分之一,創(chuàng)造了絕對(duì)的成本優(yōu)勢(shì)。目

6、前,在線數(shù)據(jù)挖掘服務(wù)也受到大陸許多企業(yè)的青睞,中國(guó)的海量信息技術(shù)有限公司提供的名“海納?!?---的在線數(shù)據(jù)挖掘服務(wù),可以利用其在在線網(wǎng)絡(luò)數(shù)據(jù)挖掘技術(shù)上的優(yōu)勢(shì),為用戶提供個(gè)性化需求,定制個(gè)性模塊服務(wù),以此來(lái)滿足網(wǎng)站的不同需求。此外,開(kāi)源商業(yè)智慧(BI)廠商生態(tài)系統(tǒng)逐漸崛起,包括JasperSoft、Actuate、Pentagon、SpagoBI等。云端運(yùn)算(CloudComputing)是分布式處理(DistributedComputing)、并行處理(ParallelComputing)和網(wǎng)格計(jì)算(GridComputing)的發(fā)展,或者說(shuō)是

7、這些計(jì)算機(jī)科學(xué)概念的商業(yè)實(shí)現(xiàn),它具有超大規(guī)模、虛擬化、高可靠度、高通用性、使用者付費(fèi)、成本低、高擴(kuò)充性等特色。云端運(yùn)算將龐大運(yùn)算操作拆成千百個(gè)較小的操作,再交給遠(yuǎn)程、多臺(tái)服務(wù)器同時(shí)運(yùn)算;透過(guò)此種技術(shù),網(wǎng)絡(luò)服務(wù)提供者可以在數(shù)秒之內(nèi),處理數(shù)以千萬(wàn)計(jì)的信息,并提供和超級(jí)計(jì)算機(jī)一樣強(qiáng)大效能的網(wǎng)絡(luò)服務(wù),以符合網(wǎng)絡(luò)用戶日增的各種需求。云端運(yùn)算基于因特網(wǎng)的運(yùn)算方式,它通過(guò)因特網(wǎng)為個(gè)人使用者或企業(yè)使用者提供按需即取的服務(wù)。直觀來(lái)講,云端算法就是讓網(wǎng)絡(luò)上不同計(jì)算機(jī)同時(shí)幫你做一件事情,大幅度的提高了處理速度和效率。云端運(yùn)算的最終目標(biāo)即為所有的資源均來(lái)自于云端,使用者

8、只需一個(gè)連接云端的設(shè)備(手機(jī)等)和簡(jiǎn)單的界面(如瀏覽器等)即可,Google搜尋服務(wù),Gmail,YouTube,GoogleDocs,

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。