資源描述:
《R在BI中的應用和前景》由會員上傳分享,免費在線閱讀,更多相關內容在教育資源-天天文庫。
1、R在BI中的應用和前景李艦2001.09~2005.07中國人民大學統(tǒng)計學院2005.09~2007.06北京大學軟件與微電子學院電子服務2007.07~2008.10SiemensLtd.,China,Healthcare,PerformanceControllingFinanceAnalyst2008.11~上海源略數據服務有限公司BI顧問目錄BI簡介R在BI中的應用一個例子R在BI中的前景什么是BIBusinessIntelligence,商務智能?OLAP數據挖掘數據倉庫機器學習決策支持人工智能專家系統(tǒng)統(tǒng)計學相關概念1950s人工智
2、能(邏輯推理)1960s人工智能(決策支持)1970s人工智能(專家系統(tǒng))1980s人工智能(機器學習)1980s數據挖掘統(tǒng)計和數據挖掘相同點基于歷史數據思維方式方法和模型不同點學科背景目的性技術實現BI與DM,DW,OLAPDW,數據倉庫DM,數據挖掘OLAP,聯機分析處理商務智能是企業(yè)利用現代信息技術收集、管理和分析結構化和非結構化的商務數據和信息,創(chuàng)造和累計商務知識和見解,改善商務決策水平,采取有效的商務行動,完善各種商務流程,提升各方面商務績效,增強綜合競爭力的智慧和能力。企業(yè)信息化的發(fā)展BIBI常見架構企業(yè)數據中心數據倉庫Data
3、WarehouseETLETL數據源OLTP系統(tǒng)OLAPServer多維數據庫業(yè)務系統(tǒng)財務系統(tǒng)銷售系統(tǒng)客服系統(tǒng)數據集市Datamart數據集市DatamartETLETLETL數據挖掘DataMining統(tǒng)計報表ScoringScoring多維分析挖掘分析查詢及其它應用分析師元數據(MetaData)管理系統(tǒng)管理目錄BI簡介R在BI中的應用一個例子R在BI中的前景MVC三層架構View–表示:顯示輸入輸出數據(可以是HTML,可以是一個windows應用)Model–業(yè)務邏輯和數據:基于輸入和定義的業(yè)務流程執(zhí)行計算或其它操作Controll
4、er–協調view和model,在它們之間交換數據當今流行開發(fā)框架R的位置盡可能少寫代碼是系統(tǒng)開發(fā)的趨勢當前框架基本已做到只在業(yè)務邏輯寫代碼面向對象與基于矩陣分析性系統(tǒng)的關鍵在于數據模型R用作分析引擎相關平臺Rserve+JRclienthttp://www.rosuda.org/Rserve/Rserve是一個R的服務器,供其他程序調用JRclient是一個JAVA類庫,可看成客戶端其他開源平臺Eclipse+lombozApacheTomcatMySQLHibernate+Spring目錄BI簡介R在BI中的應用一個例子R在BI中的前景
5、系統(tǒng)描述一個小型的OLAP引擎基于MySQL數據庫實現基本的OLAP功能建立立方體切片(slice)上卷(rollup)鉆透(drillthrough)未包含展現層相關工具MySQLRDBI_0.1-10RMySQL_0.5-7包含函數cube(str1,str2,str3,str4)slice(CUBE,str,value)drillthrough(CUBE,value1,value2,value3)rollup(CUBE,str)函數示例建立立方體cube1<-cube(“dwolap.all.month”,“dwolap.all.cl
6、assid”,“dwolap.all.totallrange”,“dwolap.all.payment”)時間(月份)商品交易金額的匯總交易信息(每單額度級別)商品(商品類別)沿每單額度上卷可以發(fā)現第10類商品,也就是類別為1111(酒類)的商品在2月份的銷售額特別高。在該商品處切片可以發(fā)現這類商品中交易單等級在第四類的占絕大多數。(200元到500元間)鉆透>drillthrough(cube1,"02","1111","4")selltimegoodsidtransidrealpricecountpayment12005-2-510:2
7、7:08:92320130008X2005020501001335.6264.022005-2-510:26:47:07320350004X2005020501001322.0488.032006-2-1114:34:40:1520180114X200602110200404.01040.042006-2-1412:03:14:4911110086X2006021402002433.0133.052005-2-613:13:46:3511110015X2005020601004438.94155.662005-2-1308:12:19:60
8、620350013X2005021301000137.86226.872005-2-418:59:18:6311110018X2005020401006915.2230.4820