資源描述:
《大數(shù)據(jù)與云計算論文.doc》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在行業(yè)資料-天天文庫。
1、.大數(shù)據(jù)與云計算摘 要:大數(shù)據(jù)(BigData)這個概念近年來在越來越多的場合、被越來越多的人提及,并且經(jīng)常和云計算聯(lián)系在一起,云計算與大數(shù)據(jù)之間到底是什么關系成為熱點話題。本專題報告包含以下四個方面內(nèi)容:1.大數(shù)據(jù)的價值;2.大數(shù)據(jù)帶來的挑戰(zhàn);3.大數(shù)據(jù)研究成果;4.云計算是大數(shù)據(jù)挖掘的主流方式。通過本報告闡述我們對大數(shù)據(jù)的理解,以及對大數(shù)據(jù)的價值的認識,探討大數(shù)據(jù)處理與挖掘技術(shù),大數(shù)據(jù)主要著眼于“數(shù)據(jù)”,提供數(shù)據(jù)采集、挖掘、分析的技術(shù)和方法;云計算技術(shù)主要關注“計算”,提供IT解決方案。大數(shù)據(jù)、云計算技術(shù)可以促進持續(xù)審計方式的
2、發(fā)展、總體審計模式的應用、審計成果的綜合應用、相關關系證據(jù)的應用、高效數(shù)據(jù)審計的發(fā)展和大數(shù)據(jù)審計師的發(fā)展。強化大數(shù)據(jù)、云計算技術(shù)審計應用的措施包括制定長遠發(fā)展戰(zhàn)略、加快審計法規(guī)建設、建立行業(yè)平臺、加強研發(fā)和提高利用能力。關鍵詞:大數(shù)據(jù) 云計算 數(shù)據(jù)挖掘?qū)徲嬘绊懻呓ㄗh引言目前,大數(shù)據(jù)伴隨著云計算技術(shù)的發(fā)展,正在對全球經(jīng)濟社會生活產(chǎn)生巨大的影響。大數(shù)據(jù)、云計算技術(shù)給現(xiàn)代審計提供了新的技術(shù)和方法,要求審計組織和審計人員把握大數(shù)據(jù)、云計算技術(shù)的內(nèi)容與特征,促進現(xiàn)代審計技術(shù)和方法的進一步發(fā)展。一、大數(shù)據(jù)、云計算的涵義與特征隨著云計算技術(shù)
3、的出現(xiàn),大數(shù)據(jù)吸引了全世界越來越多的關注。哈佛大學社會學教授加里·金(2012)說:“這是一場革命,龐大的數(shù)據(jù)資源使得各個領域開始了量化進程,無論學術(shù)界、商界還是政府,所有領域都將開始這種進程。”(一)大數(shù)據(jù)的涵義與特征“數(shù)據(jù)”(data)這個詞在拉丁文里是“已知”的意思,也可以理解為“事實”。2009年,“大數(shù)據(jù)”概念才逐漸開始在社會上傳播。而“大數(shù)據(jù)”概念真正變得火爆,卻是因為美國奧巴馬政府在2012年高調(diào)宣布了其“大數(shù)據(jù)研究和開發(fā)計劃”。這標志著“大數(shù)據(jù)”時代真正開始進入社會經(jīng)濟生活中來了?!按髷?shù)據(jù)”(bigdata),或稱
4、巨量資料,指的是所涉及的數(shù)據(jù)量規(guī)模大到無法利用現(xiàn)行主流軟件工具,在一定的時間內(nèi)實現(xiàn)收集、分析、處理或轉(zhuǎn)化成為幫助決策者決策的可用信息?;ヂ?lián)網(wǎng)數(shù)據(jù)中心(IDC)認為“大數(shù)據(jù)”是為了更經(jīng)濟、更有效地從高頻率、大容量、不同結(jié)構(gòu)和類型的數(shù)據(jù)中獲取價值而設計的新一代架構(gòu)和技術(shù),用它來描述和定義信息爆炸時代產(chǎn)生的海量數(shù)據(jù),并命名與之相關的技術(shù)發(fā)展與創(chuàng)新。大數(shù)據(jù)具有4個特點:第一,數(shù)據(jù)體量巨大(Volume),從TB級別躍升到PB級別。第二,處理速度快(Velocity),這與傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的不同。第三,數(shù)據(jù)種類多(Variety)
5、,有圖片、地理位置信息、視頻、網(wǎng)絡日志等多種形式。第四,價值密度低,商業(yè)價值高(Value)。存在單一數(shù)據(jù)的價值并不大,但將相關數(shù)據(jù)聚集在一起,就會有很高的商業(yè)價值(金良,2012)。大數(shù)據(jù)時代,不僅改變了傳統(tǒng)的數(shù)據(jù)采集、處理和應用技術(shù)與方法,還促使人們思維方式的改變。大數(shù)據(jù)的精髓在于促使人們在采集、處理和使用數(shù)據(jù)時思維的轉(zhuǎn)變,這些轉(zhuǎn)變將改變?nèi)藗兝斫夂脱芯可鐣?jīng)濟現(xiàn)象的技術(shù)和方法。(1)是在大數(shù)據(jù)時代,不依賴抽樣分析,而可以采集和處理事物整體的全部數(shù)據(jù)。19世紀以來,當面臨大的樣本量時,人們都主要依靠抽樣來分析總體。但是,抽樣技術(shù)
6、是在數(shù)據(jù)缺乏和取得數(shù)據(jù)受限制的條件下不得不采用的一種方法,這其實是一種人為的限制。過去,因為記錄、儲存和分析數(shù)據(jù)的工具不夠科學,只能收集少量數(shù)據(jù)進行分析。如今,科學技術(shù)條件已經(jīng)有了很大的提高,雖然人類可以處理的數(shù)據(jù)依然是有限的,但是可以處理的數(shù)據(jù)量已經(jīng)大量增加,而且未來會越來越多。隨著大數(shù)據(jù)分析取代抽樣分析,社會科學不再單純依賴于抽樣調(diào)查和分析實證數(shù)據(jù),現(xiàn)在可以收集過去無法收集到的數(shù)據(jù),更重要的是,現(xiàn)在可以不再依賴抽樣分析。(2)是在大數(shù)據(jù)時代,不再熱衷于追求數(shù)據(jù)的精確度,而是追求利用數(shù)據(jù)的效率。當測量事物的能力受限制時,關注的是
7、獲取最精確的結(jié)果。但是,在大數(shù)據(jù)時代,追求精確度已經(jīng)既無必要又不范文..可行,甚至變得不受歡迎。大數(shù)據(jù)紛繁多樣,優(yōu)劣摻雜,精準度已不再是分析事物總體的主要手段。擁有了大數(shù)據(jù),不再需要對一個事物的現(xiàn)象深究,只要掌握事物的大致發(fā)展趨勢即可,更重要的是追求數(shù)據(jù)的及時性和使用效率。與依賴于小數(shù)據(jù)和精確性的時代相比較,大數(shù)據(jù)更注重數(shù)據(jù)的完整性和混雜性,幫助人們進一步認識事物的全貌和真相。(3)是在大數(shù)據(jù)時代,人們難以尋求事物直接的因果關系,而是深入認識和利用事物的相關關系。長期以來,尋找因果關系是人類發(fā)展過程中形成的傳統(tǒng)習慣。尋求因果關系即
8、使很困難且用途不大,但人們無法擺脫認識的傳統(tǒng)思維。在大數(shù)據(jù)時代,人們不必將主要精力放在事物之間因果關系的分析上,而是將主要精力放在尋找事物之間的相關關系上。事物之間的相關關系可能不會準確地告知事物發(fā)生的內(nèi)在原因,但是它會提醒人們事情之間的相互聯(lián)系。