資源描述:
《[計(jì)算機(jī)硬件及網(wǎng)絡(luò)]大數(shù)據(jù)介紹》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、大數(shù)據(jù):創(chuàng)新、競爭和生產(chǎn)力的下一個(gè)前沿大數(shù)據(jù)——一股不斷增長的洪流大數(shù)據(jù)——正在展現(xiàn)它的價(jià)值縱觀全球數(shù)據(jù)形勢:大幅增長和價(jià)值創(chuàng)造大數(shù)據(jù)技術(shù)大數(shù)據(jù)在五大領(lǐng)域中的變革潛力對(duì)各行業(yè)的研究結(jié)果對(duì)組織領(lǐng)導(dǎo)者的影響對(duì)決策者的影響我們所說的大數(shù)據(jù)是什么?大數(shù)據(jù)——指大小超過標(biāo)準(zhǔn)數(shù)據(jù)庫軟件工具能夠捕獲、存儲(chǔ)、管理和分析的數(shù)據(jù)集。這是一個(gè)靈活的定義,基于不用的行業(yè)、不同數(shù)據(jù)類型等等(從幾十個(gè)兆字節(jié)到幾PB)1、數(shù)據(jù)已經(jīng)席卷了每個(gè)行業(yè)和業(yè)務(wù)功能,如今已成為重要的生產(chǎn)要素2、大數(shù)據(jù)正在通過多種方式創(chuàng)造價(jià)值:創(chuàng)造透明度通過實(shí)驗(yàn)來發(fā)現(xiàn)需求、顯示變化,以及提高性能細(xì)分人群來定制行為利用自動(dòng)化算法取代
2、或支持人工決策開發(fā)新的商業(yè)模式、產(chǎn)品和服務(wù)3、大數(shù)據(jù)的應(yīng)用將會(huì)成為今后私營企業(yè)競爭和發(fā)展的一個(gè)關(guān)鍵基礎(chǔ)我們?nèi)绾魏饬看髷?shù)據(jù)的價(jià)值?4、大數(shù)據(jù)的運(yùn)用將加強(qiáng)新一波的生產(chǎn)力增長和消費(fèi)者剩余5、當(dāng)大數(shù)據(jù)正在影響各個(gè)行業(yè),某些行業(yè)已獲得更大的收益6、企業(yè)對(duì)大數(shù)據(jù)的利用的同事,會(huì)出現(xiàn)相關(guān)人才的短缺7、為充分發(fā)揮大數(shù)據(jù)的潛力,以下幾個(gè)方面的問題必須得到解決:數(shù)據(jù)策略技術(shù)企業(yè)變革和人才數(shù)據(jù)存取產(chǎn)業(yè)結(jié)構(gòu)縱觀全球數(shù)據(jù)形勢:大幅增長和價(jià)值創(chuàng)造數(shù)據(jù)量正在呈指數(shù)速度增長數(shù)據(jù)存儲(chǔ)量顯著增長,在2000年之后明顯的從模擬數(shù)據(jù)轉(zhuǎn)向數(shù)字?jǐn)?shù)據(jù)計(jì)算能力也顯著增強(qiáng)不同行業(yè)的大數(shù)據(jù)強(qiáng)度不同,但是在每個(gè)行業(yè)中都已經(jīng)到
3、達(dá)一個(gè)臨界值不同行業(yè)所產(chǎn)生和存儲(chǔ)的數(shù)據(jù)類型各有不同現(xiàn)今各主要趨勢將繼續(xù)促使數(shù)據(jù)增長社交網(wǎng)絡(luò)在網(wǎng)絡(luò)和智能手機(jī)上的滲透不斷增強(qiáng),常用用戶在總用戶的占比不斷增大。傳統(tǒng)的IT應(yīng)用已經(jīng)促進(jìn)生產(chǎn)率增長——大數(shù)據(jù)將會(huì)是下一個(gè)前沿大數(shù)據(jù)技術(shù)大數(shù)據(jù)的分析技術(shù)A/Btesting(splittesting、buckettesting)A/B測試Associationrulelearning關(guān)聯(lián)式規(guī)則Classification分類法Clusteranalysis群集分析Crowdsourcing眾包Datafusionanddataintegration數(shù)據(jù)融合&數(shù)據(jù)集成Datamining
4、數(shù)據(jù)挖掘Ensemblelearning集成學(xué)習(xí)Geneticalgorithm遺傳算法MachinelearningNaturallanguageprocessing(NLP)自然語言處理Neuralnetworks神經(jīng)網(wǎng)絡(luò)Networkanalysis網(wǎng)絡(luò)分析Optimization最優(yōu)化Patternrecognition模式識(shí)別Predictivemodeling預(yù)測模型Regression回歸分析SentimentanalysisSignalprocessing信號(hào)處理Spatialanalysis空間分析Statistics統(tǒng)計(jì)Supervisedlearni
5、ng監(jiān)督學(xué)習(xí)Simulation仿真Timeseriesanalysis時(shí)序分析Unsupervisedlearning無監(jiān)督學(xué)習(xí)Visualization可視化大數(shù)據(jù)技術(shù)用于合計(jì)、控制、管理和分析大數(shù)據(jù)的技術(shù)越來越多。以下列出一些較為更突出的技術(shù):MapReduce.Mashup.Metadata.Non-relationaldatabaseR.RelationaldatabaseSemi-structureddata.SQL.StreamprocessingStructureddata.Unstructureddata.Visualization.BigTable.B
6、usinessintelligence(BI).商業(yè)智能Cassandra.Cloudcomputing云計(jì)算Datamart數(shù)據(jù)市場Datawarehouse.Distributedsystem分布式系統(tǒng)DynamoExtract,transform,andload(ETL).GoogleFileSystem.Hadoop.HBase.可視化TagcloudClustergramHistoryflowSpatialinformationflow大數(shù)據(jù)在五大領(lǐng)域的變革潛力醫(yī)療行業(yè)公共部門零售行業(yè)制造行業(yè)通訊行業(yè)醫(yī)療保?。绹┟绹t(yī)療保健費(fèi)用超過經(jīng)濟(jì)增長美國及海外的醫(yī)療保
7、健體系在大數(shù)據(jù)的應(yīng)用上已獲得初期成功美國醫(yī)療保健的數(shù)據(jù)主要?jiǎng)澐譃樗膲K——藥物研發(fā)數(shù)據(jù)、臨床數(shù)據(jù)、活動(dòng)和成本數(shù)據(jù)、患者行為和情緒數(shù)據(jù)美國醫(yī)療保健可利用多種大數(shù)據(jù)手段臨床操作——1、療效比較研究2、臨床決策支持系統(tǒng)3、醫(yī)療數(shù)據(jù)透明度4、遠(yuǎn)程醫(yī)療監(jiān)護(hù)5、針對(duì)患者情況的先進(jìn)分析付款/定價(jià)——1、自動(dòng)化系統(tǒng)2、健康經(jīng)濟(jì)學(xué)&實(shí)效研究&基于績效的定價(jià)計(jì)劃研發(fā)——1、預(yù)測模型2、改進(jìn)臨床試驗(yàn)設(shè)計(jì)的統(tǒng)計(jì)工具和算法3、臨床實(shí)驗(yàn)數(shù)據(jù)分析4、個(gè)體化醫(yī)療5、疾病模式分析新業(yè)務(wù)模型——1、患者臨床記錄和需求數(shù)據(jù)的聚合2、在線平臺(tái)和社區(qū)公共衛(wèi)生大數(shù)據(jù)在美國