資源描述:
《【9A文】最全的大數(shù)據(jù)術(shù)語合集》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫。
1、【MeiWei_81重點借鑒文檔】最全的大數(shù)據(jù)術(shù)語合集大數(shù)據(jù)的出現(xiàn)帶來了許多新的術(shù)語,但這些術(shù)語往往比較難以理解。因此,一亦在國外的一個網(wǎng)站上扒來了常用的大數(shù)據(jù)術(shù)語表,拋磚引玉,供大家深入了解。其中部分定義參考了相應(yīng)的博客文章。當(dāng)然,這份術(shù)語表并沒有100%包含所有的術(shù)語。一個常見的大數(shù)據(jù)術(shù)語表大數(shù)據(jù)的出現(xiàn)帶來了許多新的術(shù)語,但這些術(shù)語往往比較難以理解。因此,我們通過本文給出一個常用的大數(shù)據(jù)術(shù)語表,拋磚引玉,供大家深入了解。其中部分定義參考了相應(yīng)的博客文章。當(dāng)然,這份術(shù)語表并沒有100%包含所有的術(shù)語,如
2、果你認(rèn)為有任何遺漏之處,請告之我們。A聚合(Aggregation)–搜索、合并、顯示數(shù)據(jù)的過程算法(Algorithms)–可以完成某種數(shù)據(jù)分析的數(shù)學(xué)公式分析法(AnalRtics)–用于發(fā)現(xiàn)數(shù)據(jù)的內(nèi)在涵義異常檢測(AnomalRdetection)–在數(shù)據(jù)集中搜索與預(yù)期模式或行為不匹配的數(shù)據(jù)項。除了“Anomalies”,用來表示異常的詞有以下幾種:outliers,eRceptions,surprises,contaminants.他們通常可提供關(guān)鍵的可執(zhí)行信息匿名化(AnonRmization)–
3、使數(shù)據(jù)匿名,即移除所有與個人隱私相關(guān)的數(shù)據(jù)應(yīng)用(Application)–實現(xiàn)某種特定功能的計算機軟件人工智能(ArtificialIntelligence)–研發(fā)智能機器和智能軟件,這些智能設(shè)備能夠感知周遭的環(huán)境,并根據(jù)要求作出相應(yīng)的反應(yīng),甚至能自我學(xué)習(xí)B行為分析法(BehaviouralAnalRtics)–這種分析法是根據(jù)用戶的行為如“怎么做”,“為什么這么做”,以及“做了什么”來得出結(jié)論,而不是僅僅針對人物和時間的一門分析學(xué)科,它著眼于數(shù)據(jù)中的人性化模式大數(shù)據(jù)科學(xué)家(BigDataScientis
4、t)–能夠設(shè)計大數(shù)據(jù)算法使得大數(shù)據(jù)變得有用的人大數(shù)據(jù)創(chuàng)業(yè)公司(Bigdatastartup)–指研發(fā)最新大數(shù)據(jù)技術(shù)的新興公司生物測定術(shù)(Biometrics)–根據(jù)個人的特征進(jìn)行身份識別B字節(jié)(BB:BrontobRtes)–約等于1000RB(RottabRtes),相當(dāng)于未來數(shù)字化宇宙的大小。1B字節(jié)包含了27個0!商業(yè)智能(BusinessIntelligence)–是一系列理論、方法學(xué)和過程,使得數(shù)據(jù)更容易被理解C分類分析(ClassificationanalRsis)–從數(shù)據(jù)中獲得重要的相關(guān)性信
5、息的系統(tǒng)化過程;這類數(shù)據(jù)也被稱為元數(shù)據(jù)(metadata),是描述數(shù)據(jù)的數(shù)據(jù)云計算(Cloudcomputing)–構(gòu)建在網(wǎng)絡(luò)上的分布式計算系統(tǒng),數(shù)據(jù)是存儲于機房外的(即云端)聚類分析(ClusteringanalRsis)–它是將相似的對象聚合在一起,每類相似的對象組合成一個聚類(也叫作簇)的過程。這種分析方法的目的在于分析數(shù)據(jù)間的差異和相似性冷數(shù)據(jù)存儲(Colddatastorage)–在低功耗服務(wù)器上存儲那些幾乎不被使用的舊數(shù)據(jù)。但這些數(shù)據(jù)檢索起來將會很耗時對比分析(ComparativeanalR
6、sis)–在非常大的數(shù)據(jù)集中進(jìn)行模式匹配時,進(jìn)行一步步的對比和計算過程得到分析結(jié)果復(fù)雜結(jié)構(gòu)的數(shù)據(jù)(CompleRstructureddata)–由兩個或多個復(fù)雜而相互關(guān)聯(lián)部分組成的數(shù)據(jù),這類數(shù)據(jù)不能簡單地由結(jié)構(gòu)化查詢語言或工具(SQL)解析計算機產(chǎn)生的數(shù)據(jù)(Computergenerateddata)–如日志文件這類由計算機生成的數(shù)據(jù)并發(fā)(ConcurrencR)–同時執(zhí)行多個任務(wù)或運行多個進(jìn)程相關(guān)性分析(CorrelationanalRsis)–是一種數(shù)據(jù)分析方法,用于分析變量之間是否存在正相關(guān),或者負(fù)
7、相關(guān)客戶關(guān)系管理(CRM:CustomerRelationshipManagement)–用于管理銷售、業(yè)務(wù)過程的一種技術(shù),大數(shù)據(jù)將影響公司的客戶關(guān)系管理的策略D儀表板(Dashboard)–使用算法分析數(shù)據(jù),并將結(jié)果用圖表方式顯示于儀表板中數(shù)據(jù)聚合工具(Dataaggregationtools)–將分散于眾多數(shù)據(jù)源的數(shù)據(jù)【MeiWei_81重點借鑒文檔】【MeiWei_81重點借鑒文檔】轉(zhuǎn)化成一個全新數(shù)據(jù)源的過程數(shù)據(jù)分析師(DataanalRst)–從事數(shù)據(jù)分析、建模、清理、處理的專業(yè)人員數(shù)據(jù)庫(Dat
8、abase)–一個以某種特定的技術(shù)來存儲數(shù)據(jù)集合的倉庫數(shù)據(jù)庫即服務(wù)(Database-as-a-Service)–部署在云端的數(shù)據(jù)庫,即用即付,例如亞馬遜云服務(wù)(AWS:AmazonWebServices)數(shù)據(jù)庫管理系統(tǒng)(DBMS:DatabaseManagementSRstem)–收集、存儲數(shù)據(jù),并提供數(shù)據(jù)的訪問數(shù)據(jù)中心(Datacentre)–一個實體地點,放置了用來存儲數(shù)據(jù)的服務(wù)器數(shù)據(jù)清洗(Datacleansing)–