資源描述:
《國家圖書館數據管理與分析平臺建設-國家圖書館學刊》由會員上傳分享,免費在線閱讀,更多相關內容在工程資料-天天文庫。
1、·信息組織·國家圖書館數據管理與分析平臺建設張寧李雪摘要國家圖書館數據管理與分析平臺是國家圖書館大數據工程的一個實驗性項目。該項目選取國家圖書館五個核心系統的數據,在虛擬化平臺上搭建相應的系統平臺,通過數據收集、ETL處理、數據統計與分析等流程,形成統一的數據處理規(guī)范,并建立讀者、資源和行為數據的標簽化體系,從數據層面上揭示國家圖書館的館藏資源、資源利用情況和用戶行為等重要信息,為國家圖書館大數據利用提供理論與實踐依據。圖1。表2。參考文獻33。關鍵詞數據處理與分析ETL大數據標簽體系TheCons
2、tructionofDataManagementandAnalysisPlatformoftheNationalLibraryofChinaZhangNingLiXueAbstract:TheDataManagementandAnalysisPlatformisanexperimentalprojectofbig-dataprogramintheNationalLibraryofChina(NLC).TheprojectselectsthedataoffivecoresystemsoftheNLC,
3、buildsthecor?respondingsystemplatformonthevirtualplatform,formsunifieddataprocessingspecificationthroughdatacol?lection,ETLprocess,datastatisticsandanalysis,andestablisheslabelsystemforreaders,resourcesandbe?havior,whichrevealstheimportantinformationof
4、collectionresources,utilizationoftheresources,userbehav?iorandotherimportantinformationintheNLCfromthedatalevel,andprovidestheoreticalandpracticalbasisfortheutilizationofbigdataintheNLC.1fig.2tabs.33refs.Keywords:DataManagementandAnalysis;Extract-Trans
5、form-Load;BigData;LabelSystem圖書館作為社會重要的信息資源中心,不僅據共享、公益服務和知識服務上,并為專業(yè)機構、擔負著保存人類文化遺產、傳承人類文明的重要社會團體和個人用戶提供服務。例如,美國國家責任,還擔負著傳播文化知識、參與社會教育的醫(yī)學圖書館為實現生物學和臨床信息數據共享[4]重要職責。隨著信息技術的高速發(fā)展,圖書館的開展的“整合生物學與臨床信息項目”;美國各信息服務也愈來愈依賴互聯網、云計算、大數據類公共圖書館、行業(yè)協會等非營利機構利用大數[1]等技術。因此,將大
6、數據與圖書館業(yè)務相結據開展的“數據無邊界運動”,為公益服務的開展合,分析圖書館現階段數據組織、分析、挖掘的開[5]提供幫助;哈佛大學圖書館將1200多萬種書展情況,以及大數據時代用戶對信息資源的利用目、音視頻、手稿等數據向讀者公布,并提供下載需求,對推動大數據在圖書館建設和服務中的應[6]服務,滿足用戶的知識服務需求。除美國外,用具有重要意義。歐洲國家的圖書館大數據應用也主要集中在數據的開放與共享上。例如,由大英圖書館、荷蘭代1國內外圖書館大數據應用情況爾夫特理工大學圖書館和德國國家科學技術圖隨著美
7、國、英國、法國等歐美國家紛紛提出書館等共同組建的DataCite非營利組織,為社會[2]團體提供研究數據的數字對象唯一標識符大數據發(fā)展戰(zhàn)略,大數據逐漸成為各行業(yè)的研究熱點,圖書館界也開始了相關的研究與應(DOI),幫助其尋找、識別和引用權威研究數據;[3]用。以美國為例,圖書館大數據主要應用在數歐盟委員會在2011年11月提出的“歐盟開放數80·信息組織·據戰(zhàn)略”,向社會開放大部分公共部門數據,范圍該項目旨在實現以下幾點:(1)在對各重點覆蓋圖書館、博物館和檔案館等組織。應用系統相關數據內容的抽取、
8、凈化與轉換的過與國外相比,國內圖書館對大數據的研究和程中,形成數據管理與分析平臺的統一數據處理應用起步較晚,研究內容主要集中在大數據的內規(guī)范。(2)構建標簽化體系,將讀者數據和資源[7]涵、特征和應用邊界等基礎理論上。雖然不少數據打上結構化標簽,構建用戶和資源的“數據學者指出大數據可應用于信息服務、學科服務、畫像”。(3)通過讀者屬性和行為數據的分析與參考咨詢、個性化服務、信息營銷、預測分析和新挖掘,為圖書館的個性化服務或線上線下活動提[8]型知識服務等方面,但在實際