資源描述:
《從引文分析看網(wǎng)絡結構挖掘》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在行業(yè)資料-天天文庫。
1、從引文分析看網(wǎng)絡結構挖掘洪光宗深圳圖書館廣東深圳518026[摘要]本文在闡述引文分析的原理及作用的基礎上,分析了網(wǎng)絡結構挖掘的原理和作用,并給出了網(wǎng)絡結構挖掘技術在搜索引擎中幾例初步應用。[關鍵詞]引文分析網(wǎng)絡結構挖掘網(wǎng)絡數(shù)據(jù)挖掘AnalyzingWebStructureMiningFromCitationAnalysisAspectHongGuangzongShenzhenLibrary,Shenzhen,Guangdong518026[Abstract]Themethodofwebstructureminingoriginatesfromcitationana
2、lysis,thearticleatfirstsetsforththeprincipleandfunctionofthecitationanalysis,thenanalysestheprincipleandfunctionofwebstructuremining.Atpresent,thetechnologyofwebstructureminingisappliedintosearchengineandhasgotagoodeffectonit.[Keyword]Citation;Citationanalysis;Webstructuremining;Webdat
3、amining1955年,加菲爾德博士發(fā)表了具有劃時代意義的引文索引論文《CitationIndexesforScience:ANewDimensioninDocumentationthroughAssociationofIdeas》,1964年,推出了第一個科學引文索引。如今,世界各地的研究人員利用引文索引深入地研究和評估他們的工作。時代已經(jīng)跨入21世紀,互聯(lián)網(wǎng)風行全球,大量的數(shù)據(jù)資源以二進制的形式存貯,并以超級鏈接的形式將這些資源聯(lián)結成一個立體網(wǎng)絡。那么,挖掘出這些數(shù)據(jù)資源之間的內(nèi)在聯(lián)系,為我們科學地分析和評估這些數(shù)據(jù)資源提供幫助,這正是網(wǎng)絡結構挖掘的作用之所在
4、。1引文分析的原理及作用1.1引文及引文分析任何一篇論文都不是孤立存在的,而是相互影響和相互聯(lián)系的,不同文獻間的聯(lián)系突出表現(xiàn)在文獻間的相互引用。那么,什么叫引文呢?簡單而言,引文就是引用他人的著述。在科學著述活動中,作者往往要直接或間接地引用他人的著述,以提供文章的佐證,提供歷史背景材料,來加強論述的可信度,幫助讀者更好地理解作者的觀點。詳細而言,引文便可以這樣描述:在文獻甲中提到或描述了文獻乙,并以文后參考書目或腳注的形式列出了文獻乙的出處,其目的在于指出信息的來源、提供某一觀點的依據(jù)、借鑒陳述某一事件(實)等。這時,便稱文獻乙為文獻甲的引文,稱文獻甲為文獻乙的引
5、證文獻。引文通常也稱為被引文獻或參考文獻,引證文獻通常也稱為來源文獻。文獻間的相互引用,表明知識信息內(nèi)容的繼承和利用,標志著學術研究的進展。正因為引文在科學發(fā)展、學術研究中的特殊作用,對引文進行研究分析,可以讓我們更清楚地發(fā)現(xiàn)文獻間的內(nèi)在聯(lián)系。所謂引文分析,就是對專業(yè)人員論著之間的引用與被引用的現(xiàn)象運用統(tǒng)計、歸納、比較、抽象、概括等分析方法,對科學期刊、論文、著者等各種分析對象的引用或被引用現(xiàn)象進行分析,以揭示各種文獻集合以及與文獻交流有關的各種集合特征和集合之間聯(lián)系的文獻計量研究方法。引文分析作為一項學術成果,同時作為一種研究方法,其應用十分廣泛。比如說,我們可以
6、用引文分析法來進行機構和人才的評價,作為科學管理的工具;也可以用來研究引文間立體網(wǎng)絡關系,從而提示科學發(fā)展、歷史背景、前景等;還可以用來進行文獻檢索,對期刊地位進行學術評價等。1.2引文分析的原理 從宏觀的角度來看,文獻間引用和被引用的特有關系構成了文獻信息的整體,整個文獻信息構成一張網(wǎng),這張網(wǎng)是以文獻(作者或期刊)為節(jié)點、以文獻引證關系為邊的鏈型、樹型、網(wǎng)型的結構,這些鏈、樹、網(wǎng)可以用加權有向圖統(tǒng)一描述。根據(jù)劃分的標準不同,網(wǎng)絡結構也不一樣?! r序網(wǎng)絡。在一組重要的具有代表性的引文中,每篇論文(或著者、或某期刊)作為節(jié)點,按時間先后標以序號,連接這些節(jié)點并以引
7、用次數(shù)或其被引率為權值,即構成引文時序網(wǎng)絡圖。時序網(wǎng)絡圖能夠展示出某個研究主題的論文源流、最初著者以及該主題發(fā)展的來龍去脈,從中可以探討科學技術的歷史發(fā)展和研究規(guī)律?! ⊥W(wǎng)絡。當兩篇或兩篇以上的文獻共同被后來的一篇或多篇的文獻引用,則稱這兩篇文獻為同引,具有同引關系的兩篇文獻分別與其他文獻構成同引關系,這些具有同引關系的文獻形成的網(wǎng)絡被稱為同引網(wǎng)絡。利用同引關系進行分析研究,可以展示和預測科學情報交流、傳遞的結果,同時也是文獻檢索的一種好方法?! ●詈暇W(wǎng)絡。若兩篇文獻共同引用了一篇或多篇文獻,則稱這兩篇文獻有耦合關系,如果多篇文獻間具有耦合關系,則構成一個耦