開放語言典藏組織(olac)與語言典藏後設(shè)資料之標準

開放語言典藏組織(olac)與語言典藏後設(shè)資料之標準

ID:40205282

大小:467.31 KB

頁數(shù):36頁

時間:2019-07-25

開放語言典藏組織(olac)與語言典藏後設(shè)資料之標準_第1頁
開放語言典藏組織(olac)與語言典藏後設(shè)資料之標準_第2頁
開放語言典藏組織(olac)與語言典藏後設(shè)資料之標準_第3頁
開放語言典藏組織(olac)與語言典藏後設(shè)資料之標準_第4頁
開放語言典藏組織(olac)與語言典藏後設(shè)資料之標準_第5頁
資源描述:

《開放語言典藏組織(olac)與語言典藏後設(shè)資料之標準》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。

1、開放語言典藏組織(OLAC)與語言典藏後設(shè)資料之標準黃居仁、張如瑩1OutlineIntroductiontoOLACDublinCore&OAIOLACStandardsOLACMetadataSetOLACandAsianLanguagesExamplesSomeRelativeWebSiteOLACLaunch2TheOpenLanguageArchivesCommunity3OLACAimsOLAC,theOpenLanguageArchivesCommunity,isaninternationalpartnersh

2、ipofinstitutionsandindividualswhoarecreatingaworldwidevirtuallibraryoflanguageresourcesby:developingconsensusonbestcurrentpracticeforthedigitalarchivingoflanguageresources;developinganetworkofinteroperatingrepositoriesandservicesforhousingandaccessingsuchresources.

3、4OLACOrganizationCoordinators:StevenBird&GarySimonsAdvisoryBoard:HelenAristarDry,SusanHockey,Chu-RenHuang,MarkLiberman,BrianMacWhinney,MichaelNelson,NicholasOstler,HenryThompson,HansUszkoreit,AntonioZampolliParticipatingArchives&Services:LDC,ELRA,DFKI,CBOLD,ANLC,LA

4、CITO,Perseus,SIL,APS,UtrechtProspectiveParticipants:ASEDA,AcademiaSinica,AISRI,INALF,LCAAJ,Linguist,MPI,NAA,OTA,Rosetta,TibetanDigitalLibrary(UVA)IndividualMembers:~120www.language-archives.org5IntroductiontoOLAC許多協(xié)會需要語言資源,如:語言學家、工程師、教師、演說家﹔許多機構(gòu)提供片段性的架構(gòu),如:檔案管理員、軟體發(fā)

5、展者和出版者。前所未有的契機:延伸性標誌語言(ExtensibleMarkupLanguage,XML)和Unicode題供以結(jié)構(gòu)化方式彈性呈現(xiàn)以及長期儲存資料。線上或非線上的數(shù)位化出版品有效且實際上達到分享語言資源涵義DublinCore後設(shè)資料集(資源分類標準模組)連同OpenArchivesInitiative所提供的交換方法,可建立一個跨越多個儲存器與檔案櫃的架構(gòu)。6TheVisionforanOpenLanguageArchivesCommunity使用者透過一個OLAC的服務(wù)題供者網(wǎng)站搜尋與呈現(xiàn)OLAC的meta

6、data欄位。7TheVisionforanOpenLanguageArchivesCommunity#2理論上-使用者可取得任何需要的資源DATA:任何描述語言的相關(guān)資訊。問卷結(jié)果:25%數(shù)位化,但並未採用相同的後設(shè)資料欄位。TOOLS:有助於創(chuàng)造、瀏覽、查詢或使用語言資料的計算機資源。ADVICE:什麼資源是可靠的?什麼工具適用於此情境?創(chuàng)造新資料時該如何作?8TheVisionforanOpenLanguageArchivesCommunity#3實際上無法得到想要的資源在不同網(wǎng)站擁有不同名字(Name)造成召回率低(

7、lowrecall).在其他領(lǐng)域有相同意義,造成正確率低(precision).是否運用適當軟體以及判斷ADVICE的價值?許多語言資源並非以文字為基礎(chǔ)。語言資源散佈在不同的網(wǎng)站.9TheVisionforanOpenLanguageArchivesCommunity-BridgingthegapthroughcommunityinfrastructureGateway:使用者可獲得data,tool,advice的單一入口網(wǎng)站。Metadata:data,tool,advice的統(tǒng)一描述,包含所有項目的連結(jié)以及解釋如何存取

8、。Review:瀏覽data,tool,advice的評價。Standards:上述各項過程與協(xié)定的基礎(chǔ),例如:metadataschema,harvestingprotocol.10TheVisionforanOpenLanguageArchivesCommunity-Summary:S

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。