關(guān)于語義距離及其運算

關(guān)于語義距離及其運算

ID:38786232

大?。?7.44 KB

頁數(shù):6頁

時間:2019-06-19

關(guān)于語義距離及其運算_第1頁
關(guān)于語義距離及其運算_第2頁
關(guān)于語義距離及其運算_第3頁
關(guān)于語義距離及其運算_第4頁
關(guān)于語義距離及其運算_第5頁
資源描述:

《關(guān)于語義距離及其運算》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。

1、論文3.2關(guān)于語義距離及其計算“語義距離”這個概念試圖對概念之間關(guān)聯(lián)性的強弱給以定量表述。關(guān)聯(lián)性的定量表述有“相關(guān)函數(shù)”或“相關(guān)系數(shù)”這樣現(xiàn)成的術(shù)語。所以直接采用“概念相關(guān)函數(shù)”或“語義相關(guān)系數(shù)”之類的術(shù)語比較自然,“語義距離”這個術(shù)語的引入在理論上并無必要,不過是取其表述簡明而已,實際上語義距離的計算就是計算概念之間的相關(guān)系數(shù)。不同概念之間的關(guān)聯(lián)性有明顯的強弱之分,這是毫無疑義的。但是如何量化和如何計算,則需要新的思路,不可能照搬信號處理中求相關(guān)函數(shù)的統(tǒng)計方法。統(tǒng)計方法的出發(fā)點是將待考察的系統(tǒng)視為“黑箱”,但語句不是“黑箱”,即使是語音識別系統(tǒng)的輸出語音陣

2、列,也只能說是一個“明暗相間、明為主導(dǎo)”的箱子,棄“明”而不用,顯然是不明智的。概念之間的關(guān)聯(lián)性需要通過多重層面予以表達,有概念層面的關(guān)聯(lián)性,有詞匯層面的關(guān)聯(lián)性,有語法層面的關(guān)聯(lián)性,有語義塊內(nèi)部的關(guān)聯(lián)性,有語義塊之間的關(guān)聯(lián)性。不同層面相關(guān)系數(shù)的量化和計算方法都應(yīng)該有所不同。對這些不同側(cè)面的辯識是進行語義距離計算的先決條件,以語句物理表示式為立足點的句類分析,是判斷這些先決條件的強有力武器,在上一節(jié)針對十個例句作了示范性說明。這是語義距離計算的基本特點。相關(guān)函數(shù)是一個條件概率,語義距離的條件性更為突出,在某種意義上,條件的把握是計算語義距離的關(guān)鍵。下面將對條件

3、進行具體的說明,上一節(jié)對十個例句的分析都是側(cè)重對條件的闡述,從中可以看到,句類知識是最基本的條件。當然,在某種情況下,對條件可以弱化。語法學所概括的詞性約束規(guī)則:即形容詞與名詞、副詞與動詞和形容詞、數(shù)詞與量詞的搭配規(guī)則就是明顯的例子。這些搭配實際上是有條件的,但作為語法規(guī)則來陳述,可以不管條件。概念關(guān)聯(lián)性或語義距離的概念,在某種意義上是對上述詞性約束規(guī)則的擴展和深化。擴展表現(xiàn)在它力圖表述語義塊之間或語句要素之間的約束,深化表現(xiàn)在它力圖盡可能給出條件。語句要素之間的約束就是[1]中所闡述的鏈式關(guān)聯(lián),這一知識分別從概念層面和詞匯層面進行表達。前者的表述是概念關(guān)聯(lián)

4、性知識庫的內(nèi)容[6],后者的表述是詞語知識庫的內(nèi)容[7]。條件則通過句類知識、交式關(guān)聯(lián)和“同行優(yōu)先”三條途徑來表述,后兩條實際上就是詞性匹配的具體條件,第一條是運用鏈式關(guān)聯(lián)知識的條件。從上面的說明可知,語義距離的計算首先要區(qū)分語義塊之間兩種情況。語義塊內(nèi)部語義距離的計算主要是運用:“同行優(yōu)先”準則;概念關(guān)聯(lián)性知識庫中“交式關(guān)聯(lián)”知識[6];語義結(jié)構(gòu)方程所給出的語義塊構(gòu)成知識[7]。p69語義塊之間語義距離的計算主要是運用:概念關(guān)聯(lián)性知識庫中的基本句類知識和概念節(jié)點的鏈式關(guān)聯(lián)知識;語義結(jié)構(gòu)方程所給出的搭配知識。所謂“同行優(yōu)先”準則,是對層次網(wǎng)絡(luò)符號天然屬性的一

5、種簡明陳述,正式的陳述是:同行的五元組概念及掛靠的(w,p)類概念優(yōu)先相互搭配,在[1]中曾對此詳加闡述。從應(yīng)用的角度來看,這不過是用數(shù)字符號表達概念關(guān)聯(lián)性的一個簡單技巧。在具體應(yīng)用這一準則于語義距離計算時,要區(qū)分四種不同的搭配方式,因為每種搭配方式各有自己的約束準則。四種搭配方式是:修飾型搭配;補充型搭配;并合型搭配;對象內(nèi)容型搭配。前三種是語義塊內(nèi)部的搭配,第四種則表現(xiàn)為語義塊之間的搭配。下面就來對這四種搭配作較詳細的說明?!P(guān)于修飾型搭配修飾型搭配大體上相應(yīng)于語法學的上述詞性約束規(guī)則,“同行優(yōu)先”準則不過是對此規(guī)則的運用條件給以表述。“衷心的祝?!?、

6、“衷心的石頭”、“衷心的消息”都是形容詞與名詞搭配,但后者不合理?!爸孕牡叵M薄爸孕牡脑{咒……”都是副詞與動詞的搭配,但后者不合理。把這些詞匯映射成層次網(wǎng)絡(luò)符號,通過語義距離計算,計算機不難得到“衷心的祝?!薄爸孕牡叵M闭Z義距離最小的結(jié)論,不難作出“衷心的詛咒”絕對不合理的結(jié)論。同時,也不難得到“衷心的石頭”“衷心的消息”不合理的結(jié)論。對修飾型搭配的語義距離計算,就是將兩概念的層次符號從高往低逐層匹配,“相同得分,相異不計”,它類似于在極性重合相關(guān)處理時期對相關(guān)系數(shù)的簡化計算。但計算前必須進行約束性檢驗,對修飾型搭配來說,需要作兩項檢驗:一是詞性及其

7、順序的檢驗,二是對偶性檢驗。兩概念組合的合理性或合法性,可從關(guān)聯(lián)性和排斥性兩個角度進行考察。排斥性可視為反關(guān)聯(lián),相應(yīng)于相關(guān)函數(shù)的負值。但在語義距離計算時,僅取正值,負值一律視為相斥。從這個意義上說,約束性檢驗就是互斥或正負檢驗。不滿足約束條件,就意味著互斥,表示兩概念不能組合,這一結(jié)果對于解模糊或糾錯處理最為實用。詞性約束是常規(guī)的語法知識,無庸贅述。需要說明的只是它的兩條順序約束:一,gu類概念作為形容詞使用時,在順序上可前可后,但ug類概念優(yōu)先于前;二,u及vu類概念作為副詞使用時,在順序上可前可后,但uv及uu類概念優(yōu)先于前。參見存疑錄上面例句10中的“

8、日益惡化”就是一個典型的同行修飾搭配,“日益”就個u

當前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。