智能咨詢項目前期調(diào)研報告

智能咨詢項目前期調(diào)研報告

ID:9046023

大?。?27.39 KB

頁數(shù):9頁

時間:2018-04-15

智能咨詢項目前期調(diào)研報告_第1頁
智能咨詢項目前期調(diào)研報告_第2頁
智能咨詢項目前期調(diào)研報告_第3頁
智能咨詢項目前期調(diào)研報告_第4頁
智能咨詢項目前期調(diào)研報告_第5頁
資源描述:

《智能咨詢項目前期調(diào)研報告》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫。

1、智能咨詢項目調(diào)研報告2012-2-22【內(nèi)部資料請勿外泄】天津卓朗科技發(fā)展有限公司第1頁共9頁智能咨詢調(diào)研報告一、近似案例:1.1.IBMWatson項目l系統(tǒng)概述信息收集、機(jī)器學(xué)習(xí)、機(jī)器博弈三大部分組成,其中數(shù)據(jù)來源于各種網(wǎng)絡(luò)數(shù)據(jù)和2億頁書面數(shù)據(jù)組成。其中核心部分為DeepQA系統(tǒng),如下圖1)建立知識庫l基于網(wǎng)絡(luò)爬蟲得到相關(guān)文檔l摘取文檔中的知識點l基于知識點覆蓋到的信息量給知識點打分,l將知識點加入到數(shù)據(jù)庫中2)問題分析:確定問題的內(nèi)容,基于初步分析決定解決問題的方法l問題分類將問題中特殊部分(一詞多義、從句、語義、修辭等)進(jìn)行處理,經(jīng)過詞法與語法分析,通過知識分類為每一個問題確定類型l焦

2、點檢測確定問題中與答案相關(guān)的信息,這些信息被稱為焦點,它構(gòu)成了某種關(guān)系的主語或賓語,從而可以用備選答案替換構(gòu)成問題可能的答案l關(guān)系檢測基于主謂賓關(guān)系、語義關(guān)系、時序關(guān)系、地理位置關(guān)系等可以確定焦點【內(nèi)部資料請勿外泄】天津卓朗科技發(fā)展有限公司第9頁共9頁的關(guān)系l問題分解基于深度語法分析、統(tǒng)計分類方法確定問題是否可以分解,以及如何分解。1)生成假說l主搜索依據(jù)問題分析的結(jié)果,搜索出盡可能多的、潛在的包含答案的內(nèi)容。從而通過深入的內(nèi)容分析來獲得備選答案l備選答案生成基于主搜索的內(nèi)容,構(gòu)建最終的備選答案(針對非知識庫的非結(jié)構(gòu)化的主搜索內(nèi)容的構(gòu)建)2)軟濾波基于輕量級的評分算法減少后續(xù)評分的時間復(fù)雜度3

3、)假說和證據(jù)評分將通過軟濾波的備選答案進(jìn)行全面的評估,這里面包括收集額外的支持證據(jù)與深度評分算法4)綜合答案5)答案融合與信心檢測l硬件概述90臺Power750服務(wù)器,每臺服務(wù)器配備四路八核Power7處理器,從而使得Watson總體處理器數(shù)目達(dá)到2880個Power7內(nèi)核Power7采用平衡技術(shù),從而保證每個芯片分?jǐn)傆嬎闳蝿?wù),其中每個芯片主頻為3.55GHZ,從而可以完成美妙180000Gb的計算量l軟件概述100萬行代碼,主要基于C++、java編寫而成,130個系統(tǒng)組件組成,總體設(shè)計采用管道-過濾器模式,將系統(tǒng)平行化從而易于對大規(guī)模數(shù)據(jù)進(jìn)行并行處理l涉及算法共有100多個算法,涵蓋語義

4、識別、分詞、歧義消除、淺讀與深度句法分析、問題分類、問題分解、知識檢索、文本搜索、SparQL三元組的知識搜索、證據(jù)生成、假設(shè)生成、假設(shè)評估、RDF元數(shù)據(jù)存儲l項目目標(biāo)基于watson龐大的知識庫及強(qiáng)大的知識分析與索引能力,能夠更好地才處理企業(yè)內(nèi)部的大數(shù)據(jù),從而達(dá)到“更好地理解用戶”、“更高效地制訂決策”、“改變客【內(nèi)部資料請勿外泄】天津卓朗科技發(fā)展有限公司第9頁共9頁戶服務(wù)”、“預(yù)測風(fēng)險”等應(yīng)用價值l項目團(tuán)隊共有30多名開發(fā)人員進(jìn)行開發(fā),主要有以下組:算法組:16名成員,主要負(fù)責(zé)NLP相關(guān)算法、解決系統(tǒng)架構(gòu)等問題策略組:5名成員,負(fù)責(zé)watson問題系統(tǒng)的問答策略系統(tǒng)組:9名成員,負(fù)責(zé)wat

5、son硬件與軟件的搭建語言學(xué)組:2名成員,負(fù)責(zé)watson系統(tǒng)的數(shù)據(jù)庫分類應(yīng)用組:5名成員,負(fù)責(zé)解決deepQA系統(tǒng)解決實際問題l項目時間:4年l應(yīng)用領(lǐng)域與成功案例現(xiàn)在的成功案例為《危險邊緣》(Jeopardy)比賽中擊敗其他人類對手獲得冠軍;未來準(zhǔn)備應(yīng)用到醫(yī)療輔助診療系統(tǒng)、金融挖掘與決策系統(tǒng)及其他具有大數(shù)據(jù)背景的企業(yè)1.1.WolframAlpha項目l總體概述WolframAlpha是開發(fā)計算數(shù)學(xué)應(yīng)用軟件的沃爾夫勒姆研究公司開發(fā)出的新一代的搜索引擎,能根據(jù)問題直接給出答案,很強(qiáng)大很智能,而不是像百度、谷歌一樣返回一大堆網(wǎng)頁鏈接。按照創(chuàng)始人StephenWolfram的說法,這個網(wǎng)站其實是一

6、個計算知識引擎,而不是搜索引擎。其真正的創(chuàng)新之處,在于能夠馬上理解問題,對問題進(jìn)行正確的語義分析,并給出答案。l詳細(xì)信息Wolfram

7、Alpha并沒有直接采用語義網(wǎng)技術(shù),它有自己的內(nèi)部知識庫,以及大量自有的內(nèi)部語義及本體(ontology),運用已建立的科學(xué)模型或其他模型作為計算的基礎(chǔ),每當(dāng)它進(jìn)行新的計算時,它都會有效地得出新的結(jié)論,在數(shù)據(jù)沖突時會根據(jù)具體問題進(jìn)行語義分析,將問題歸類,給出不同處理方法。Wolfram

8、Alpha背后的數(shù)據(jù)容量超過10T之巨,它們借助于大量的提要(feed)而不斷增長。估計采用的事元包自動機(jī)來有效地組織和計算知識。l創(chuàng)始人簡介斯蒂芬·沃爾夫勒姆(Stephen

9、Wolfram,1959年-),1959年出生于倫敦,科學(xué)家、數(shù)學(xué)軟件Mathematica的發(fā)明者之一。美國計算機(jī)科學(xué)家。23歲時創(chuàng)立復(fù)雜系統(tǒng)研究領(lǐng)域,27歲時(1987年)開發(fā)Mathematica軟件,創(chuàng)立了WolframResearch公司,從事Mathematica的開發(fā)和發(fā)行。2002年時,他出版了一本厚達(dá)1280頁的書《一種新科學(xué)》(〈ANewKindofScience〉),探討“細(xì)

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。