科大訊飛 自動駕駛布局聚焦智能語音.doc

科大訊飛 自動駕駛布局聚焦智能語音.doc

ID:28122172

大?。?90.50 KB

頁數(shù):8頁

時間:2018-12-08

科大訊飛 自動駕駛布局聚焦智能語音.doc_第1頁
科大訊飛 自動駕駛布局聚焦智能語音.doc_第2頁
科大訊飛 自動駕駛布局聚焦智能語音.doc_第3頁
科大訊飛 自動駕駛布局聚焦智能語音.doc_第4頁
科大訊飛 自動駕駛布局聚焦智能語音.doc_第5頁
資源描述:

《科大訊飛 自動駕駛布局聚焦智能語音.doc》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在學術論文-天天文庫

1、科大訊飛自動駕駛布局聚焦智能語音  具體用來證明視覺方面能力的例子是Cityscape的榜單成績。后者是一個用來評估視覺算法的數(shù)據(jù)集,可以檢驗算法在城區(qū)場景語義理解方面的表現(xiàn)。今年10月,科大訊飛在自動駕駛場景分割任務中獲得了第一名,主要是使用了名為“層次分割”的技術。  很長一段時間里,科大訊飛在車載前裝領域都是通過車機系統(tǒng)供應商間接向車企提供服務,業(yè)務只聚焦在智能語音技術?! 〔贿^在2016年科大訊飛年會上,我們看到了一款汽車互聯(lián)系統(tǒng)“飛魚助理”??拼笥嶏w正式宣布——未來會包辦一整套車機系統(tǒng)的軟硬件和數(shù)據(jù)服

2、務,角色向TSP轉型?! r隔一年,飛魚升級到了2.0版本,并且形成了更加清晰完整的產(chǎn)品架構。而且我們發(fā)現(xiàn),除了核心的智能語音交互,科大訊飛開始做視覺了?! 】拼笥嶏w自動駕駛布局聚焦智能語音  具體用來證明視覺方面能力的例子是Cityscape的榜單成績。后者是一個用來評估視覺算法的數(shù)據(jù)集,可以檢驗算法在城區(qū)場景語義理解方面的表現(xiàn)。今年10月,科大訊飛在自動駕駛場景分割任務中獲得了第一名,主要是使用了名為“層次分割”的技術。  很長一段時間里,科大訊飛在車載前裝領域都是通過車機系統(tǒng)供應商間接向車企提供服務,業(yè)務

3、只聚焦在智能語音技術?! 〔贿^在2016年科大訊飛年會上,我們看到了一款汽車互聯(lián)系統(tǒng)“飛魚助理”。科大訊飛正式宣布——未來會包辦一整套車機系統(tǒng)的軟硬件和數(shù)據(jù)服務,角色向TSP轉型。  時隔一年,飛魚升級到了2.0版本,并且形成了更加清晰完整的產(chǎn)品架構。而且我們發(fā)現(xiàn),除了核心的智能語音交互,科大訊飛開始做視覺了?!   ∧陼F(xiàn)場用來展示飛魚2.0的廣汽傳祺GS8  飛魚2.0更新了什么?  在飛魚1.0版本上,整個交互體驗更加自然。人和車對話的時候,車就可以記住上下文,理解每一個指代的意思。你可以不用多次喚醒就能

4、調(diào)用導航、音樂、撥打電話等功能,也可以在車說話時打斷它?! ≡诮衲甑哪陼F(xiàn)場,飛魚2.0版本做了升級。科大訊飛汽車事業(yè)部副總經(jīng)理謝信珍告訴記者,去年展示飛魚1.0時更多還是一種未來規(guī)劃,但今年的2.0版本已經(jīng)是可以落地的產(chǎn)品?! 〈蠹铱梢詮纳厦娴囊曨l看到幾個之前沒有的亮點:  1.知道該聽誰的話。新版系統(tǒng)知道要采集哪個方向的聲音,鎖定駕駛員是說出喚醒詞的位置后,副駕座位的聲音就不會出現(xiàn)“搶麥”情況。要實現(xiàn)這個功能,主要是對麥克風陣列和軟件算法做升級?! ?.連接后臺賬號系統(tǒng)。飛魚2.0可以在喚醒后“主動服務”。

5、它會提醒你今天是老婆大人的生日,推薦老婆大人喜歡的餐廳,推薦喜歡的電影然后購票。系統(tǒng)和個人的綁定更深?! ?.接入了車輛總線系統(tǒng)。在1.0中,系統(tǒng)只能用語音控制音樂、導航、電話等信息娛樂功能。在2.0版,我們可以用語音控制開關天窗、調(diào)節(jié)空調(diào)溫度這些和行車安全影響不大的功能?! 〕说谝稽c是智能語音技術上的更新,后兩項都是包辦軟硬數(shù)服一體化后,語音有機會和車、和人發(fā)生的更多關聯(lián)?! ‘斎唬髢身椧泊砹艘环N選擇。更加個性化的服務意味著對個人數(shù)據(jù)使用權的開發(fā),這是用戶面臨的選擇。更加懂得汽車意味著車輛數(shù)據(jù)的開放,這

6、是主機廠面臨的選擇?! “蜒劬行选 ≡谥悄苷Z音交互之外,圖像識別也在汽車場景下找到了發(fā)揮功能的機會。  坦白說,在參會前看到預告時,記者以為視覺技術更多會用在駕駛員身份鑒別。因為科大訊飛研發(fā)主管趙艷軍曾經(jīng)說過,AIUI在定義之初,“就沒有把語音作為唯一的交互方式,而是把它設想為結合了人臉、人體追蹤、手勢、紅外等多種方式為一體的人機交互解決方案”。  所以當科大訊飛說要借助攝像頭的眼睛看向車外時,記者還是有些意外的。  泊車輔助  視覺首個應用場景會是泊車。在有清晰車位線的情況下,可以借助泊車攝像頭觀察外部情況

7、,找到合適車位時,用交互的方式提醒用戶打方向盤,輔助車輛進入車庫。沒有車位線時,也可以司機在屏幕上劃線選擇停車位置,系統(tǒng)把車停到庫中。當然也可以看到,在一開始的版本中,還沒有涉及車輛控制層面的內(nèi)容。  目前視覺的部分仍然由科大訊飛的研究院來推進,選擇的泊車應用也是一個相對簡單的場景。在回答“和專門做視覺的企業(yè)比,科大訊飛有什么優(yōu)勢”這個問題時,汽車業(yè)務部副總經(jīng)理謝信珍提到了科大訊飛在技術源頭上的積累。他認為語音對信號連貫性的要求更高,做語音跨到圖像會更容易?! ityscape數(shù)據(jù)集成績  具體用來證明視覺方

8、面能力的例子是Cityscape的榜單成績。后者是一個用來評估視覺算法的數(shù)據(jù)集,可以檢驗算法在城區(qū)場景語義理解方面的表現(xiàn)。今年10月,科大訊飛在自動駕駛場景分割任務中獲得了第一名,主要是使用了名為“層次分割”的技術?! ?shù)據(jù)集測試成績可以在某種程度上反映科大訊飛的算法能力。不過實際應用中,科大訊飛的算法要面對嵌入式平臺和實時性兩個方面的考慮。謝信珍表示,科大訊飛的優(yōu)勢在于工程優(yōu)化能力,

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。