資源描述:
《科大訊飛 自動駕駛布局聚焦智能語音.doc》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在學術論文-天天文庫。
1、科大訊飛自動駕駛布局聚焦智能語音 具體用來證明視覺方面能力的例子是Cityscape的榜單成績。后者是一個用來評估視覺算法的數(shù)據(jù)集,可以檢驗算法在城區(qū)場景語義理解方面的表現(xiàn)。今年10月,科大訊飛在自動駕駛場景分割任務中獲得了第一名,主要是使用了名為“層次分割”的技術。 很長一段時間里,科大訊飛在車載前裝領域都是通過車機系統(tǒng)供應商間接向車企提供服務,業(yè)務只聚焦在智能語音技術?! 〔贿^在2016年科大訊飛年會上,我們看到了一款汽車互聯(lián)系統(tǒng)“飛魚助理”??拼笥嶏w正式宣布——未來會包辦一整套車機系統(tǒng)的軟硬件和數(shù)據(jù)服
2、務,角色向TSP轉型?! r隔一年,飛魚升級到了2.0版本,并且形成了更加清晰完整的產(chǎn)品架構。而且我們發(fā)現(xiàn),除了核心的智能語音交互,科大訊飛開始做視覺了?! 】拼笥嶏w自動駕駛布局聚焦智能語音 具體用來證明視覺方面能力的例子是Cityscape的榜單成績。后者是一個用來評估視覺算法的數(shù)據(jù)集,可以檢驗算法在城區(qū)場景語義理解方面的表現(xiàn)。今年10月,科大訊飛在自動駕駛場景分割任務中獲得了第一名,主要是使用了名為“層次分割”的技術。 很長一段時間里,科大訊飛在車載前裝領域都是通過車機系統(tǒng)供應商間接向車企提供服務,業(yè)務
3、只聚焦在智能語音技術?! 〔贿^在2016年科大訊飛年會上,我們看到了一款汽車互聯(lián)系統(tǒng)“飛魚助理”。科大訊飛正式宣布——未來會包辦一整套車機系統(tǒng)的軟硬件和數(shù)據(jù)服務,角色向TSP轉型。 時隔一年,飛魚升級到了2.0版本,并且形成了更加清晰完整的產(chǎn)品架構。而且我們發(fā)現(xiàn),除了核心的智能語音交互,科大訊飛開始做視覺了?! ∧陼F(xiàn)場用來展示飛魚2.0的廣汽傳祺GS8 飛魚2.0更新了什么? 在飛魚1.0版本上,整個交互體驗更加自然。人和車對話的時候,車就可以記住上下文,理解每一個指代的意思。你可以不用多次喚醒就能
4、調(diào)用導航、音樂、撥打電話等功能,也可以在車說話時打斷它?! ≡诮衲甑哪陼F(xiàn)場,飛魚2.0版本做了升級。科大訊飛汽車事業(yè)部副總經(jīng)理謝信珍告訴記者,去年展示飛魚1.0時更多還是一種未來規(guī)劃,但今年的2.0版本已經(jīng)是可以落地的產(chǎn)品?! 〈蠹铱梢詮纳厦娴囊曨l看到幾個之前沒有的亮點: 1.知道該聽誰的話。新版系統(tǒng)知道要采集哪個方向的聲音,鎖定駕駛員是說出喚醒詞的位置后,副駕座位的聲音就不會出現(xiàn)“搶麥”情況。要實現(xiàn)這個功能,主要是對麥克風陣列和軟件算法做升級?! ?.連接后臺賬號系統(tǒng)。飛魚2.0可以在喚醒后“主動服務”。
5、它會提醒你今天是老婆大人的生日,推薦老婆大人喜歡的餐廳,推薦喜歡的電影然后購票。系統(tǒng)和個人的綁定更深?! ?.接入了車輛總線系統(tǒng)。在1.0中,系統(tǒng)只能用語音控制音樂、導航、電話等信息娛樂功能。在2.0版,我們可以用語音控制開關天窗、調(diào)節(jié)空調(diào)溫度這些和行車安全影響不大的功能?! 〕说谝稽c是智能語音技術上的更新,后兩項都是包辦軟硬數(shù)服一體化后,語音有機會和車、和人發(fā)生的更多關聯(lián)?! ‘斎唬髢身椧泊砹艘环N選擇。更加個性化的服務意味著對個人數(shù)據(jù)使用權的開發(fā),這是用戶面臨的選擇。更加懂得汽車意味著車輛數(shù)據(jù)的開放,這
6、是主機廠面臨的選擇?! “蜒劬行选 ≡谥悄苷Z音交互之外,圖像識別也在汽車場景下找到了發(fā)揮功能的機會。 坦白說,在參會前看到預告時,記者以為視覺技術更多會用在駕駛員身份鑒別。因為科大訊飛研發(fā)主管趙艷軍曾經(jīng)說過,AIUI在定義之初,“就沒有把語音作為唯一的交互方式,而是把它設想為結合了人臉、人體追蹤、手勢、紅外等多種方式為一體的人機交互解決方案”。 所以當科大訊飛說要借助攝像頭的眼睛看向車外時,記者還是有些意外的。 泊車輔助 視覺首個應用場景會是泊車。在有清晰車位線的情況下,可以借助泊車攝像頭觀察外部情況
7、,找到合適車位時,用交互的方式提醒用戶打方向盤,輔助車輛進入車庫。沒有車位線時,也可以司機在屏幕上劃線選擇停車位置,系統(tǒng)把車停到庫中。當然也可以看到,在一開始的版本中,還沒有涉及車輛控制層面的內(nèi)容。 目前視覺的部分仍然由科大訊飛的研究院來推進,選擇的泊車應用也是一個相對簡單的場景。在回答“和專門做視覺的企業(yè)比,科大訊飛有什么優(yōu)勢”這個問題時,汽車業(yè)務部副總經(jīng)理謝信珍提到了科大訊飛在技術源頭上的積累。他認為語音對信號連貫性的要求更高,做語音跨到圖像會更容易?! ityscape數(shù)據(jù)集成績 具體用來證明視覺方
8、面能力的例子是Cityscape的榜單成績。后者是一個用來評估視覺算法的數(shù)據(jù)集,可以檢驗算法在城區(qū)場景語義理解方面的表現(xiàn)。今年10月,科大訊飛在自動駕駛場景分割任務中獲得了第一名,主要是使用了名為“層次分割”的技術?! ?shù)據(jù)集測試成績可以在某種程度上反映科大訊飛的算法能力。不過實際應用中,科大訊飛的算法要面對嵌入式平臺和實時性兩個方面的考慮。謝信珍表示,科大訊飛的優(yōu)勢在于工程優(yōu)化能力,