資源描述:
《AI視覺成像芯片攪動千億級新市場,SoC時代即將過去.doc》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫。
1、AI視覺成像芯片攪動千億級新市場,SoC時代即將過去 “這就像我們在淘寶上買東西,看到的都是賣家秀,拿到手的卻是買家秀。這其中最大的差別,就是光線環(huán)境的問題。” “圖像識別的賣家秀和買家秀之間,永遠(yuǎn)隔著一盞燈光的距離?!毖矍婵萍迹╡yemore)創(chuàng)始人&CEO朱繼志日前在IF創(chuàng)新大會2018上發(fā)布全球首款A(yù)I成像芯片時說,“我們經(jīng)??吹皆诟鞣N圖像識別比賽中,圖像識別率很高。但在實際場景中,比如人臉識別,卻沒有任何一家廠商敢提供識別率數(shù)據(jù),因為現(xiàn)場問題實在太多了?!薄 ∠聢D是朱繼志在發(fā)布會現(xiàn)場分享的一張PPT。左邊,是《花花公子》
2、雜志御用模特Leina一張裸照的一部分。這張照片細(xì)節(jié)豐富、層次分明、邊緣清晰,三十年來所有和圖像算法相關(guān)的圖片,都拿它來做標(biāo)準(zhǔn);但實際在現(xiàn)場拍到的圖片,卻往往是右邊的模樣,根本無法識別?! 皥D像識別的賣家秀和買家秀之間,永遠(yuǎn)隔著一盞燈光的距離?!薄 斑@就像我們在淘寶上買東西,看到的都是賣家秀,拿到手的卻是買家秀。這其中最大的差別,就是光線環(huán)境的問題?!敝炖^志說,給美女拍照片,會設(shè)置很多燈光。然而現(xiàn)實生活中的光線環(huán)境是不可控的,遇到弱光、逆光、反光情況時,成像效果就很差,AI算法無法識別。 給人看的像素時代終結(jié),給機(jī)器看的視
3、覺時代開啟 要解決賣家秀和買家秀的問題,就要靠視覺器官的進(jìn)化,把視覺放在一個系統(tǒng)整體來看。首先是眼睛,在前端負(fù)責(zé)感知,產(chǎn)生圖像;然后是大腦,在后端負(fù)責(zé)認(rèn)知,它分析圖像視覺;此外,還有第三部分—大腦如何控制眼睛,也就是雙方怎樣進(jìn)行智能的交互?只有大腦、眼睛、腦眼交互這三部分都智能化了,才能說機(jī)器視覺是智能的。這也代表了人工智能在產(chǎn)業(yè)里發(fā)展的三個階段:大腦的進(jìn)化、器官的進(jìn)化、大腦和器官交互方式的進(jìn)化?! ∫曈X的三種智能 要了解眼睛這個成像器官的進(jìn)化,就要先回顧一下成像技術(shù)的歷史。成像技術(shù)從30年代美國的膠卷時代開始,代表廠商是柯
4、達(dá);80年代進(jìn)入數(shù)碼時代,產(chǎn)業(yè)轉(zhuǎn)移到了日本,今天看到的所有的數(shù)碼照片,都是源自80年代日本的成像架構(gòu),包括索尼、尼康、佳能等公司。然而到了AI時代,行業(yè)對圖像的需求可能會發(fā)生本質(zhì)的變化:圖像不再是給人看的,而是要給機(jī)器看?! 〗o人看的時候,關(guān)注的自然是像素,喜歡自拍的姑娘,一定會關(guān)心手機(jī)前后攝像頭是多少像素。然而當(dāng)大家開始用iPhoneX刷臉的時候,似乎又沒有多少人關(guān)心攝像頭的像素問題。因為常識告訴我們,人眼看世界的時候,是沒有像素概念的。 人眼是人類長期進(jìn)化的結(jié)果,最強(qiáng)大之處在于對環(huán)境的適應(yīng)能力。正常情況下,看哪里都是清楚的,顏
5、色都是對的,不存在賣家秀和買家秀的問題。相比之下,機(jī)器和人眼最大的差距,就是適應(yīng)性太差,而要解決適應(yīng)環(huán)境的問題,機(jī)器能用的資源只有三種:算力、算法和數(shù)據(jù)。 為了解決各種復(fù)雜光線問題導(dǎo)致的問題,眼擎科技使用了各種新型的算法,計算復(fù)雜度是數(shù)碼成像的50倍以上,通過對大量場景數(shù)據(jù)的測試,使得成像引擎能夠像人類眼睛一樣自動的適應(yīng)各種環(huán)境,消除各種光線環(huán)境的影響,輸出穩(wěn)定的視覺圖像?! 腎oE到VoE,新的千億級市場誕生 視覺技術(shù)分為兩種:成像(imaging)和圖像處理(imageprocessing)。前端成像技術(shù)負(fù)責(zé)生成視覺圖像,
6、后端圖像處理負(fù)責(zé)分析、識別、處理視覺圖像。換句話說,成像相當(dāng)于人的眼睛,圖像處理相當(dāng)于人的大腦?! ∧壳叭斯ぶ悄茴I(lǐng)域的明星公司,包括商湯、曠世、地平線、云從、依圖、深鑒等,都是基于圖像處理算法為核心技術(shù)的獨(dú)角獸公司。在過去的三年里,受深度學(xué)習(xí)技術(shù)的驅(qū)動,圖像處理獲得了飛速的發(fā)展,但前端的成像技術(shù),仍然停留在二十年前的水平,成為AI視覺未來發(fā)展以及商業(yè)應(yīng)用落地的嚴(yán)重的瓶頸,也是當(dāng)前各大AI公司的下一個必爭之地?! 癆I將帶動成像技術(shù)和產(chǎn)業(yè)從像素到視覺的一次大的變革和顛覆。中國是AI視覺產(chǎn)業(yè)落地最快的地方,我相信,這個新的成像技術(shù)的第
7、三個階段,會由中國主導(dǎo)?!敝炖^志說?! 『蛿?shù)碼時代相比,AI時代的成像在成像架構(gòu)、算法模型、評判標(biāo)準(zhǔn)、光線適應(yīng)性等諸多關(guān)鍵環(huán)節(jié)都發(fā)生了本質(zhì)上的變化,傳統(tǒng)的數(shù)碼成像技術(shù)架構(gòu)已不能滿足AI視覺的需求,面臨迅速被淘汰的窘境。未來五年,成像技術(shù)將有望完成從“圖像”到“視覺”的劃時代升級,視覺成像芯片和AI處理芯片一樣,成為人工智能的核心部件,由此衍生的產(chǎn)業(yè)升級需求,將在未來五年催生出成像領(lǐng)域千億級別的新增量市場?! 腎oE到VoE,新的千億級市場誕生 給機(jī)器配置視覺中樞 算力、算法和數(shù)據(jù)集成到一起成為產(chǎn)品,就是一顆芯片,比如眼擎科
8、技此番推出的全球首款A(yù)I視覺專用成像芯片EyemoreX42。這顆芯片采用了全新的成像引擎架構(gòu),集成了超過20種的新型成像算法,感光度最高可以達(dá)到40萬,單次曝光動態(tài)范圍可以超過16bit,最大功耗在1.5W以內(nèi)?! ∪蚴卓預(yù)I