一片小小的人工智能視覺(jué)芯片能做什么?無(wú)人駕駛汽車主動(dòng)識(shí)別并避讓行人、攝像頭實(shí)時(shí)甄別在逃犯……這些影視作品中的情節(jié),或許不久將可通過(guò)基于嵌入式人工智能視覺(jué)芯片的“解決方案”成為現(xiàn)實(shí)。
人工智能芯片被視為未來(lái)人工智能時(shí)代的戰(zhàn)略制高點(diǎn)。在視覺(jué)感知領(lǐng)域,人工智能視覺(jué)芯片正逐步應(yīng)用于智能手機(jī)、安防監(jiān)控、自動(dòng)駕駛、醫(yī)療成像和智能制造等領(lǐng)域。
可根據(jù)AI需求成像
縱觀信息產(chǎn)業(yè)發(fā)展歷程,從個(gè)人電腦時(shí)代到移動(dòng)互聯(lián)網(wǎng)時(shí)代,承載高性能計(jì)算的芯片決定新型計(jì)算平臺(tái)的基礎(chǔ)架構(gòu)和發(fā)展生態(tài),并掌握著產(chǎn)業(yè)鏈最核心的話語(yǔ)權(quán)。
中國(guó)科學(xué)院院士張鈸指出,傳統(tǒng)硬件架構(gòu)難以滿足人工智能時(shí)代深度學(xué)習(xí)的要求,新的算法需要新的硬件來(lái)支撐。同時(shí),芯片的結(jié)構(gòu)將越來(lái)越像“大腦”,類腦芯片、智能芯片等將是人工智能的發(fā)展方向。
“所謂視覺(jué)芯片,實(shí)際上是一種具有高速圖像采集和實(shí)時(shí)圖像處理功能的片上集成系統(tǒng)芯片。”中國(guó)科學(xué)院半導(dǎo)體研究所半導(dǎo)體超晶格國(guó)家重點(diǎn)實(shí)驗(yàn)室研究員吳南健介紹說(shuō),在日前舉辦的國(guó)家自然科學(xué)基金優(yōu)秀成果北京對(duì)接會(huì)上,吳南健帶領(lǐng)研究團(tuán)隊(duì)展示的新型視覺(jué)芯片(Vision Chip)科研成果很是引人注目。
據(jù)介紹,這種視覺(jué)芯片集成高速圖像傳感器和大規(guī)模并行圖像處理電路,能夠模仿人類視覺(jué)系統(tǒng)視覺(jué)信息并行處理機(jī)制,解決現(xiàn)有視覺(jué)圖像系統(tǒng)中數(shù)據(jù)串行傳輸和串行處理的速度限制瓶頸問(wèn)題。
吳南健解釋說(shuō),人工視覺(jué)的架構(gòu)分兩部分,類似于人的眼睛和大腦。人的眼睛是一個(gè)典型的圖像傳感器,能夠攝取圖像并且進(jìn)行一些噪音去除等初級(jí)圖像處理;人的大腦神經(jīng)元網(wǎng)絡(luò)是一個(gè)視覺(jué)圖像處理系統(tǒng),具有非常強(qiáng)的對(duì)所攝取的視覺(jué)信息進(jìn)行并行處理的能力。
AI視覺(jué)芯片與攝像頭的關(guān)系是——芯片做的是大腦,攝像頭做的是眼睛。這里就存在一個(gè)問(wèn)題:大腦該如何控制眼睛?遠(yuǎn)望智庫(kù)人工智能事業(yè)部部長(zhǎng)、圖靈機(jī)器人首席戰(zhàn)略官譚茗洲解釋道,傳統(tǒng)的技術(shù)方法是定義一個(gè)通信控制接口,但在視覺(jué)應(yīng)用中這種做法會(huì)非常復(fù)雜。人眼的成像是非常聚焦的,只看到關(guān)注的東西。當(dāng)AI算法解決了“要看什么”的問(wèn)題后,前端成像就有了目標(biāo),可以把所有的資源都調(diào)配到關(guān)注的對(duì)象上,做到“指哪打哪”,也就是取出噪音的處理過(guò)程,可以更高效智能地處理視覺(jué)信息。這種根據(jù)AI的需求來(lái)成像,能解決很多以前解決不了的問(wèn)題。
“通常以前處理的方式,是通過(guò)攝像頭把信息攝錄,傳到服務(wù)器或云端后,利用服務(wù)器上的顯卡進(jìn)行運(yùn)算,現(xiàn)在是將視覺(jué)芯片嵌入攝像頭,讓其本身可以處理信息,做成專用芯片,如果芯片大批量生產(chǎn),在價(jià)格上會(huì)便宜非常多,極大降低成本。這就是目前這項(xiàng)技術(shù)突破的核心價(jià)值。”譚茗洲在接受科技日?qǐng)?bào)記者采訪時(shí)指出。
比人類視覺(jué)更具優(yōu)勢(shì)
在我們通常的印象中,一個(gè)視力正常的人可以迅速且毫不費(fèi)力地感知世界,甚至可以詳細(xì)生動(dòng)地感知整個(gè)視覺(jué)場(chǎng)景;但其實(shí)這只是一個(gè)錯(cuò)覺(jué)。
“人類生理視覺(jué)有著天然的局限,只有投射到眼球中心視覺(jué)場(chǎng)景的中間部分,我們才能看清楚。比起人眼來(lái),嵌入視覺(jué)芯片的機(jī)器將具備相當(dāng)多的優(yōu)勢(shì),因?yàn)榭梢詡鞲懈鼘挼念l譜范圍、更高的清晰度、更寬的視角,其視力遠(yuǎn)不止5.0,在夜間也可以看得很清楚。如同AlphaGo戰(zhàn)勝‘圍棋天才’一樣,在某些應(yīng)用場(chǎng)景,其視覺(jué)在準(zhǔn)確性、客觀性、穩(wěn)定性等方面都要比人類視覺(jué)更具優(yōu)勢(shì)。”譚茗洲指出。
吳南健介紹說(shuō),目前,國(guó)內(nèi)外在人工視覺(jué)芯片領(lǐng)域的研究主要是CMOS圖像傳感器芯片技術(shù)、并行圖像處理技術(shù)和CMOS集成技術(shù)。在CMOS圖像傳感器領(lǐng)域,國(guó)際技術(shù)水平朝著高分辨率、寬動(dòng)態(tài)范圍、高幀率、高智能化、寬波長(zhǎng)范圍和三維成像的方向發(fā)展。人工視覺(jué)系統(tǒng)芯片能夠完成圖像獲取和初級(jí)(圖像濾波)、中級(jí)(特征提?。?、高級(jí)(特征識(shí)別和不規(guī)則處理)3個(gè)圖像處理步驟。
“視覺(jué)芯片關(guān)鍵要解決運(yùn)行效率和處理3D影像這兩個(gè)問(wèn)題。以往視覺(jué)芯片處理信號(hào)面臨的最大問(wèn)題是因運(yùn)算量太大導(dǎo)致處理信息速度低,以及攝取的照片是把三維世界‘壓縮’成二維影像,在一張平面上已分不清物體距離遠(yuǎn)近、立體空間形狀、空間位置等,而人眼可把這個(gè)還原。”譚茗洲表示。
記者了解到,新型人工智能視覺(jué)系統(tǒng)芯片,是將高速CMOS圖像傳感器、并行信號(hào)處理單元和輸出電路集成于單一芯片內(nèi),實(shí)現(xiàn)實(shí)時(shí)視覺(jué)芯片系統(tǒng)。將不同功能的技術(shù)集成在一個(gè)芯片上有很多優(yōu)勢(shì),實(shí)現(xiàn)圖像獲取和圖像信息處理每秒一千幀的系統(tǒng)速度,可廣泛應(yīng)用于高速圖像處理、快速圖像識(shí)別解釋、高速運(yùn)動(dòng)目標(biāo)的實(shí)時(shí)追蹤等領(lǐng)域。
譚茗洲指出:“目前,中科院設(shè)計(jì)的新型視覺(jué)系統(tǒng)芯片理念非常先進(jìn),仿照人類視網(wǎng)膜神經(jīng)元機(jī)制設(shè)計(jì),感光對(duì)信號(hào)的處理方式,揀取有用的信號(hào)進(jìn)行處理,極大地減少了運(yùn)算的體量。”
未來(lái)市場(chǎng)空間巨大
“以我個(gè)人的觀點(diǎn),視覺(jué)系統(tǒng)芯片會(huì)成為必然的趨勢(shì),就像手機(jī)和相機(jī)結(jié)合成就智能手機(jī)一樣,目前在技術(shù)上已突破填充率低、分辨率低和信號(hào)干擾嚴(yán)重的難題,將科研成果轉(zhuǎn)化并投放市場(chǎng)只不過(guò)是時(shí)間問(wèn)題。”吳南健表示。
記者了解到,目前基于該技術(shù)的產(chǎn)成品已經(jīng)試用于一些創(chuàng)新企業(yè),比如在工業(yè)產(chǎn)品的自動(dòng)化檢測(cè)領(lǐng)域完全可以使用視覺(jué)系統(tǒng)芯片代替人工檢測(cè);在智能監(jiān)控領(lǐng)域,過(guò)去需要將視覺(jué)處理芯片裝在具有傳感器技術(shù)的攝像頭上,通過(guò)把數(shù)據(jù)結(jié)構(gòu)化、再壓縮送到數(shù)據(jù)中心的復(fù)雜方式完成數(shù)據(jù)傳輸和計(jì)算。
那么,視覺(jué)系統(tǒng)芯片如果在未來(lái)實(shí)現(xiàn)產(chǎn)業(yè)化,其市場(chǎng)空間有多大?據(jù)推算,2018年,圖像傳感器的市場(chǎng)規(guī)模在150億美元左右,雖然其中120億美元發(fā)生在智能手機(jī)領(lǐng)域,但未來(lái)發(fā)展比較快的4個(gè)領(lǐng)域是安防、國(guó)防、汽車、醫(yī)療,到2021年將會(huì)迎來(lái)40億美元的市場(chǎng)空間,年增長(zhǎng)率約10%—20%。
“視覺(jué)處理器的需求增長(zhǎng)會(huì)更快,目前該市場(chǎng)的整體規(guī)模(包括硬件、軟件、服務(wù))在170億美元至180億美元,單從硬件來(lái)看也占到約30億美元。如果視覺(jué)系統(tǒng)芯片可以覆蓋70億美元的市場(chǎng)規(guī)模,企業(yè)在這中間拿到1%的話,其盈利空間就已經(jīng)很大了。”吳南健指出。
近年來(lái),國(guó)內(nèi)外一批新型人工智能企業(yè),依托人工智能領(lǐng)域技術(shù)和算法優(yōu)勢(shì)向芯片行業(yè)滲透,加強(qiáng)人工智能芯片基礎(chǔ)層研發(fā)。從市場(chǎng)格局來(lái)看,已經(jīng)發(fā)展成為一個(gè)相對(duì)獨(dú)立又相互依存的產(chǎn)業(yè)生態(tài)。在前端,索尼是圖像傳感器市場(chǎng)、生產(chǎn)和技術(shù)的領(lǐng)導(dǎo)者,緊隨其后的三星和豪威科技也保持著不錯(cuò)的競(jìng)爭(zhēng)力;在后端,Mobileye和英偉達(dá)(NVIDIA)是提供視覺(jué)處理芯片的主要廠商,在國(guó)內(nèi)該領(lǐng)域的公司有地平線等。
然而,截至目前,尚未有企業(yè)實(shí)現(xiàn)“圖像傳感器+視覺(jué)處理器”集成式芯片的大規(guī)模量產(chǎn)。不管是現(xiàn)在的創(chuàng)業(yè)企業(yè),還是已經(jīng)在市場(chǎng)上占有一定份額的大企業(yè),不是做圖像傳感器,就是做后端的視覺(jué)處理器。正如吳南健所言,這將給初創(chuàng)企業(yè)帶來(lái)機(jī)會(huì)。