3D視覺深度研究:智能交互進入新時代
發布時間:2017-03-17 責任編輯:wenwei
【導讀】3D深度視覺作為一個嶄新的技術,已經出現在微軟Kinect、英特爾RealSense等消費級產品中,隨著硬件端技術的不斷進步,算法與軟件層麵的不斷優化,3D深度視覺的精度和實用性得到大幅提升,尤其是TOF方案與VCSEL的快速成熟,使得“深度相機+手勢/人臉識別”具備了大規模進入移動智能終端的基礎。
我們通過本報告,詳細地梳理了3D深度視覺不同技術方案與硬件結構的差異,分析了國外公司在相關技術領域的布局。我們相信3D深度視覺進入消費級智能終端將是大勢所趨,這將為VCSEL、紅外CIS攝像頭(含紅外窄帶濾色片)、模組封裝帶來新的市場增量。移動端手勢/renlianshibiedailaidianfuxingquanxindeyonghutiyan,yujijiangshixiankuaisudeshentouyupuji,youyuxiaofeijizhinengzhongduanpangdadeyonghushuliang,zhejiangchuangzaoyigepangdadexinshichang。
相關產業鏈受益公司:
綜合技術方案提供商——海外:微軟、英特爾等科技巨頭,德州儀器、意法、英飛淩、AMS(收購Heptagon)等芯片巨頭,SoftKinetic(索尼)、PrimeSense(蘋果)、LeapMotion等明星公司;國內:舜宇光學。
係統模組封裝——海外:LG Innotek、Sharp等;國內:舜宇光學、歐菲光等。
VCSEL設計——Finsar、Lumentum、Princeton Optronics、Heptagon、ⅡⅥ等公司。國內相關標的:光迅科技等。
VCSEL代工與封測——海外:全新、聯亞光電(外延片),宏捷科、穩懋(代工),聯鈞、矽品、同欣(封測)。國內相關標的:三安光電等。
紅外與可見光攝像頭——海外:大立光、玉晶光電、奇景光電、索尼、三星等;國內相關標的:北京君正(擬並購豪威)、舜宇光學、歐菲光、丘鈦科技等。
紅外濾色片——海外:VIAVI等;國內:水晶光電等。
圖像處理芯片——海外:德州儀器、意法半導體、英飛淩、恩智浦等;國內:全誌科技、北京君正、瑞芯微(國內相關主題標的)。
DOE與LENS——海外:奇景光電、精材、采鈺、台積電等;
投資要點:
移動端3D深度視覺技術加速,有望創造一個全新的大市場。我們通過本報告,詳細地梳理了3D深度視覺不同技術方案與硬件結構的差異,分析了國外公司在相關技術領域的布局。
我們相信3D深度視覺進入消費級智能終端將是大勢所趨,隨著硬件端技術的不斷進步,算法與軟件層麵的不斷優化,3D深度視覺的精度和實用性得到大幅提升,這將為VCSEL、紅外CIS帶來新的市場增量。
移動端手勢/renlianshibiedailaidianfuxingquanxindeyonghutiyan,yujijiangshixiankuaisudeshentouyupuji,youyuxiaofeijizhinengzhongduanpangdadeyonghushuliang,zhejiangchuangzaoyigepangdadexinshichang。
移動端3D深度相機助力智能人機交互進入新時代。從鍵盤、鼠shu標biao,到dao手shou寫xie筆bi,再zai到dao觸chu控kong顯xian示shi屏ping,人ren機ji交jiao互hu的de大da幅fu進jin步bu引yin領ling了le消xiao費fei電dian子zi的de成cheng功gong。但dan觸chu控kong顯xian示shi有you著zhe明ming顯xian的de局ju限xian性xing,限xian製zhi了le用yong戶hu的de使shi用yong靈ling活huo性xing。
基於3D視覺的手勢/人臉識別將對現有的消費電子產品產生顛覆性的變化,帶來全新的用戶體驗,打開更加廣闊的空間,在體感交互、運動控製、身份認證等方麵大幅提升用戶體驗。
巨頭持續發力,提前布局移動端3D視覺。一旦手勢識別進入大規模普及,將對現有的消費電子產品產生顛覆性的影響,人機交互將進入全新的時代。
因此,包括蘋果、穀歌、微軟、英特爾、索尼、三星等科技巨頭,均在深度相機、體感交互、動作捕捉等領域展開了深度的布局,或內部成立專門的研發團隊,或並購創業型公司,快速獲得先進的技術,在技術方麵實現儲備。
TOF方案技術水平大幅提升,移動端3D視覺已具備大規模普及的基礎。目前在3D深度視覺領域,主流的方案為結構光、TOF和雙目立體成像。TOF方案響應速度快、深度信息精度高、識別距離範圍大、不易受環境光線幹擾,因此是移動端3D視覺比較可行的方案。
近年來,在德州儀器、意法半導體、英飛淩、微軟等巨頭公司的推動之下,TOF方案已經越來越成熟,尤其是VCSEL技術的進步,使得TOF方案已經具備了在移動端大規模普及的基礎。
移動端3D視覺為VCSEL和紅外CIS攝像頭帶來市場新增量。如果3D深度視覺進入移動端應用的話,VCSEL將是重要的部件,原因就在於VCSEL可以提供高頻的調製、更快的響應速度、高質量的光束,同時功耗低,工藝兼容性好。
由於目前絕大多數智能終端已經具備可見光前置和後置攝像頭,因此,3D視覺進入消費級智能終端之後,會增加紅外攝像頭的需求。同時3D視覺也將使紅外窄帶濾色片受益。
行業“增持”評級,關注優勢企業。目前海外公司在3D視覺領域較為領先,包括:綜合技術方案提供商——微軟、英特爾等巨頭,德州儀器、意法、英飛淩、AMS(收購Heptagon)等芯片巨頭,SoftKinetic(索尼)、PrimeSense(蘋果)、LeapMotion等明星公司;係統模組封裝——LG Innotek、Sharp等;VCSEL設計——Finsar、Lumentum、Princeton Optronics、Heptagon、ⅡⅥ等公司。
台灣公司在VCSEL代工和攝像頭方麵比較領先,VCSEL由全新、聯亞光電等提供外延片,然後由宏捷科、穩懋等進行晶圓製造,再經過聯鈞、矽品、同欣(基板)等的封測,攝像頭方麵有大立光、玉晶光電、奇景光電等。DOE與LENS光學器件——Heptagon、奇景光電、精材科技、台積電等。
國內方麵:綜合技術方案與模組封裝提供商——舜宇光學;VCSEL發射器——光迅科技、三安光電;紅外與可見攝像頭——北京君正(擬收購豪威)、舜宇光學、歐菲光、丘鈦科技;紅外窄帶濾色片——水晶光電;圖像處理芯片——全誌科技、北京君正等。
風險提示:3D視覺技術移動端進程過慢;國內相關公司缺乏競爭力。

1.3D深度相機助力智能人機交互進入新時代
1)從按鍵、觸控筆到觸摸屏,智能交互的進步助力智能手機的輝煌
人機交互(簡寫HCI),是指人與計算機之間使用某種對話語言,以一定的交互方式,為完成確定任務的人與計算機之間的信息交換過程。
在(zai)上(shang)世(shi)紀(ji)計(ji)算(suan)機(ji)高(gao)速(su)發(fa)展(zhan)的(de)過(guo)程(cheng)中(zhong),除(chu)了(le)硬(ying)件(jian)芯(xin)片(pian)技(ji)術(shu)和(he)軟(ruan)件(jian)係(xi)統(tong)技(ji)術(shu)的(de)突(tu)飛(fei)猛(meng)進(jin)之(zhi)外(wai),鍵(jian)盤(pan)和(he)鼠(shu)標(biao)這(zhe)兩(liang)大(da)交(jiao)互(hu)設(she)備(bei)的(de)出(chu)現(xian),極(ji)大(da)地(di)推(tui)動(dong)了(le)計(ji)算(suan)機(ji)在(zai)普(pu)通(tong)消(xiao)費(fei)市(shi)場(chang)的(de)應(ying)用(yong),普(pu)通(tong)用(yong)戶(hu)可(ke)以(yi)通(tong)過(guo)鍵(jian)盤(pan)和(he)鼠(shu)標(biao),來(lai)實(shi)現(xian)與(yu)計(ji)算(suan)機(ji)和(he)網(wang)絡(luo)的(de)交(jiao)互(hu)。

手(shou)機(ji)可(ke)以(yi)說(shuo)是(shi)最(zui)近(jin)二(er)十(shi)年(nian)裏(li)最(zui)成(cheng)功(gong)的(de)消(xiao)費(fei)電(dian)子(zi)產(chan)品(pin),而(er)手(shou)機(ji)的(de)發(fa)展(zhan)史(shi)也(ye)伴(ban)隨(sui)著(zhe)人(ren)機(ji)交(jiao)互(hu)方(fang)式(shi)的(de)變(bian)遷(qian),可(ke)以(yi)說(shuo)人(ren)機(ji)交(jiao)互(hu)的(de)變(bian)革(ge)在(zai)一(yi)定(ding)程(cheng)度(du)上(shang)促(cu)進(jin)了(le)手(shou)機(ji)的(de)輝(hui)煌(huang)。

2002年nian左zuo右you,大da尺chi寸cun顯xian示shi技ji術shu更geng加jia成cheng熟shu,手shou機ji正zheng麵mian的de按an鍵jian由you於yu太tai占zhan麵mian積ji,而er被bei大da尺chi寸cun的de屏ping幕mu所suo取qu代dai,為wei實shi現xian更geng加jia方fang便bian的de交jiao互hu,觸chu控kong筆bi開kai始shi出chu現xian,並bing且qie得de到dao了le普pu及ji。隨sui著zhe無wu線xian通tong訊xun和he手shou機ji性xing能neng的de提ti升sheng,手shou機ji可ke以yi像xiang電dian腦nao一yi樣yang工gong作zuo,2005年出現的黑莓手機,采用全鍵盤設計,實現快速辦公。
2007年蘋果手機的橫空出世,宣告了智能手機新時代的到來,蘋果手機憑借其突破性的大尺寸觸控顯示、豐富的APP內容資源、優質的拍照和音樂體驗以及出色的產品質量,成為了全球智能手機皇冠上的明珠。
尤(you)其(qi)是(shi)第(di)一(yi)代(dai)蘋(ping)果(guo)手(shou)機(ji)配(pei)有(you)的(de)大(da)尺(chi)寸(cun)觸(chu)控(kong)顯(xian)示(shi)屏(ping)幕(mu),具(ju)有(you)劃(hua)時(shi)代(dai)的(de)意(yi)義(yi),為(wei)消(xiao)費(fei)者(zhe)帶(dai)來(lai)了(le)前(qian)所(suo)未(wei)有(you)的(de)用(yong)戶(hu)體(ti)驗(yan),引(yin)領(ling)越(yue)來(lai)越(yue)多(duo)消(xiao)費(fei)者(zhe)選(xuan)擇(ze)智(zhi)能(neng)手(shou)機(ji)。
根據IDC的統計數據,2008年全球智能手機出貨量為1.5億部,到2015年提升到14.3億部,複合年均增速38.0%,尤其是2010-2013年間,增速在60%左右。如果與PC電腦相比的話,智能手機在2007到2011年的5年時間內,出貨量就超過了已經發展30多年的個人電腦(從1980年到2011年)。

2)3D深度相機將進一步解放雙手,打開新的智能人機交互空間
現如今,大尺寸觸控顯示屏已經是大多數智能終端的標配,無論是智能手機、平板電腦,還是筆記本電腦,甚至於汽車中控台、智能家電等。

盡管觸控顯示屏的識別精度和清晰度越來越高,但是,觸控顯示屏的局限性非常明顯:shouzhibixujiechuyupingmubiaomian,wufalikaipingmugongzuo,zhejidadixianzhileyonghudeshiyongkongjianhelinghuoxing,weilejiejuezheyiwenti,yuyinkongzhiyutigankongzhikaishichuxian,bingbeiguangfankanhao。

蘋果公司於2011年推出的iPhone4S配備了語音識別助手Siri,利li用yong人ren工gong智zhi能neng技ji術shu,通tong過guo與yu消xiao費fei者zhe的de語yu言yan對dui話hua,實shi現xian信xin息xi的de交jiao互hu。隨sui後hou,語yu音yin交jiao互hu越yue來lai越yue多duo地di出chu現xian在zai智zhi能neng終zhong端duan上shang,尤you其qi是shi隨sui著zhe人ren工gong智zhi能neng語yu義yi識shi別bie技ji術shu的de進jin步bu,語yu音yin交jiao互hu的de準zhun確que性xing和he實shi用yong性xing大da幅fu提ti升sheng。亞ya馬ma遜xun於yu2015年推出的ECHO智能音箱便是典型成功例子。
語音識別可以完全解放雙手,但是在人機互動方麵的應用場景有一定的局限性,對於遊戲娛樂、互動體驗、拍pai照zhao等deng領ling域yu,這zhe些xie必bi須xu有you用yong戶hu肢zhi體ti參can與yu的de場chang景jing,語yu音yin交jiao互hu無wu法fa滿man足zu需xu求qiu。因yin此ci,比bi現xian今jin觸chu控kong屏ping更geng高gao層ceng次ci的de體ti感gan交jiao互hu成cheng為wei了le廣guang大da廠chang商shang追zhui求qiu的de目mu標biao。

要(yao)實(shi)現(xian)體(ti)感(gan)交(jiao)互(hu),最(zui)重(zhong)要(yao)的(de)就(jiu)是(shi)手(shou)勢(shi)識(shi)別(bie),因(yin)為(wei)手(shou)部(bu)動(dong)作(zuo)是(shi)人(ren)體(ti)最(zui)豐(feng)富(fu)也(ye)是(shi)最(zui)常(chang)用(yong)的(de)體(ti)感(gan)動(dong)作(zuo)。對(dui)於(yu)智(zhi)能(neng)手(shou)機(ji)而(er)言(yan),如(ru)果(guo)手(shou)勢(shi)識(shi)別(bie)可(ke)以(yi)得(de)到(dao)應(ying)用(yong),那(na)麼(me)包(bao)括(kuo)手(shou)機(ji)自(zi)拍(pai)、遊戲、瀏覽網頁、購物等眾多應用場景,在用戶體驗上均可以實現大幅提升,手機也將從觸控屏時代走向手勢識別時代。

tongshi,renlianshibieyuzhuizongyeshitiganjiaohuzuijuqianjingdefangxiangzhiyi。womenrenwei,renlianshibiezaiyidongduanjuyougengjiaguangkuodeyingyongkongjian。lirumuqianzhiwenshibieyijingchengweizhinengshoujidebiaopei,tongguozhiwenshibielaishixiankaiji、支付、登陸確認等功能已經被大眾所認可,並且創造了巨大的市場價值,但是指紋識別的局限性在於必須通過手指完成,手指放置的位置、shouzhibiaomiandejiejingdudengyinsudouhuijidadiyingxiangshiyongtiyan,errenlianshibiekeyiwanquanjiefangshuangshou,zhixuyaojiezhushexiangtouduirenlianxinxidecaijibiankeyiwanchengshibieyujiaohu。

3)手勢識別被廣泛看好,前景廣闊
無論是消費級市場的遊戲、娛樂、交互,還是商業領域的醫療、工業、軍事等,都需要豐富的手部動作來參與,因此手勢識別具有非常廣泛的應用場景。

當dang然ran,智zhi能neng手shou機ji市shi場chang才cai是shi最zui吸xi引yin人ren的de市shi場chang,因yin為wei智zhi能neng手shou機ji可ke以yi說shuo已yi經jing成cheng為wei全quan球qiu幾ji十shi億yi用yong戶hu的de生sheng活huo必bi需xu品pin,智zhi能neng手shou機ji龐pang大da的de用yong戶hu數shu量liang以yi及ji用yong戶hu每mei日ri超chao長chang的de使shi用yong時shi間jian,都dou將jiang帶dai來lai巨ju大da的de市shi場chang價jia值zhi。
手機中集成手勢識別將帶來眾多的益處,包括:全新的用戶界麵實現了超越觸摸屏的更深層次的控製功能,並將引領遊戲和智能手機控製進入全新時代;新的控製感知更為靈活,戴著手套或是手不幹淨時也可進行控製;帶來更豐富的用戶體驗,它無需機械開關、無需觸摸屏或按鈕就可實現家居自動化。

受益於遊戲機、PC電腦以及平板等移動裝置的技術整合,市場研究機構ABI Research預估,全球眼球追蹤、手勢以及距離傳感器技術領域在2016年創造近50億美元的收入。
根據IHS的數據,2014 年全球手勢識別與傳感器市場達到了31.2億美元的規模,過去幾年的複合年增長率為32.78%,預計到2022年該市場規模預計將達321.6yimeiyuan。jishujinbushiyingjianjingdudafutisheng,congerjinyibulashengleduishoushishibieyuchuanganqishichangdexuqiu。zaizhinengshoujiyuqichelingyu,shoushishibieyuchuanganqishichangchengxianzhishuzengchang,qizhongdeguanjianyinsuweiyingjianchengbendilian,tongshikedafugaishanyonghutiyan。
4)人臉識別從專業市場走向消費市場,應用領域大幅擴寬
早期的人臉識別主要用於身份認證與安全檢測,主要針對專業市場。例如在金融、政府、軍事、海關、監jian獄yu等deng機ji密mi單dan位wei,通tong過guo人ren臉lian識shi別bie完wan成cheng用yong戶hu身shen份fen的de驗yan證zheng與yu權quan限xian的de檢jian測ce等deng。隨sui著zhe人ren臉lian識shi別bie算suan法fa的de不bu斷duan優you化hua,人ren臉lian識shi別bie技ji術shu不bu再zai局ju限xian於yu簡jian單dan的de單dan體ti身shen份fen認ren證zheng,而er是shi擴kuo展zhan至zhi群qun體ti的de安an防fang監jian控kong領ling域yu。

正(zheng)如(ru)我(wo)們(men)前(qian)文(wen)所(suo)述(shu),人(ren)臉(lian)識(shi)別(bie)更(geng)大(da)的(de)機(ji)會(hui)在(zai)於(yu)消(xiao)費(fei)級(ji)市(shi)場(chang),人(ren)臉(lian)識(shi)別(bie)在(zai)移(yi)動(dong)端(duan)具(ju)有(you)更(geng)加(jia)廣(guang)闊(kuo)的(de)應(ying)用(yong)空(kong)間(jian),而(er)目(mu)前(qian)人(ren)臉(lian)識(shi)別(bie)向(xiang)消(xiao)費(fei)市(shi)場(chang)滲(shen)透(tou)的(de)趨(qu)勢(shi)越(yue)發(fa)明(ming)顯(xian),尤(you)其(qi)是(shi)在(zai)人(ren)臉(lian)識(shi)別(bie)技(ji)術(shu)逐(zhu)步(bu)提(ti)升(sheng)的(de)背(bei)景(jing)之(zhi)下(xia)。
例如,人臉識別可以替代手勢識別完成移動端的身份認證、支付交易確認、權限登錄等功能;人臉識別直接獲取消費者麵部表情、生理年齡或精神狀態;人臉識別用於移動端自拍的快速對焦,用戶自拍美顏等功能……

2.主要巨頭在移動端3D視覺領域的布局
1)蘋果——整合行業先驅PrimeSense,發力3D手勢與人臉識別
2013年11月,蘋果收購以色列3D傳感器生產商PrimeSense,收購費用為3.45億美元。PrimeSense曾以給微軟Kinect體感控製器提供3D技術著稱,它將玩家的動作作為Xbox遊戲的一部分,這些傳感器允許玩家無需使用控製器就可跟遊戲係統相連。

2010年年底,PrimeSense與華碩合作開發了Xtion Pro,和Kinect采用了同樣的3D傳感器,在PC上使用。2012年,PrimeSense推出了當時世界上體積最小的3D傳感器Capri,它的分辨率是前代產品的3倍,而體型是前代的十分之一,環境光的檢測性能是前代的50倍。自2013年收購PrimeSense之後,蘋果推動PrimeSense的3D體感控製器向小型化發展,希望可以將其裝配到電視、PC上,最終可以用在未來的iPhone上。

2016年7月,蘋果再次公布新型3D手勢控製專利,是一個圖形投影儀,內嵌在一個諸如如iPhone手機這樣的iOS設備上,可以識別出用戶的手勢操作,由此可以作為把手勢作為遊戲的控製杆或者控製器。

2017年1月15日,美國權威谘詢機構Cowen and Company發布報告稱,蘋果的下一代iPhone可能會包含某種麵部識別或手勢識別功能,由安裝在前置攝像頭附近的一款新的激光發射器和紅外感應器支持,新款iPhone可能會配備一種新的深度感應器,可以為未來的iPhone增添手勢識別、人臉識別,甚至增強現實AR功能。

2)英特爾——持續強化升級RealSense,“結構光+雙目立體光”
早在2012年左右,英特爾便著重研發實感技術,當時叫Perceptual Computing,即感知計算,並開放英特爾感知計算軟件開發套件2013版。2013年1月,英特爾聯合Nuance等多家公司推出了“感知計算”,類似於微軟的Kinect,可進行手勢與人臉識別,缺點是設備體積大,必須借助PC電腦完成。

前置實感3D攝像頭和Kinect原理一樣,它的工作原理是“結構光”,需要一顆紅外傳感器。遠距離的3D攝像頭,使用“雙目主動立體成像原理”,需要兩顆紅外傳感器。後文我們會詳細拆解與分析。
經過多年的努力,英特爾目前可以提供包括SR300獨立攝像頭、R200遠距離後置攝像頭(3-4米,室內室外使用,640*480分辨率)、F200近距離前置攝像頭(0.2-1.2米,室內使用,640*480分辨率)等硬件產品。

3)微軟——從Kinect到Handpose,3D識別精度大幅提升
微軟是最早涉足3D視覺的公司之一,公司在遊戲領域推出XBOX遊戲機,誌在與索尼和任天堂的遊戲機一較高下,為了形成自己的競爭優勢,微軟在2010年與PrimeSense合作,推出了XBOX360體感周邊外設——Kinect1代。
但是,當時采用結構光原理的Kinect1代的遊戲體驗並不好,產品的準確度、tuxiangdefenbianlvhexiangyingsuduyizhibulixiang。zuidadewentishijingduhennantigao,yinweijisuanbandianweiyixuyaoyongtuxiangzaiyigexiaofanweiquyuneidelaizuokuaipipei,daozhixishenglexiangsujibiedexijie,tuaobupingdebiaomian、物體邊緣、很細的物體很難檢測準確的深度。
2012年微軟先後收購了TOF(時間光)相機公司canesta和3dv,2013年微軟終止與PrimeSense的合作,自行開發了Kinect2代(成為Kinect one),采用的是TOF(時間光)原理,無論精度、分辨率還是響應時間都得到了很大的提升。
TOF原理發射一個強度隨時間周期變化的正弦信號,通過獲得發射、接受信號的相位差來計算深度,精度高很多。關於Kinect2代的原理分析我們將在後文詳細闡述。

4)穀歌——Tango項目野心勃勃,提前布局移動端3D視覺
Project Tango是穀歌公司的明星研究項目,由穀歌先進技術與項目部門和部分研究人員,以及矽穀Movidius(已被英特爾收購)合作研發,後者提供的芯片技術可以分析和表達來自傳感器和攝像頭的數據。Project Tango項目的目標是希望將人類的視覺帶入移動設備,為移動設備加入類似人類對空間和運動的感知能力。
Project Tango包含三塊技術:運動追蹤(MotionTracking),深度感知(Depth Perception)和區域學習(Area Learning)。首先是運動追蹤,設備可以通過內置的姿態傳感器(加速度計和陀螺儀等)來感知當前的位置;接下來是更深入的3D識別,可以檢查出周圍世界環境的形狀,類似於英特爾的RealSense 3D攝像技術,可以獲得更準確的姿態控製以及3D對象渲染;最後就是對周圍的環境和區域繪製地圖。

5)索尼——收購明星企業SoftKinetic,彌補短板
2015年10月,SONY 宣布收購比利時傳感器技術提供商SoftKinetic。SoftKinetic是一家專門從事深度傳感攝像頭技術的電腦視覺初創型企業,成立於2007年,專注研發體感技術,其傳感器技術能夠追蹤諸如手勢等相關的圖像。
SoftKinetic技術能夠部署到安裝在增強現實和虛擬現實硬件上的攝像頭之中,從而增加手勢與麵部追蹤的能力。SoftKinetic公司的攝像機采用TOF方案。

6)三星——手勢識別助力淩空操作Gear VR
科技公司Gestigon和Pmd在16年6月宣布在三星GearVR上合作研發手勢識別,結合Pmd的CamBoard pico flexx深度傳感器和Gestigon的Carnival AR/VR Interaction Suite(增強/虛擬現實互動套件),在現有的VR設備上進行無觸摸手勢交互。

3.移動端3D視覺主要技術背景與原理分析
1)計算機視覺技術主要分類
如同人眼可以對所見到的圖像信息進行分析與判斷一樣,計算機視覺技術的目的就是用攝影機和電腦代替人眼對目標進行識別、跟蹤和測量等機器視覺,並進一步做圖形處理,使電腦處理成為更適合人眼觀察或傳送給儀器檢測的圖像。
計算機視覺技術的發展主要經曆了:二維圖像靜態識別、二維圖像動態識別、三維圖像動態識別三個階段。
我們以手勢識別技術為例,可以粗略分為兩個階段:二維手勢識別和三維手勢識別,二維手勢識別又可以劃分為二維手型識別和二維手勢識別。

相比較二維手勢識別,三維手勢識別增加了一個Z軸的信息,它可以識別各種手型、手(shou)勢(shi)和(he)動(dong)作(zuo)。三(san)維(wei)手(shou)勢(shi)識(shi)別(bie)也(ye)是(shi)現(xian)在(zai)手(shou)勢(shi)識(shi)別(bie)發(fa)展(zhan)的(de)主(zhu)要(yao)方(fang)向(xiang)。不(bu)過(guo)這(zhe)種(zhong)包(bao)含(han)一(yi)定(ding)深(shen)度(du)信(xin)息(xi)的(de)手(shou)勢(shi)識(shi)別(bie),需(xu)要(yao)特(te)別(bie)的(de)硬(ying)件(jian)來(lai)實(shi)現(xian),常(chang)見(jian)的(de)有(you)通(tong)過(guo)紅(hong)外(wai)光(guang)+光學傳感器來完成。

2)三種主流的3D機器視覺技術
根據硬件實現方式的不同,目前行業內所采用的主流3D機器視覺大約有三種:結構光、TOF時間光、雙目立體成像。

結構光(Structure Light)
通過激光的折射以及算法計算出物體的位置和深度信息,進而複原整個三維空間。結構光的代表產品有微軟的Kinect一代。
tongguofashetedingtuxingdesanbanhuozhedianzhendejiguanghongwaituan,dangbeicewutifanshezhexietuan,tongguoshexiangtoubuzhuodaozhexiefanshehuilaidetuan,jisuanshangmiansanbanhuozhediandedaxiao,genyuanshisanbanhuozhediandechicunzuoduibi,congercesuanchubeicewutidaoshexiangtouzhijiandejuli。
目前是業界比較成熟的深度檢測方案,很多的激光雷達和3D掃描技術都是采用的結構光方案。
不bu過guo由you於yu以yi折zhe射she光guang的de落luo點dian位wei移yi來lai計ji算suan位wei置zhi,這zhe種zhong技ji術shu不bu能neng計ji算suan出chu精jing確que的de深shen度du信xin息xi,對dui識shi別bie的de距ju離li也ye有you嚴yan格ge的de要yao求qiu。而er且qie容rong易yi受shou到dao環huan境jing光guang線xian的de幹gan擾rao,強qiang光guang下xia不bu適shi合he,響xiang應ying也ye比bi較jiao慢man。

典型的結構光方案包括:PrimeSense(微軟Kinect1代)、英特爾RealSense(前置方案)。
光飛行時間(TIme of Flight)
TOF係統是一種光雷達(LIDAR) xitong,kecongfashejixiangduixiangfasheguangmaichong,jieshouqizeketongguojisuanguangmaichongcongfasheqidaoduixiang,zaiyixiangsugeshifanhuidaojieshouqideyunxingshijianlaiquedingbeiceliangduixiangdejuli。
TOF係統可同時獲得整個場景,確定3D範圍影像。利用測量得到的對象坐標可創建3D影像,並可用於機器人、製造、醫療技術以及數碼攝影等領域的設備控製。

TOF方(fang)案(an)的(de)優(you)點(dian)在(zai)於(yu)響(xiang)應(ying)速(su)度(du)快(kuai),深(shen)度(du)信(xin)息(xi)精(jing)度(du)高(gao),不(bu)容(rong)易(yi)受(shou)環(huan)境(jing)光(guang)線(xian)幹(gan)擾(rao),這(zhe)些(xie)優(you)點(dian)使(shi)其(qi)成(cheng)為(wei)移(yi)動(dong)端(duan)手(shou)勢(shi)識(shi)別(bie)最(zui)被(bei)看(kan)好(hao)的(de)方(fang)案(an)。代(dai)表(biao)廠(chang)商(shang)有(you)微(wei)軟(ruan)(Kinect2代)、意法半導體、英飛淩、德州儀器等。
多角立體成像(MulTI-camera)
現在手勢識別領域的佼佼者Leap MoTion使shi用yong的de就jiu是shi這zhe種zhong技ji術shu。它ta使shi用yong兩liang個ge或huo者zhe兩liang個ge以yi上shang的de攝she像xiang頭tou同tong時shi采cai集ji圖tu像xiang,通tong過guo比bi對dui這zhe些xie不bu同tong攝she像xiang頭tou在zai同tong一yi時shi刻ke獲huo得de的de圖tu像xiang的de差cha別bie,使shi用yong算suan法fa來lai計ji算suan深shen度du信xin息xi,從cong而er多duo角jiao三san維wei成cheng像xiang。
Leap MoTion方案使用2geshexiangjihuodezuoyoulitiyingxiang,gaiyingxiangyouxieqingweipianyi,yurenyantongxu。jisuanjitongguobijiaozhelianggeyingxiang,jiukehuodeduiyingyuyingxiangzhongwutiweiyidebutongyingxiang。gaibutongyingxianghuoditukeyishicaisede,yekeyiweihuijie,jutiqujueyutedingxitongdexuqiu。

雙目多角立體成像方案的優點在於不容易受到環境光線的幹擾,適合室外環境,滿足7*24小時的長時間工作要求,不易損壞。缺點是昏暗環境、特征不明顯時不適合,目前應用在智能安防監控、機器人視覺、物流檢測等領域。

3)典型3D視覺硬件拆解與分析
英特爾RealSense(結構光+雙目立體成像)
RealSense前置實感 3D 攝像頭和 Kinect 1代原理一樣,它的工作原理是“結構光”。主(zhu)動(dong)發(fa)出(chu)特(te)定(ding)圖(tu)案(an)的(de)紅(hong)外(wai)光(guang),紅(hong)外(wai)光(guang)遇(yu)到(dao)環(huan)境(jing)中(zhong)的(de)各(ge)種(zhong)障(zhang)礙(ai)物(wu)發(fa)生(sheng)折(zhe)射(she),然(ran)後(hou)由(you)設(she)備(bei)上(shang)的(de)攝(she)像(xiang)頭(tou)接(jie)收(shou)這(zhe)些(xie)折(zhe)射(she)光(guang),並(bing)通(tong)過(guo)芯(xin)片(pian)進(jin)行(xing)實(shi)時(shi)計(ji)算(suan)分(fen)析(xi),計(ji)算(suan)出(chu)所(suo)處(chu)的(de)空(kong)間(jian)位(wei)置(zhi)。
RealSense遠距離的3D攝像頭,英特爾使用“雙目主動立體成像原理”,需要兩顆紅外傳感器。它模仿了人眼的“視差”原理,通過打出一束紅外光,以左紅外傳感器和右紅外傳感器追蹤這束光的位置,然後用三角定位原理來計算出 3D 圖像中的“深度”信息。

根據國外科技媒體Chipworks對應用在聯想電腦Yoga15上的RealSense前置相機的拆解,采用結構光原理,與微軟Kinect1代和蘋果PrimeSense原(yuan)理(li)類(lei)似(si),由(you)紅(hong)外(wai)激(ji)光(guang)器(qi)發(fa)射(she)出(chu)紅(hong)外(wai)光(guang),經(jing)過(guo)物(wu)體(ti)的(de)反(fan)射(she),被(bei)紅(hong)外(wai)探(tan)測(ce)器(qi)所(suo)接(jie)收(shou),反(fan)射(she)光(guang)圖(tu)案(an)的(de)位(wei)置(zhi)取(qu)決(jue)於(yu)反(fan)射(she)物(wu)體(ti)的(de)距(ju)離(li),通(tong)過(guo)分(fen)析(xi)反(fan)射(she)圖(tu)案(an)的(de)幾(ji)何(he)形(xing)狀(zhuang),重(zhong)建(jian)一(yi)個(ge)三(san)維(wei)(3D)的場景。

微軟Kinect 2代(TOF方案)
2013年5月,微軟發布了基於TOF原理的Kinect2代(Kinectone)設備,替代了1代的“結構光”的測算方法,使新Kinect2代比原始Kinect1代更快、更準確。
Kinect2代采用了1080p視頻傳感器,提高了深度傳感器所能支持的最大分辨率來允許捕捉更多的細節,如手指動作和肢體定位。Kinect2代每秒數據處理量可達2GB,采用了USB3.0的接口,動作輸入延遲僅為66毫秒。

根據chipworks對Kinect One的拆解,主要核心部件為三顆紅外激光二極管、一顆紅外光圖像傳感器、一顆可見光圖像傳感器和一顆圖像處理主芯片。
主(zhu)要(yao)工(gong)作(zuo)原(yuan)理(li)為(wei),紅(hong)外(wai)激(ji)光(guang)二(er)極(ji)管(guan)以(yi)正(zheng)弦(xian)信(xin)號(hao)的(de)形(xing)式(shi)發(fa)射(she)近(jin)紅(hong)外(wai)激(ji)光(guang),光(guang)碰(peng)到(dao)環(huan)境(jing)中(zhong)的(de)物(wu)體(ti)發(fa)生(sheng)反(fan)射(she),紅(hong)外(wai)光(guang)圖(tu)像(xiang)傳(chuan)感(gan)器(qi)采(cai)集(ji)反(fan)射(she)光(guang),計(ji)算(suan)反(fan)射(she)信(xin)號(hao)與(yu)發(fa)射(she)信(xin)號(hao)的(de)時(shi)間(jian)差(cha),從(cong)而(er)得(de)知(zhi)位(wei)置(zhi)距(ju)離(li)信(xin)息(xi),采(cai)用(yong)三(san)顆(ke)紅(hong)外(wai)激(ji)光(guang)二(er)極(ji)管(guan)的(de)原(yuan)因(yin)在(zai)於(yu)提(ti)供(gong)空(kong)間(jian)自(zi)由(you)度(du)更(geng)大(da)的(de)探(tan)測(ce),可(ke)見(jian)光(guang)相(xiang)機(ji)的(de)作(zuo)用(yong)是(shi)獲(huo)取(qu)環(huan)境(jing)實(shi)時(shi)的(de)XY平麵物體信息。
4.移動端3D視覺產業鏈分析
1)移動端3D視覺硬件與產業鏈結構
目前在移動端3D視覺方麵,三種主流的方案(結構光、TOF時間光、雙目立體成像)中,已經比較成熟的是結構光和TOF時間光。
其中結構光方案最為成熟,已經大規模應用於工業3D視覺領域,但是極易受到外界光的幹擾、響應速度較慢、識別精度較低,而TOF方案在這幾個方麵均比結構光方案具有一定的優勢,因此TOF成為了目前在移動端被看好的方案。
雙目立體成像方案抗環境光幹擾強,分辨率高,也是移動端可選方案之一,但是技術較新不夠成熟,目前在機器人、自動駕駛領域應用較多。
蘋果公司在2017年的iPhone7中使用了意法半導體提供的基於TOF原理的前置距離傳感器(proximity sensor)。
而在此之前,蘋果的iPhone5和iPhone6s采用的都是Heptagon提供的LED+光探測器的方案,從LED+光探測器到TOF,表明移動端TOF方案在技術方麵已經獲得了巨大的進步。
通過Chipworks網站的拆解,可以看到意法為iPhone7提供的基於TOF原理的距離傳感器,主要包括一個VCSEL發射器和兩個SPAD(單光子雪崩二極管)探測器,被整合於一般的CMOS工藝中。

TOF時間光相比於結構光更加適合應用到智能手機上,采用TOF原理來實現動作追蹤和深度感知已經出現在穀歌的Project Tango方案中,主要用於空間三維數據的采集,與應用於手勢/臉部識別是非常接近的。
在景深傳感器方麵,采用的是TOF原理,使用的是英飛淩和PMD合作開發的技術方案。
根據日本Nomura公司的分析報告,聯想Phab2 Pro在紅外發射方麵采用的是Princeton Optronics設計的VCSEL(垂直腔麵發射器),由台灣宏捷科(AWSC)提供代工;在紅外接收方麵,英飛淩負責提供紅外CIS芯片,PMD提供飛時測距(TOF)形成景深數據部分;整個TOF模塊由中國舜宇光學提供封裝。

通過詳細分析微軟Kinect二代(TOF原理),可以看到TOF方案的主要硬件結構為:紅外光發射器(IR LD)、紅外光圖像傳感器(IR CIS)、可見光圖像傳感器(Vis CIS)、圖像處理芯片,硬件結構與聯想Phab2 Pro相機是非常類似的。

整個三維視覺係統的工作原理為:首先紅外激光發射器(IR LD)發射出近紅外光(IR Light),經過人手或人臉的反射之後,被紅外圖像傳感器(IR CIS)所接收,這個圖像信息用來計算人手所處的位置(Z軸);
同時,可見光圖像傳感器采集二維平麵(X與Y軸)的人手信息(Vis Light);兩顆圖像傳感器的信息彙總至專用的圖像處理芯片,從而得到人手或人臉的三維數據,實現空間定位。
TOF與結構光的區別在於對紅外光的使用方式不同,TOF通tong過guo計ji算suan紅hong外wai光guang發fa出chu光guang線xian與yu返fan回hui光guang線xian之zhi間jian的de向xiang位wei移yi變bian化hua換huan算suan為wei位wei置zhi信xin息xi,而er結jie構gou光guang依yi靠kao向xiang物wu體ti投tou射she一yi係xi列lie光guang線xian圖tu案an組zu合he,然ran後hou通tong過guo檢jian測ce光guang線xian的de邊bian緣yuan來lai測ce量liang距ju離li,二er者zhe的de硬ying件jian結jie構gou是shi類lei似si的de。
二者比較明顯的區別在於,在紅外光發射端,結構光由於需要形成特定的光學圖案,所以需要添加特製的DOE(衍射光柵)和Lens(光學棱鏡)。

2)硬件層麵:VCSEL與紅外CIS攝像頭成為市場新增量
根據中國台灣科技時報的統計數據,對於移動端3D視覺而言,紅外光發射器的成本在2-2.5美元/顆,是占比最高的單顆元器件;圖像處理芯片,為1-1.5美元/顆;紅外CIS與可見CIS的價格接近,為1-2美元/顆,在紅外CIS上還需要添加高質量的紅外濾色片(IR Fliter),價格為0.5-1美元/顆。整個係統模組的封裝成本為3-4美元/顆。

紅外光發射器
紅外主要波長是700nm-2500nm。目前的攝像頭圖像傳感器對900nm以上的紅外光感應差,需要更強的光才能感測到,這就要求紅外發射器有更大的電流,更多的功耗。
而800nm以下的波長,太靠近可見光,極其容易受到太陽光的幹擾,所以一般紅外的波長在800nm-900nm。目前,可以提供800-900nm波段的光源主要有三種:紅外LED、紅外LD(激光二極管)和VCSEL(垂直腔麵發射激光器)。

三星Note7和富士通ARROWS NXF-04G手機中搭載的虹膜識別功能,采用的就是紅外LED作為發光光源,波長為810nm,歐司朗提供。
虹膜識別采用紅外LED的重要原因是LED可提供大角度散射光,消費者在使用時位置即使眼睛位置有所偏差,虹膜也可以被照射到。
但是紅外LED不適合移動端3D視覺,尤其是集成到手機上的話,因為其光線指向性差、功耗大、響應速度較慢。

紅外激光二極管是指可在一個頻率上產生相幹紅外光束的半導體二極管,通常是由砷化镓或摻雜有銦和鋁之類其他材料的砷化镓製成。
與LED相比,具有激光的定向性好、高亮度特點,比較常見的是LD-DFB規格(以FP腔為諧振腔,發出多縱模相幹光),為邊發射模式(簡稱EEL)。在激光通信、光存儲、光陀螺、激光打印、測距以及雷達等方麵以及獲得了廣泛的應用。

VCSEL可以說是紅外激光LD的一種,全名為垂直共振腔表麵放射激光,顧名思義,它是可以垂直發射模式,與其他紅外LD的邊發射模式不同。
VCSEL的垂直結構更加適合進行晶圓級製造和封測,規模量產之後的成本相比於邊發射LD有優勢,可靠性高,沒有傳統的激光器結構如暗線缺陷的失效模式。相比於LED,VCSEL的光譜質量高,中心波長溫漂小,響應速度快,優勢明顯。
綜合分析三種方案,LED雖然成本低,但是發射光角度大,必須輸出更多的功率以克服損失。
此外,LED不能快速調製,限製了分辨率,需要增加閃光持續時間;邊發射LD也是手勢識別的可選方案,但是輸出功率固定,邊緣發射的模式在製造工藝方麵兼容性不好。
VCSEL比LD-EEL的優勢在於所需的驅動電壓和電流小,功耗低,光源可調變頻率更高(可達數GHz),與化合物半導體工藝兼容,適合大規模集成製造。尤其是VCSEL功耗低、可調頻率高的優點,使其比LD-EEL更加適合消費電子智能終端。

VCSEL的製造依賴於MBE(分子束外延)或MOCVD(金屬有機物氣相沉積)工藝,在GaAs(80%左右的份額)或InP(15%左右的份額)晶圓上生長多層反射層與發射層。
典型的VCSEL結構包括:激光腔(laser cavity),頂部和底部分布式布拉格反射器(DBR),電極等部分,其中激光腔的主要部分是量子阱(quantum wells)和光限製層(confinement structure)。
由於VCSEL主要采用三五族化合物半導體材料GaAs或InP(含有In、Al等摻雜),因此移動端VCSEL產業鏈與化合物半導體產業鏈結構類似。

目前,全球範圍內主要的設計者包括Finsar、Lumentum、Princeton Optronics、Heptagon、ⅡⅥ等公司,它們在移動端VCSEL處於前沿的研發角色。
由IQE、全新、聯亞光電等公司提供三五族化合物EPI外延矽片,然後由宏捷科(Princeton Optronics合作方)、穩懋(Heptagon合作方)等公司進行晶圓製造,再經過聯鈞、矽品等公司的封測,便變成了獨立的VCSEL器件。
然後由設計公司提供給意法半導體、德州儀器、英飛淩等綜合解決方案商,再提供給下遊消費電子廠商。
紅外光圖像傳感器
紅外CMOS圖像傳感器(IR CIS)用來接收被手部或臉部反射的紅外光,這是一個比較成熟的器件。
在搭載虹膜識別功能的三星Note7和富士通ARROWS NX F-04G手機中均出現IR CIS,其中三星的紅外CIS中傳感芯片由三星自家提供,鏡頭來自於韓國廠商Kolen,模組由韓國廠商Patron製造。
目前來看,紅外CIS供應商主要包括意法半導體、奇景光電、三星電子、富士通等公司。
相比於可見光CIS,紅外CIS還是一個比較小的市場,但是增速很快,隨著熱成像、汽車夜視、安防監控、手勢識別、虹膜識別等的普及,紅外CIS出貨量有望快速增長。

對於3D視覺而言,IR紅外攝像頭與RGB可見光攝像頭在濾色片方麵存在較大的差異。傳統的RGB可(ke)見(jian)光(guang)攝(she)像(xiang)頭(tou),需(xu)要(yao)采(cai)用(yong)高(gao)通(tong)紅(hong)外(wai)濾(lv)色(se)片(pian),將(jiang)不(bu)必(bi)要(yao)的(de)低(di)頻(pin)近(jin)紅(hong)外(wai)光(guang)過(guo)濾(lv)掉(diao),以(yi)免(mian)紅(hong)外(wai)光(guang)線(xian)對(dui)可(ke)見(jian)光(guang)部(bu)分(fen)造(zao)成(cheng)影(ying)響(xiang),產(chan)生(sheng)偽(wei)色(se)或(huo)波(bo)紋(wen),同(tong)時(shi)可(ke)以(yi)提(ti)高(gao)有(you)效(xiao)分(fen)辨(bian)率(lv)和(he)彩(cai)色(se)還(hai)原(yuan)性(xing)。
但(dan)是(shi)紅(hong)外(wai)攝(she)像(xiang)頭(tou),為(wei)了(le)不(bu)受(shou)到(dao)環(huan)境(jing)光(guang)線(xian)的(de)幹(gan)擾(rao),需(xu)要(yao)使(shi)用(yong)窄(zhai)帶(dai)濾(lv)色(se)片(pian),隻(zhi)允(yun)許(xu)特(te)定(ding)波(bo)段(duan)的(de)近(jin)紅(hong)外(wai)光(guang)通(tong)過(guo),目(mu)前(qian)近(jin)紅(hong)外(wai)窄(zhai)帶(dai)濾(lv)色(se)片(pian)主(zhu)要(yao)采(cai)用(yong)幹(gan)涉(she)原(yuan)理(li),需(xu)要(yao)幾(ji)十(shi)層(ceng)光(guang)學(xue)鍍(du)膜(mo)構(gou)成(cheng),相(xiang)比(bi)於(yu)RGB吸收型濾色片具有更高的技術難度和產品價格。
目前,近紅外窄帶濾色片主要廠商包括VIAVI、水晶光電等。

可見光圖像傳感器
可見光圖像傳感器(Vis CIS)是非常成熟的商業化產品,隨著智能手機拍照功能的不斷完善,可見光CIS的分辨率越來越高、功耗越來越小、技術也越來越先進。
圖像處理芯片
圖像處理芯片需要將紅外光CIS采集的位置信息與可見光CIS采集的物體平麵信息處理成單像素含有深度信息的三維圖像。
gaixinpianjuyouyidingdejishubilei,duiyusuanfacengmiandeyaoqiujiaogao,muqianquanqiufanweineikeyitigonggaileichanpindegongsiweishaoshujijiaxinpianjutou,baokuoyifabandaoti、德州儀器、英飛淩和恩智浦(已被高通收購)等。

紅外光發射端DOE與Lens
對於結構光方案而言,在紅外光發射端必須配有DOE(衍射光柵)和Lens(光學棱鏡),因為結構光需要以線條等圖案的形式發射紅外光,這需要特定的光柵和光學棱鏡的參與才能夠實現。

3)算法與軟件層麵:AI人工智能將成為提升精度的重要因素
隨著AI人工智能技術的大幅進步,人工智能方案已經在語音識別、語義理解、圖片識別等領域取得成功,在物體識別、人臉識別方麵也取得了長足的進步,3D視覺在算法方麵與人工智能結合,將實現識別精度的大幅提升,對於更加複雜的手部動作/麵部表情可以進行更加深刻的理解和分析,這將極大促進3D視覺的推廣和實用價值。

5.國內外產業鏈相關公司分析
在主流的三種技術方案中,TOF方案響應速度快,深度信息精度高,識別距離範圍大,不易受環境光線幹擾,因此是移動端3D視覺比較可行的方案;結構光方案由於技術較為成熟,工業化產品較多,也被部分廠商所采用;雙目立體成像是比較新的技術,參與的廠商較少,更適合室外強光條件和高分辨率應用,目前主要應用在機器人視覺、自動駕駛等方麵。

1)綜合技術方案提供商
目前,在深度相機綜合技術方案方麵,國外參與的公司眾多,既有微軟、英特爾等巨頭,也有德州儀器、意法半導體、英飛淩、AMS(Heptagon)等芯片巨頭,還包括SoftKinetic(索尼收購)、PrimeSense(蘋果收購)、LeapMotion等明星創業型公司。

目前,國內從事深度攝像頭綜合技術方案的主要公司包括:TOF方案——舜宇光學、海康威視、深圳樂行天下,結構光方案——深圳奧比中光、南京華捷艾米,雙目立體成像方案——上海圖漾科技。


2)係統模組封裝與集成供應商
由於3D視覺方案涉及較多的硬件部分,需要紅外發射端、紅外接收攝像頭、可見光攝像頭、圖像處理芯片四大部分的協同合作,紅外光的發射與接收之間的匹配對整個3D視覺方案的準確度和響應速度至關重要,因此整個係統模組的封裝和集成是非常關鍵的。
在聯想Phab2 Pro手機中,3D深度相機的模組封裝與集成由舜宇光學完成。除了舜宇光學之外,具備移動端3D方案模組封裝的廠商還包括歐菲光、LG Innotek、Sharp等。

3)紅外光發射器-VCSEL
由於VCSEL在高端短距離光通訊領域應用廣泛,因此國內光通訊器件龍頭光迅科技在VCSEL方麵已經有商業化產品推出。但是,致力於移動端VCSEL設計的公司主要包括Finsar、Lumentum、PrincetonOptronics、Heptagon、ⅡⅥ等國外公司,國內公司涉及較少。

中科院長春光機所在VCSEL科研領域處於世界前沿地位,2014年5月長春光機所在國內首次研製出堿金屬原子光學傳感技術專用的795nm和894nm 垂直腔麵發射激光器(VCSEL)。可作為核心光源用於芯片級原子鍾、原子磁力計、原子陀螺儀等堿金屬原子傳感器。

VCSEL主要基於三五族化合物砷化镓製造而成,目前在VCSEL和製造和封測方麵,目前主要是台灣化合物半導體廠商參與,包括外延片提供商IQE(英國)、全新、聯亞光電,晶圓代工宏捷科、穩懋,封測廠聯鈞、矽品等。
國內方麵,三安光電在化合物半導體外延生長和晶圓製造領域發展迅速,具備較強的實力,公司在國家大基金的支持下建設年產30萬片GaAs和6萬片GaN的6寸生產線,建設進程順利。
4)紅外與可見CIS攝像頭
紅外CMOS圖像傳感器(IR CIS)用來接收被手部反射的紅外光,這是一個比較成熟的芯片。
紅外CIS供應商主要包括意法半導體、奇景光電、三星電子、富士通等公司。相比於可見光CIS,紅外CIS還是一個比較小的市場,但是增速很快,隨著熱成像、汽車、監控、手勢識別、虹膜識別等的普及,紅外CIS出貨量有望快速增長。
中國大陸目前已經在攝像頭方麵形成了完善的產業鏈結構,在CIS芯片方麵有北京君正(OV)、格科微電子、比亞迪電子等公司,在光學透鏡方麵有舜宇光學、聯創電子等,在模組製造方麵有歐菲光、舜宇光學、丘鈦科技等公司。
根據前文我們的分析,對於3D視覺而言,IR紅外攝像頭與RGB可(ke)見(jian)光(guang)攝(she)像(xiang)頭(tou)在(zai)濾(lv)色(se)片(pian)方(fang)麵(mian)存(cun)在(zai)較(jiao)大(da)的(de)差(cha)異(yi)。紅(hong)外(wai)攝(she)像(xiang)頭(tou)為(wei)了(le)不(bu)受(shou)到(dao)環(huan)境(jing)光(guang)線(xian)的(de)幹(gan)擾(rao),需(xu)要(yao)使(shi)用(yong)窄(zhai)帶(dai)濾(lv)色(se)片(pian),隻(zhi)允(yun)許(xu)特(te)定(ding)波(bo)段(duan)的(de)近(jin)紅(hong)外(wai)光(guang)通(tong)過(guo)。目(mu)前(qian),近(jin)紅(hong)外(wai)窄(zhai)帶(dai)濾(lv)色(se)片(pian)主(zhu)要(yao)廠(chang)商(shang)包(bao)括(kuo)VIAVI、水晶光電等。

5)圖像處理芯片
gaixinpianjuyouyidingdejishubilei,duiyusuanfacengmiandeyaoqiujiaogao,muqianquanqiufanweineikeyitigonggaileichanpindegongsiweishaoshujijiaxinpianjutou,baokuoyifabandaoti、德州儀器、英飛淩、恩智浦、安霸,以及索尼、東芝、富士通等日本芯片巨頭。

在圖像處理芯片方麵,國內公司全誌科技、北京君正和瑞芯微具備一定的實力,尤其是在幾年前平板電腦爆發時得到了快速成長。

6)國內產業鏈受益公司彙總
經過我們前文的分析,移動端3D視覺作為一個嶄新的技術,已經出現在微軟Kinect、英特爾RealSense等產品中,隨著硬件端技術的不斷進步,算法與軟件層麵的不斷優化,3D視覺的精度和實用性不斷得到提升,尤其是TOF方案與VCSEL的快速成熟,使得“深度相機+手勢/麵部識別”具備了大規模進入移動智能終端的基礎。
分析整個產業鏈的結構,無論是結構光方案、TOF方案,還是雙目立體成像方案,主要可以劃分為:綜合技術方案提供商、算法與軟件商、硬件供應商三部分,其中硬件又可以劃分為四大元器件(紅外發射器、紅外CIS攝像頭、可見光CIS攝像頭、圖像處理芯片,另外紅外攝像頭需要特製的窄帶濾色片,結構光方案需要發射端光學棱鏡與DOE光柵,雙目立體成像方案多一顆紅外CIS攝像頭)。
綜合技術方案提供商
國內從事深度攝像頭綜合技術方案的主要公司包括:TOF方案——舜宇光學(2382.HK)、深圳樂行天下,結構光方案——深圳奧比中光、南京華捷艾米,雙目立體成像方案——上海圖漾科技。
係統模組封裝與集成供應商
在聯想Phab2 Pro手機中,3D深度相機的模組封裝與集成由舜宇光學完成。歐菲光、丘鈦科技等相機模組製造商,由於在相機模組製造方麵積累了豐富的經驗,具備發展相應技術的潛力。
算法與軟件商
目前,算法方麵還沒有成為獨立的一環,因為大部分綜合技術方案供應商已經在算法層麵進行優化,目標是為客戶提供硬件+算法一體化的方案。
硬件供應商
紅外發射器
國內在VCSEL方麵起步較晚,在設計方麵還不具有有競爭力的公司,長春光機所在VCSEL科研領域處於世界先進水平;光迅科技曾開發出光通信使用的VCSEL芯片。由於VCSEL主要材料為GaAs(摻雜In、Al等),在工藝方麵與化合物半導體類似,在化合物晶圓製造方麵,三安光電具有較強的實力。
紅外與可見光CIS
中國大陸目前已經在攝像頭方麵形成了完善的產業鏈結構,在CIS芯片方麵有北京君正(擬收購OV和思必科)、格科微電子、比亞迪電子等公司,在光學透鏡方麵有舜宇光學、聯創電子,在模組製造方麵有歐菲光、舜宇光學、丘鈦科技等公司。
3D視覺方案需要克服環境光線的幹擾,因此在紅外CIS上需要添加窄帶濾色片,國內公司水晶光電具有深厚的技術基礎和較高的國際知名度,有望受益。
圖像處理芯片
在圖像處理芯片方麵,國內公司全誌科技、北京君正和瑞芯微具備一定的實力,尤其是在幾年前平板電腦爆發時得到了快速成長。
結構光DOE與Lens
對於結構光方案而言,需要通過衍射光柵DOE和光學棱鏡Lens,獲得特定形狀的光斑,一般采用MEMS工藝製造加工。
推薦閱讀:
特別推薦
- 噪聲中提取真值!瑞盟科技推出MSA2240電流檢測芯片賦能多元高端測量場景
- 10MHz高頻運行!氮矽科技發布集成驅動GaN芯片,助力電源能效再攀新高
- 失真度僅0.002%!力芯微推出超低內阻、超低失真4PST模擬開關
- 一“芯”雙電!聖邦微電子發布雙輸出電源芯片,簡化AFE與音頻設計
- 一機適配萬端:金升陽推出1200W可編程電源,賦能高端裝備製造
技術文章更多>>
- 算力爆發遇上電源革新,大聯大世平集團攜手晶豐明源線上研討會解鎖應用落地
- 築基AI4S:摩爾線程全功能GPU加速中國生命科學自主生態
- 一秒檢測,成本降至萬分之一,光引科技把幾十萬的台式光譜儀“搬”到了手腕上
- AI服務器電源機櫃Power Rack HVDC MW級測試方案
- 突破工藝邊界,奎芯科技LPDDR5X IP矽驗證通過,速率達9600Mbps
技術白皮書下載更多>>
- 車規與基於V2X的車輛協同主動避撞技術展望
- 數字隔離助力新能源汽車安全隔離的新挑戰
- 汽車模塊拋負載的解決方案
- 車用連接器的安全創新應用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall
熱門搜索
微波功率管
微波開關
微波連接器
微波器件
微波三極管
微波振蕩器
微電機
微調電容
微動開關
微蜂窩
位置傳感器
溫度保險絲
溫度傳感器
溫控開關
溫控可控矽
聞泰
穩壓電源
穩壓二極管
穩壓管
無焊端子
無線充電
無線監控
無源濾波器
五金工具
物聯網
顯示模塊
顯微鏡結構
線圈
線繞電位器
線繞電阻


