“3D攝像頭并不是普通的功能性組件創(chuàng)新,而是激活光學(xué)交互屬性,實(shí)現(xiàn)二維到三維的交互升級,是繼圖形界面、觸控之后的第三次人機(jī)交互跨越。”這是在言談中,業(yè)內(nèi)人士對于3D攝像頭持有的看法。
本文鏈接:http://networkstorage.cn/news/show-htm-itemid-22380.html
的確如此,光學(xué)攝像頭對消費(fèi)電子產(chǎn)品來說具有雙重意義,一方面提供拍照功能,另一方面又為影像信息提供了唯一入口,即兼具娛樂和交互兩種屬性,而下一步消費(fèi)電子的重點(diǎn)創(chuàng)新也被廣泛認(rèn)為是人機(jī)交互端,而人機(jī)交互的大勢所趨則是影像,因此作為影像的唯一入口,光學(xué)的交互屬性將逐漸被激活,成為最具潛力的爆點(diǎn)。
什么是3D成像:不只是“拍照”
3D代表著空間長、寬、高三個(gè)維度,通常情況下,普通的2D成像原理用于平面?zhèn)鞲衅鹘邮鼙慌臄z物體反射或者發(fā)出的可見光,從而形成二維圖像,由于現(xiàn)實(shí)世界是三維世界,2D成像獲得的圖像信息你存在特征信息的損失;3D成像則利用深度信息完美的彌補(bǔ)了這一缺陷,獲取平面圖形的同時(shí)還可以捕捉三維信息,為后期的圖像分析提供了關(guān)鍵特征,計(jì)算機(jī)或只能設(shè)備據(jù)此才能完整的復(fù)原現(xiàn)實(shí)世界。
作為拓展2D成像的手段,3D成像目前有是三種主流解決方案,這三種方案,可能已經(jīng)耳熟聞詳了,在筆者再次做了相關(guān)梳理。
第一種是結(jié)構(gòu)光方案,它對物體拍攝兩次即可實(shí)現(xiàn)3D距離的探測,其他計(jì)算過程都由本地處理器完成,延時(shí)非常短,測量速度快,同時(shí)經(jīng)過多年的技術(shù)發(fā)展,模組體積已經(jīng)較小。據(jù)悉,結(jié)構(gòu)光最早應(yīng)用于微軟的明星產(chǎn)品Kinect上,迄今已有8年,可謂是經(jīng)過了時(shí)間驗(yàn)證的成熟方案。
TOF作為3D成像的第二種解決方案,它的原理是通過給目標(biāo)連續(xù)發(fā)送光脈沖,用傳感器接手從物體返回的光,通過探測光脈沖的飛行(往返)時(shí)間來得到目標(biāo)物距離。
TOF的優(yōu)勢在于遠(yuǎn)距離探測,不易受到環(huán)境光線的干擾,但是TOF芯片每一個(gè)像元要對入射光往返相機(jī)與物體之間的相位分別記錄,傳感器結(jié)構(gòu)比普通圖像傳感器更復(fù)雜,單個(gè)像素要大得多,成本和體積更大。
雙目視覺技術(shù)作為其第三種解決方案,該技術(shù)方案通過兩個(gè)RGB攝像頭模仿人的雙眼,通過標(biāo)定后的雙攝像頭得到同步曝光圖像,然后計(jì)算獲取的二維圖像像素點(diǎn)的第三維深度信息,代表廠商是在手勢識別領(lǐng)域的領(lǐng)先者Leap Motion。
雙目方案算法實(shí)現(xiàn)非常復(fù)雜,尋找像間對應(yīng)關(guān)系時(shí)需要特征提取、特征匹配等一系列復(fù)雜的算法,同時(shí)光照變化、光線明暗等外在因素的影響會對算法提出更大的挑戰(zhàn)。相比雙目的被動方案,基于主動光探測的結(jié)構(gòu)光、TOF具有算法簡單,相應(yīng)速度快,識別距離范圍大的優(yōu)勢,因而更加契合交互場景的要求。
而就TOF與結(jié)構(gòu)光之間對比而言,結(jié)構(gòu)光在便捷性、成本、成像速度與延時(shí)方面占據(jù)優(yōu)勢,基于此有相關(guān)機(jī)構(gòu)判斷結(jié)構(gòu)光將率先借蘋果新機(jī)登陸前置鏡頭,而TOF抗干擾性更好,探測距離遠(yuǎn),未來將在后置鏡頭大展拳腳,對接長距應(yīng)用場景。
筆者從供應(yīng)鏈獲悉,此次蘋果很有可能在它的iphone 8上使用TOF技術(shù),而該技術(shù)由ST供應(yīng)。
導(dǎo)入3D成像后,最先給用戶帶來的全新體驗(yàn)是啥?
市場關(guān)心的另一個(gè)問題則是,蘋果在導(dǎo)入3D成像之后,將最先給用戶帶來哪些全新體驗(yàn)?從近期一系列的動作來看,業(yè)內(nèi)不少人士認(rèn)為,蘋果將緊緊圍繞AI+AR兩大抓手,匹配3D成像強(qiáng)大的信息輸入能力,以人臉識別和AR應(yīng)用打造3D交互的第一波浪頭。
普遍觀點(diǎn)認(rèn)為AI是云端的事,本地至負(fù)責(zé)與用戶交互和數(shù)據(jù)搜集。然后,蘋果用實(shí)際行動說明了AI與機(jī)器學(xué)習(xí)并不僅僅局限在云端。
2017年WWDC大會,蘋果發(fā)布了新的機(jī)器學(xué)習(xí)API—Core ML,并宣稱圖像識別速度比谷歌Pixel快6倍。Core ML提供支持人臉追蹤、人臉檢測、地標(biāo)、文本檢測等任務(wù)的API,它將加快iphone、ipad和Apple Watch上AI任務(wù)執(zhí)行的速度,從文本分析到人臉識別,幾乎涉及一切事物。
Core ML含有大量的關(guān)鍵機(jī)器學(xué)習(xí)工具,包括神經(jīng)網(wǎng)絡(luò)(深度、循環(huán)以及卷積網(wǎng)絡(luò)),同時(shí)也支持線性模型和樹集成。有了本地的AI框架Core ML,再配合3D成像輸入的全方位、立體化、多維度的圖像信息,人臉識別、手勢識別自然水到渠成。
AR是iphone 8的另一部重頭戲。蘋果在WWDC2017全球開發(fā)者大會上發(fā)布了AR開發(fā)平臺ARKit,憑借蘋果龐大的IOS用戶群,ARKit一舉成為全球最大的AR開發(fā)平臺,在推出ARKit的三周后,蘋果公司還收購德國眼部追蹤技術(shù)公司SensoMotoric Instruments,一系列動作意味著蘋果在AR領(lǐng)域開始加速前進(jìn)。
與谷歌的AR平臺“Projece Tango”和VR平臺“DayDream”相比,ARKit不需配套專門的硬件,傳統(tǒng)的單攝像頭iphone和ipad借助ARKit也可呈現(xiàn)一定的AR效果,伴隨著ios11發(fā)布后,理論上可應(yīng)用于任何的iphone和ipad;而谷歌的平臺對硬件有著極高的標(biāo)準(zhǔn),且安卓機(jī)機(jī)型眾多,硬件配置不統(tǒng)一,目前市面上僅有少數(shù)機(jī)型支持其應(yīng)用,因此ARKit的受眾更多,平臺規(guī)模優(yōu)勢顯著。
龐大的用戶數(shù)量決定了ARKit對AR產(chǎn)業(yè)前所未有的催熟力度,而導(dǎo)入3D成像之后,ARKit更是如虎添翼,三維的信息輸入方式將與其三維輸出相匹配,打造更優(yōu)的AR體驗(yàn),AR世界的大門將被正式開啟。
3D成像能夠做什么:小鏡頭有大用場,下游交互需求廣泛
“3D成像未來的發(fā)展不可小覷。”這是筆者多次聽到的言論。那么3D成像究竟能做什么呢?它的市場又在哪呢?
其實(shí),3D成像與2D成像最大的區(qū)別在于提供了深度信息,深度信息意味著對真實(shí)世界更真實(shí),更高質(zhì)量的圖像描述,配合人工智能時(shí)代激增的信息處理能力,它可以圍繞3D建模衍生出多樣化的應(yīng)用,從生物識別、VR/AR到自動駕駛、無人機(jī)等領(lǐng)域。
在生物識別系統(tǒng)中,3D成像獲取的深度信息可與模型鏈接,迅速精準(zhǔn)的完成匹配檢測;在VR/AR方面,3D成像技術(shù)可快速掃描真實(shí)世界,建立虛擬世界模型,創(chuàng)建交互場景提供了微型化、快速化的解決方案。
在AI領(lǐng)域,機(jī)器視覺是人工智能的下一個(gè)前沿,而3D成像技術(shù)則是機(jī)器視覺的關(guān)鍵解決方案;在汽車上,2D成像可以用于自動駕駛,通過3D成像技術(shù)對行車環(huán)境進(jìn)行感知,從而獲取環(huán)境信息以增加安全性,此外還可以用于汽車內(nèi)的乘客離位檢測;在家庭娛樂方面,3D成像作為一個(gè)性能的輸入設(shè)備,實(shí)現(xiàn)手勢識別功能,為第一人稱游戲提供直觀的接口。
人工智能AI是信息技術(shù)領(lǐng)域正在發(fā)生的大革命,很多機(jī)器人也已經(jīng)具備了相當(dāng)高的智能化特點(diǎn)。業(yè)內(nèi)普遍認(rèn)為機(jī)器視覺將是AI再進(jìn)一步的關(guān)鍵,只有做好信息輸入,機(jī)器才能成為真正意義上的AI。
以工業(yè)機(jī)械手為例,只有判斷了要抓取的物品具體位置,繼三維坐標(biāo),才能精確無誤的移動目標(biāo)物體。
此外,在安防領(lǐng)域,3D成像依然有其存在的價(jià)值,視頻監(jiān)控中3D成像可以增加深度信息實(shí)現(xiàn)全方位的監(jiān)控,而在人臉識別門禁中導(dǎo)入3D成像則大大提高了其安全性,值得一提的是,在無人機(jī)領(lǐng)域,3D成像還有其避障功能。
2015年Explorer 2無人機(jī)首度演示了采用TOF技術(shù)的自動避障功能,該無人機(jī)懸空時(shí),TOF系統(tǒng)會保持每秒鐘旋轉(zhuǎn)2—5圈的狀態(tài),快速掃描周圍360度的有效半徑,及時(shí)發(fā)現(xiàn)障礙,而大疆科技的Phantom 4無人機(jī)則采用了雙目3D+超聲波的方案,通過將多種避障模塊相結(jié)合,大幅度提高避障的穩(wěn)定性和準(zhǔn)確度。
由此可見,3D成像并非只是概念的“空中樓閣”,而是有著強(qiáng)勁的下游需求支撐。基于此,更有機(jī)構(gòu)表明,3D成像技術(shù)在蘋果引領(lǐng)之下,將率先在消費(fèi)電子應(yīng)用上大規(guī)模落地,隨后逐步輻射到各行業(yè),實(shí)現(xiàn)2D向3D的交互跨越。
據(jù)Yole Development預(yù)測,2016—2022年3D成像將在消費(fèi)電子領(lǐng)域,以接近160%年復(fù)合增速迎來大爆發(fā)。
筆者從供應(yīng)鏈獲悉,3D攝像頭在國內(nèi)手機(jī)市場的應(yīng)用將在2018年下半年這一時(shí)間段,因?yàn)槟壳皟r(jià)格這一瓶頸目前還沒有得以突破,有消息稱,華為曾在100臺手機(jī)中嘗試搭載3D攝像頭但最終因價(jià)格高的原因未批量生產(chǎn)。
從某種程度上來看,制造業(yè)本身是最堅(jiān)實(shí)的生產(chǎn)力,一旦完成技術(shù)上餓嬋變,將存在巨大的利潤空間,如果后期這一價(jià)格原因得以解決,未來隨著其市場利用率的不斷提升,3D攝像頭的市場空間將不斷拉大。