為提升AR對(duì)象分類,F(xiàn)acebook開(kāi)源Detectron計(jì)算機(jī)視覺(jué)算法VR/AR
Facebook本周宣布開(kāi)放Detectron,即該公司基于深度學(xué)習(xí)框架的計(jì)算機(jī)視覺(jué)對(duì)象檢測(cè)算法平臺(tái)。該公司表示,開(kāi)放項(xiàng)目的動(dòng)機(jī)在于加速計(jì)算機(jī)視覺(jué)研究,F(xiàn)acebook團(tuán)隊(duì)正在使用該平臺(tái)開(kāi)發(fā)各種應(yīng)用,包括增強(qiáng)現(xiàn)實(shí)技術(shù)。
在我最近的一篇文章中,詳細(xì)介紹了增強(qiáng)現(xiàn)實(shí)如今面臨的三大挑戰(zhàn),其中的實(shí)時(shí)對(duì)象分類是最大的障礙之一:
要讓計(jì)算機(jī)視覺(jué)理解“杯子”的含義,而不是僅僅看到一個(gè)形狀,這是一個(gè)不容小覷的問(wèn)題。所以這么多年來(lái),我們?cè)贏R演示作品中總會(huì)看到人們把基準(zhǔn)標(biāo)記附加到對(duì)象身上,以實(shí)現(xiàn)更細(xì)致的追蹤和交互。為什么會(huì)如此困難呢?第一個(gè)挑戰(zhàn)在于分類。杯子有數(shù)千種形狀、大小、顏色和紋理。有些杯子擁有特殊的屬性和特殊的用途(如燒杯),也就是說(shuō)不同的杯子的使用場(chǎng)合和背景也有所不同。想象一下,編寫(xiě)這么一個(gè)可以幫助計(jì)算機(jī)理解上述所有概念的算法是多大的挑戰(zhàn)。你也可以想象,編寫(xiě)一個(gè)向計(jì)算機(jī)解釋杯子和碗之間區(qū)別的代碼是多么地困難。
該文章還指出,“深度學(xué)習(xí)”有可能是實(shí)時(shí)對(duì)象分類的其中一種解決方案——這種學(xué)習(xí)涉及“訓(xùn)練”計(jì)算機(jī)去解讀它所看到的事物,而不是人工去編寫(xiě)檢測(cè)程序。本周,F(xiàn)acebook已經(jīng)正式開(kāi)源了他們的對(duì)象檢測(cè)算法,這可能會(huì)加速能進(jìn)行實(shí)時(shí)對(duì)象分類的系統(tǒng)的開(kāi)發(fā),從而讓增強(qiáng)現(xiàn)實(shí)發(fā)揮真正的功效。
如果沒(méi)有對(duì)特定環(huán)境進(jìn)行預(yù)編程,與我們周圍世界進(jìn)行交互的增強(qiáng)現(xiàn)實(shí)將需要對(duì)我們附近的情況有粗略了解。比方說(shuō),如果你正戴著一款A(yù)R眼鏡,你希望把烤箱的溫度投影到烤箱上方,同時(shí)在冰箱上方投影出已經(jīng)快要吃完的食物,這時(shí)AR眼鏡將需要了解烤箱和冰箱的形狀。由于烤箱和冰箱涵蓋的形狀、樣式以及擺放位置都不盡相同,這將成為一項(xiàng)極具挑戰(zhàn)性的任務(wù)。
在深度學(xué)習(xí)算法的鏡頭下,對(duì)象分類是什么樣子的
Facebook的人工智能研究團(tuán)隊(duì)與其他相關(guān)團(tuán)隊(duì)一直在研究,如何利用深度學(xué)習(xí)來(lái)幫助計(jì)算機(jī)解決對(duì)象檢測(cè)的問(wèn)題,而這一基于Caffe2深度學(xué)習(xí)框架的對(duì)象檢測(cè)算法就叫作Detectron。在正式托管至GitHub后,現(xiàn)在任何人都可以自行嘗試。Facebook希望,Detectron開(kāi)源后能幫助世界各地的計(jì)算機(jī)視覺(jué)研究人員進(jìn)行新的嘗試,并不斷改進(jìn)最新的技術(shù)。
該項(xiàng)目的GitHub頁(yè)面上寫(xiě)道:“Detectron旨在為對(duì)象檢測(cè)研究提供高質(zhì)量、高性能的代碼庫(kù)。Detectron的設(shè)計(jì)十分靈活,能夠支持新研究的快速實(shí)施與評(píng)估。”
算法可以檢測(cè)視頻輸入,并能夠猜測(cè)出構(gòu)成場(chǎng)景的離散對(duì)象。“檢測(cè)和識(shí)別人類與物體的交互作用 (Gkioxari et al)”等研究項(xiàng)目已經(jīng)在使用Detectron了,并以其為基礎(chǔ)來(lái)了解人類在特定環(huán)境中利用物體作出的行為。這是向正確的方向邁出的一步,以幫助計(jì)算機(jī)理解我們正在做的事情,從而能夠?yàn)槊β档奈覀兲峁┯袃r(jià)值的信息。
除了人工智能研究之外,Detectron還被用于Facebook的其他內(nèi)部團(tuán)隊(duì);Facebook在Detectron的開(kāi)源聲明中寫(xiě)道:“各支團(tuán)隊(duì)正在利用這個(gè)平臺(tái)來(lái)為各種應(yīng)用進(jìn)行定制模型訓(xùn)練,其中也包括增強(qiáng)現(xiàn)實(shí)和社區(qū)完整性研究。”
目前尚不清楚具體是哪支團(tuán)隊(duì)正在把Detectron用于增強(qiáng)現(xiàn)實(shí),不過(guò)很可能就是Oculus。早在F8大會(huì)期間,Oculus的首席科學(xué)家Michael Abrash就曾探討過(guò),增強(qiáng)現(xiàn)實(shí)將如何并于何時(shí)徹底改變我們的生活。
來(lái)源:青亭網(wǎng)
1.砍柴網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會(huì)明確標(biāo)注作者和來(lái)源;2.砍柴網(wǎng)的原創(chuàng)文章,請(qǐng)轉(zhuǎn)載時(shí)務(wù)必注明文章作者和"來(lái)源:砍柴網(wǎng)",不尊重原創(chuàng)的行為砍柴網(wǎng)或?qū)⒆肪控?zé)任;3.作者投稿可能會(huì)經(jīng)砍柴網(wǎng)編輯修改或補(bǔ)充。

- CompTIA報(bào)告:AI,VR,AR正在加速全球企業(yè)現(xiàn)代化進(jìn)程
- 蘋(píng)果和Vuzix加大AR投入,但游戲開(kāi)發(fā)者興趣缺缺
- 社交VR的成功取決于人,而不是VR頭顯
- 回首過(guò)去展望2018,VR將走向何方?
- 這款手機(jī)號(hào)稱科技巔峰之作 不用VR眼鏡,就能體驗(yàn)影院3D效果
- 谷歌更新VR建模工具Blocks,新增9大功能
- 從“炒作曲線”看人工智能的茍且與遠(yuǎn)方
- VR汽車應(yīng)用《RelayCars》最新版發(fā)布 各類豪車應(yīng)有盡有!
- 2018年將是Oculus發(fā)力優(yōu)質(zhì)VR內(nèi)容的一年
- 透過(guò)現(xiàn)狀看未來(lái) 關(guān)于VR頭顯未來(lái)的五大趨勢(shì)