谷歌的定制張量處理器(TPU)芯片是去年谷歌云平臺客戶可以使用的最新一代芯片,專為人工智能推理和培訓任務量身定制,如圖像識別,自然語言處理和強化學習。為了支持開發應用程序的開發,Mountain View公司擁有穩定的開源架構,如BERT(一種語言模型),MorphNet(一種優化框架)和UIS-RNN(一種揚聲器二值化系統),通常還附帶了數據集。延續這一思路,谷歌今天在其庫中添加了兩種新的圖像分割模型,并聲稱這兩種模型都實現了部署在云TPU pod上的最先進的性能。
該模型- Mask R-CNN和DeepLab v3+ -自動標記圖像中的區域,并支持兩種類型的分割。第一類是實例分割,它為一個或多個對象類(例如,家庭照片中的人)的每個實例提供一個惟一的標簽,而語義分割則根據圖像所代表的對象或紋理類對圖像的每個像素進行注釋。(例如,一個城市的街景可能被標記為“人行道”、“人行道”和“建筑物”。)
正如谷歌所解釋的,Mask R-CNN是一個兩階段的實例分割系統,可以同時定位多個對象。第一個階段從輸入照片中提取模式,以識別潛在的感興趣區域,而第二個階段在為每個輸入照片生成像素級掩碼之前,對這些建議進行細化,以預測對象類。
另一方面,DeepLab 3+優先考慮分割速度。使用谷歌最新一代TPU硬件(v3)上的TensorFlow機器學習框架,在開源PASCAL VOC 2012圖像語料庫上進行培訓,在不到5小時的時間內完成培訓。
本周起,Google為Mask R-CNN和Deeplab 3+提供的協作平臺上的教程和筆記就可以使用了。
TPU是一種特定于應用程序的集成電路(asic),它是液態冷卻的,設計用于插入服務器機架,內部用于支持谷歌照片、谷歌云視覺API調用和谷歌搜索結果等產品。第一代設計于5月在谷歌I發布。最新一代(第三代)于2018年5月發布。谷歌聲稱它可以提供高達100千萬億次浮點運算的性能,大約是其第二代芯片的8倍。
谷歌并不是唯一一家為人工智能優化的云托管硬件。今年3月,微軟開設了Brainwave,這是一支用于加速機器學習操作的現場可編程門陣列(FPGA),用于選擇Azure客戶。(微軟表示,這使得其為Bing搜索引擎提供動力的模型的性能提高了10倍。)據報道,亞馬遜正在開發一種人工智能芯片,該芯片將加速其Alexa語音引擎的模型訓練。
https://venturebeat.com/2019/04/24/microsoft-earnings-q3-2019/
來源:venturebeat