2016年,擊敗圍棋世界冠軍李世石九段的AlphaGo震驚世人,隨之引爆的AI大潮如雨后春筍。近年來,人工智能技術頻頻亮相,已然成為炙手可熱的全球科技新寵。業內人士評價,如果說以蒸汽技術驅動的第一次工業革命延伸了人的肢體,拓展了人類的力量,那么,以新一代人工智能技術為驅動的新一輪科技革命和產業變革將拓展人類的智能,極大提升人類智力所能創造的價值。
“2016-2018年,AI非常火爆。” 3 月 27 日的云知聲AI 技術開放日上,云知聲董事長兼CTO梁家恩談及AI技術時表示,但他同時認為,AI大潮正在退卻,原因是有些偽AI公司已經消失,而真正的AI公司還在繼續。“真AI和偽AI公司不僅在技術實力上有明顯差距,他們對產業問題的態度也是區別比較大的。到今天當AI大潮退去,我們可以站出來說,AI真正的時代到來。”
AI技術結合產業才有未來
關于人工智能,官方解釋為,AI是計算機科學的一個分支,它企圖了解智能的實質,并生產出一種新的能以人類智能相似的方式做出反應的智能機器,該領域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統等。梁家恩認為,AI是一種技術,但如果不跟產業結合,就只是一種純粹的炫技。
追溯AI發展這起伏變動的60多年,共經歷了三次浪潮。1956年的Dartmouth會議后,人們陸續發明了第一款的感知神經網絡軟件和聊天軟件,證明了數學定理。彼時,大家都驚呼“人工智能來了,再過十年機器要超越人類了”,然而直到70年代后期,人們發現過去的理論和模型只能解決一些非常簡單的問題。很快,AI第一次浪潮被拍在沙灘上。
隨著1982年Hopfield神經網絡和BT訓練算法的提出,外界又有了“人工智能春天來臨”的呼聲。于是80年代又興起一波人工智能的熱朝,包括語音識別、語音翻譯計劃,以及日本提出的第五代計算機。到了90年代后期,人們再次發現這種東西離實際生活還很遙遠。即使IBM在90年代時提出了一款名為“IBM Viavoice”的語音聽寫軟件,在演示當中效果不錯,但真正用的時候卻很難使用。2000年左右,第二次人工智能的浪潮又一次破滅。
第三次人工智能浪潮是隨著2006年 Hinton提出的深度學習的技術,以及在圖像、語音識別以及其他領域內取得的一些成功而開啟的。業界普遍認為經過兩次起伏,人工智能開始進入了真正爆發的前夜。
“AI過去兩次浪潮都沒有跟產業結合。” 梁家恩稱,而第三次浪潮更大的背景是萬物智聯的時代,這是一個互聯網的延伸,從PC互聯到移動互聯,再到未來萬物互聯才是真正的主戰場。在這個戰場上,除了AI技術之外,還有IOT、5G等技術的逐漸成熟落地,所有這些技術的結合,會給人們生活帶來天翻地覆的變化。“互聯網未來從線上沉入到線下,改變我們的消費和整個產業升級,在這個時代會有很大的機會來臨。”
據梁家恩介紹,云知聲基于在移動端的三年探索,發現語音助手在手機上的運用和電視上的運用活躍度相差20倍以上,從而得到啟發:只有AI技術跟硬件以及跟整個物聯網產業結合,才有未來。
從AI企業來看,據了解,百度AI能力正逐漸被應用于醫療、零售、農業和金融等各個領域。去年12月份,百度宣布成立“百度AI產業研究中心”,該中心將與產業、學術、研究機構攜手,探索各產業呈現出的新應用、新模式、新業態、新價值。騰訊圍繞著計算機視覺、智能語音、機器人控制、NLP自然語言處理等AI技術全面布局。網易也正在通過AI+教育消除城鄉教育鴻溝。可見行業已經普遍意識到,唯有加強人工智能和產業發展的融合,培育新增長點、形成新動能,以人工智能技術推動各產業變革,推動人工智能和商業場景的深度融合,才能真正實現商業化落地。
“全棧”、“硬核”兩大挑戰
在當下AI 技術驅動的產業變革浪潮中,要服務好消費與產業升級的需求,技術與應用的挑戰是十分艱巨的。從云知聲的AI 技術分享會上,記者獲取到兩個象征行業挑戰的關鍵要素——“全棧”和“硬核”。
全棧可以從兩個維度解讀,第一個維度是如何構建多模態生態擬人化智能系統。以云知聲為例,以語音交互起家的云知聲,其目前為止的技術圖譜已經超過了語音能力范圍,包括感知和認知和表達能力,用視覺和聽覺、降噪和語音識別、對話管理系統、行業智能系統、人臉和語音合成,最終反饋給用戶。據梁家恩透露,云知聲最終想構建的便是多模態生態擬人化智能系統。
要實現這個目的,需要解決兩個問題:落地問題和快速響應問題。“我們有兩塊,一個是智能芯片,另外一個是超算平臺,一個解決我們落地的問題,一個解決快速響應的問題。” 這是梁家恩或者說云知聲對全棧的理解。
第二個維度是如何打通完整的產業閉環,把感知和表達的技術真正跟認知結合。“我們有一個從0到1、從1到10。從1到10在技術領域已經比較完美了,但是對產業來說,從1到10才是剛開始。”梁家恩表示,能不能從10做到60分,60分意味著什么,這需要解決產業里面融合性的產品體系,包括整個技術方案能不能達到量產要求等,這主要是功能和產品運維的挑戰。
全棧打通以后,產業規模化應用的痛點如何解決?這就需要有足夠強的技術支撐,也即“硬核”。硬核技術涉及四個方面,一是語音技術,語音技術方向非常成熟,但在產業落地上的挑戰非常大;二是機器智能水平的提升,因為它代表大腦,如果只是鸚鵡學舌,是不能解決產業問題的;三是AI芯片落地,這需要較長時間的技術積累,云知聲從2014年開始布局AI芯片,2016年動工,到2018年才拿到第一塊芯片,并且還在不斷完善的過程中;四是超算能力,超算能力在延伸圖像翻譯時,能夠得到非常快的演進。梁家恩認為超算平臺對于云計算的價值,就相當于高鐵對于中國經濟發展價值,“可以讓我們的運轉體系提高不止一倍以上的效率。”但如何搭建一個真正強大的超算平臺,這同樣是一項挑戰。
基于以上關于“全棧”和“硬核”的兩個關鍵難點,梁家恩的分析中也提到的云知聲的突破:2016年開始挑戰遠場識別,做一些工程和技術方面的打磨。同年開始布局芯片、超算平臺和云計算。2018年拿到芯片,超算平臺開始鋪開,同期把全棧的技術構建起來,為AI技術與產業的融合發展奠定了很大的基礎。
“讓機器更好的服務人類”是整個AI行業以及所有AI企業都需要去努力的方向與目標。總結而言要解決三個問題:一是多模態的交互,能不能變成多模態擬人化的交互能力是重點;二是行業問題的解決,“我們不是要顛覆這個行業,而是要進入行業里面去,看這個產業有什么問題。” 梁家恩稱,有些問題是能夠通過人工智能技術解決的問題,那么就通過去解決行業問題來推動AI行業的發展。三是底層創新能力支撐,只靠當下的技術能力推進并不足以改變整個AI行業,只有包括芯片、超算、機器學習和認知學習等底層創新能力不能提升與突破,才能更好的面對未來的行業挑戰,以及獲得更好的發展。
2019年之于AI,是最好的時代,也是最壞的時代。“偽AI退卻,真AI前行”是梁家恩給予今年人工智能行業的預判,“AI的大時代已經到來了,但是對于偽AI企業已經消失,只要我們扎扎實實的把行業問題解決掉,市場就會給予最大的回報。”
【來源:中國家電網】