近日,具身智能公司 RoboScience 完成數千萬元種子輪融資,由零一創投獨家投資。
北京機科未來科技有限公司成立于 2024 年 12 月,由前蘋果技術主管田野與新加坡國立大學助理教授邵林共同創立。創始人兼 CEO 田野,曾以專業第一從中科大物理系畢業,后赴斯坦福人工智能實驗室深造,師從吳恩達。田野曾是蘋果總部最年輕的主任工程師之一。在蘋果的 7 年時間中,他作為技術主管,帶領團隊打造了蘋果的機器學習平臺,支撐了相機、Siri、Apple Intelligence 等 AI 應用和 CoreML、ARKit、Vision Framework、NLP framework 等 AI 生態框架,推出多項世界領先的端側訓練和推理技術,服務了數億用戶和數十億設備,具有把 AI 技術落地到軟硬件產品的豐富經驗。
另一創始人兼首席科學家邵林,目前于新加坡國立大學擔任助理教授,深耕具身智能領域。此前,邵林博士畢業于斯坦福大學,師從 Jeannette Bohg 和 Leonidas J. Guibas 教授。2023 年,邵林合作發表的論文提出 SAM-RL 方法,有效解決了對世界進行高效建模的問題,入圍了國際機器人頂會 RSS 的最佳系統論文獎。2024 年,邵林帶領團隊提出了 D ( R,O ) Grasp 方法,通過創新性地建立機器手與物體在抓取姿態下的交互模型,成功實現了對機器手與物體幾何形狀的高度泛化能力,并極大提升了抓取速度,重塑了跨智能體靈巧手抓取,獲得 CoRL MAPoDeL Workshop 最佳機器人論文。
田野與邵林合作推出的統一操作大模型,是視覺語言大模型與物理世界的橋梁,已完成了三個維度的泛化:指導任意的機器人,操作任意物體,完成任意任務。此外,RoboScience 已建立規模化獲取并使用仿真數據、視頻數據和真實數據的系統,覆蓋了日常生活中可見的各種類型及各種維度的物體和任務,提升了數據質量,降低了數據成本。
技術路線上,RoboScience 從成立之初就堅定地選擇做快慢腦分層模型,這與海外明星公司 Figure 的探索方向不謀而合。另一明星公司 Physical Intelligence 最新發布的模型也從端到端 VLA 模型轉為了分層模型。不同于大語言模型可以從網絡上抓取數據,數據來源問題一直是具身智能發展的阻礙。RoboScience 已建立規模化獲取并使用仿真數據、視頻數據和真實數據的系統,覆蓋了日常生活中可見的各種類型及各種維度的物體和任務,提升了數據質量,降低了數據成本。
商業化方面,基于其技術的高度泛化能力,RoboScience 的產品將根據落地場景的具體需求,高效適配不同配置和性能的硬件,拓展落地場景、提升落地效率。之所以選擇這樣的開發路徑,基于 RoboScience 團隊對于市場的洞察:一是由于隨著具身智能的發展,未來不同場景下需要不同的硬件設備,很難用一個統一的硬件來覆蓋機器人需要完成的所有任務。二是背靠中國的供應鏈優勢,硬件成本正在快速下降,此時推出通用操作的軟件模型,有利于將供應鏈優勢在具身智能領域快速發揮出來。三是由于軟件研發迭代速度顯著快于硬件,對于 RoboScience 這樣在軟件方面有豐富產業經驗與學界技術支持的團隊而言,與硬件廠商合作來做不同場景無疑是將優勢最大化的選擇。
來源:獵云網