三级黄片

伊利集團 www.yilibabyclub.com.jpg 徐工1.jpg 玉柴gif.gif
今天是:
    中文|English APP下載
zj.png
園區 要聞新城新區產業園產業地產產業轉移綠色園區
曠視開源工業級深度學習框架 助力AI新基建

文章來源 : 中國工業新聞網 發布時間 :2020年03月27日 11:29分享到:
     3月25日,曠視科技正式發布AI生產力平臺Brain++,并開源Brain++的核心組件——工業級深度學習框架天元(MegEngine),降低AI開發者開發門檻。曠視聯合創始人兼 CTO 唐文斌表示,天元開源可讓Brain++產生更大價值,為用戶提供更完善的集成開發環境,將產品從實驗室原型到工業部署原本數周或數月的時間縮至小時級。 
開源35萬行代碼 囊括大多數應用場景 
     為了這次開源,曠視為天元做了一次全面升級。本次發布為Alpha版本,基于Apache License 2.0,共開源約35萬行代碼,包括C++、CUDA和Python代碼,囊括了大多數應用場景。
     從技術角度來看,天元可分為五個層次: 最上面是計算接口層,向外連接了Python和C++接口,開發者可以通過Python和C++兩種語言對整個框架進行使用和編程,以及系統的設計和研發、訓練和推理; 接著是圖表示層,包含了動態圖和靜態圖的表示功能; 再往下是一個完整的一體化核心計算引擎,具有自動求導機制、圖優化和圖編譯功能,有了這個層次就可以支撐起動態、靜態和接口完整的功能; 在這個層次之下的運行時管理層由兩個主要部分組成,一部分是計算調度,可以將計算設備抽象為執行流,由調度器對這些執行流進行合理調度,另一部分是一整套內存管理機制,包括靜態內存和動態內存管理——這個模塊內置了許多關于內存的高級優化,其中值得一提的是實現了靜態亞線性內存的優化器,使得內存管理效率大幅提升; 最底層是支撐整個系統的核心計算內核層,其中包含一個高性能算子庫,它支持常見的計算設備,包括X86、CUDA、ARM和專業計算芯片等——該層還包含一個高性能異構通信庫,能夠使得整個計算框架在分布式多結點上大規模應用,以支撐更大規模的訓練。
實現“深度學習、簡單開發” 
      過去幾年,曠視在研發過程中遇到了很多行業共通的痛點,據介紹,天元的核心特性就是圍繞這些痛點展開的。 
一是訓練推理一體化。深度學習從研究到生產的流程非常復雜,各階段模型精度往往很難對齊。而天元框架無需進行模型轉換,可直接使用訓練后得到的模型進行推理,保證訓練速度和精度與推理一致;模型訓練結束后,可保證跨設備的模型精度實現對齊;可內置自動模型優化過程,減少手工模型遇錯處理,形成高效的研發體系。這樣一來,AI真正落地要考慮的多端部署和在線服務問題就得以解決,大大減少了訓練成本。 
二是動靜合一。靜態圖好部署,動態圖易調試,但二者往往難以兼得。針對這個痛點,天元集成了兩者優點,在充分利用動態圖模型訓練優勢時,通過動靜態一鍵轉換功能,以靜態圖的形式完成生產部署。天元支持動靜態的混合編程,靈活性更強。開發者可在動態過程中非常方便地進行原型研發和調試,同時可在生產環節借助靜態圖提速。測試中,靜態提速往往可達5%~20%。 
三是兼容并包。市場上很多框架的接口不同,需要重新進行模型實現,對一般開發者來說成本較高。而天元代碼風格與Numpy、PyTorch的寫法非常相似,在函數命名風格和參數設計細節中尊重原有社區的傳統。開發者可便利地將以往模塊直接導入天元框架,和其它天元組件一起使用,更好地進行模型復現。另外,曠視在計算機視覺領域的一些獨特積累也融入天元系統,讓計算機視覺研發更簡便。
四是靈活高效。AI生產企業可能面臨很多設備和場景,需要在每種設備上實現極致性能。針對這一痛點,天元在許多設備、算法上都能得到領先性能。天元內置了一個高效的內存優化策略,可顯著減少訓練時的顯存占用,在同類設備上訓練更大模型,支持更多算法。天元還有很多內存和速度的優化機制,比如亞線性內存優化,在幾乎不降低計算速度前提下,達到256 Batch的訓練能力。 借助以上四大特性,天元能夠實現產品從實驗室原型到工業部署的小時級轉化能力、大規模彈性訓練,并支撐研究團隊進行最前沿的學術開發。這樣,天元就做到了“簡單開發”,讓開發者真正體驗到“訓得好”、“訓得動”、“訓得快”。
發力AI新基建 產品從實驗室到工業部署可縮至小時級 
      天元是為工業級、研究院規模的研發機構設計的,其核心特性均用于解決研發過程中的痛點。對曠視本身,開源則是“基于算法向產業方向升級、打造AI基礎設施”戰略的延伸。
     唐文斌說,只有AI芯片平臺和AI生產力平臺能夠被稱為AI基礎設施。其中,芯片平臺能夠承載AI計算,AI生產力平臺可以釋放生產算法的效能。天元全面開源可讓AI生產力平臺Brain++服務于更廣大的開發者,產生更大社會價值。
     何謂AI生產力平臺?在唐文斌看來就是“為用戶提供更完善的集成開發環境,滿足AI開發者從AI生產(輸出算法模型)到應用(實現算法工程化封裝)各環節中,一站式、全流程算法研發的切實需求,將產品從實驗室原型到工業部署原本數周或數月的時間成本,縮短到小時級。”
     以制造企業為例,工廠在配電產品質量檢測中可能出現零部件顏色搭配錯誤、字符印刷殘缺等情況,靠人工目檢效率低,靠機器視覺方案需要巨大投入。而通過Brain++這樣的AI生產力平臺,該制造企業可獲得從專業咨詢、數據生產、模型優化到私有化AI平臺建設運維等服務,降本增效且自主安全。 在落地實踐上,曠視數據管理平臺MegData可實現從數據抽取、清洗、標注、管理全流程管理,再加上彈性算力共享平臺MegCompute及深度學習框架MegEngine,可將深度學習算法研發的能力與方案直接布署到工廠,極大降低整體訓練成本,滿足產線上快速升級算法的要求。
     目前,曠視Brain++的這種打法已在制造業落地。施耐德想通過AI提升配電產品質量檢測效率,但傳統的機器視覺方式存在精度差、模型升級難、研發部署周期長等痛點。曠視依靠數據增廣技術擴充合成訓練數據,幫助施耐德電氣實現智能化監控產品質量,同時降低了數據生產成本。(本報綜合)
編輯 : 吳曌
中國工業報社 版權所有 未經書面允許 不得復制或建立鏡像
98765123.jpg X
微信94x94.jpg 微信二維碼 X
微博94x94.jpg 新浪微博 X
頂部