DeepMind訓練AI踢足球
圖片來源:
DeepMind
在2016的後,Google姐妹公司DeepMind科學家開發的新AI系統,可學習人類動作,學習成為一組虛擬足球隊。
,披露該公司的NPMP(neural probabilistic motor primitive)模型如何從人或動物動作中學習複雜技能,並以代理程式或實體機器人,將技能體現出來,像是踢足球。
DeepMind科學家指出,足球向來是體現智慧(embodied intelligence)研究的一大挑戰,因為足球是結合個人技能及團隊合作的運動。DeepMind使用NPMP模型為基礎引導學習足球的動作技能。
NPMP(neural probabilistic motor primitive,NPMP)是一組通用運動控制AI模型,能將立即的運動意圖轉化為低階控制訊號。NPMP是在離線環境下訓練,或是模仿感測器蒐集到人或動物的資料(稱為運動捕捉motion capture/MoCap資料),透過增強式學習(reinforcement learning)訓練。
圖片來源/DeepMind
自行創業缺乏曝光? 網頁設計幫您第一時間規劃公司的形象門面
網站的第一印象網頁設計,決定了客戶是否繼續瀏覽的意願。台北網動廣告製作的RWD網頁設計,採用精簡與質感的CSS語法,提升企業的專業形象與簡約舒適的瀏覽體驗,讓瀏覽者第一眼就愛上它。
網頁設計一頭霧水該從何著手呢?
當全世界的人們隨著網路時代而改變向上時您還停留在『網站美醜不重要』的舊有思維嗎?機會是留給努力改變現況的人們,別再浪費一分一秒可以接觸商機的寶貴時間!
推薦評價好的iphone維修中心
擁有專業的維修技術團隊,同時聘請資深iphone手機維修專家,現場說明手機問題,快速修理,沒修好不收錢
這個模型包含兩部份,一是編碼器(encoder),其功用是把未來動作軌跡壓縮進運動意圖。第二個部份為低階控制器。低階控制器能依代理程式目前狀態及現有運動意圖,產生下個動作。
低階控制器能被包成一個可插拔式的運動控制模組,可重覆利用以便學習新技能,並由經過最佳化的高階控制器直接輸出運動的意圖。DeepMind指出,這可以讓探索過程更有效率,並限縮最後的解決方案。
利用NPMP,DeepMind的「球員」(即代理程式)從學習追球的技能開始逐漸學會如何合作。DeepMind過去一項專案中,兩組互相競爭的團隊出現合作行為。在最新專案中,NPMP也出現同樣行為,不同的是,這個情境需要更高階的運動控制能力。
DeepMind的代理程式學到的技能包括靈敏的移動、傳球及分工合作。「球員」們展現出靈敏的高頻運動控制,及摻雜預期隊友行為的長期決策,形成足球的團體戰。
AI模型學習以手臂和物件互動是另一個控制挑戰。研究團隊以少量搬箱子的動作捕捉資料,包括第一人視角及少數回饋訊號,即可訓練NPMP的代理程式將一個箱子由一地搬到另一地。另外也能訓練代理程式接、拋球、或是執行在迷宮中蒐集目標物的任務。
這個NPMP模型還能用來控制真正的機器人。DeepMind利用人類及狗的動作捕捉資料訓練NPMP技能及控制器,然後分別部署到真正的人形機器人(OP3)及四腳機器人(ANYmal B),這讓使用者可以透過控制桿控制機器人,或者以自然動作將球運到目的地。他們證實,NPMP可以既有生物動作資料為基礎訓練,學習高度規律化、自然及可重覆使用的動作技能,再由真正的機器人體現出來。
https://www.ithome.com.tw/news/152915
廣告預算用在刀口上,台北網頁設計公司幫您達到更多曝光效益
有別於一般網頁架設公司,除了模組化的架站軟體,我們的營業主軸還包含:資料庫程式開發、網站建置、網頁設計、電子商務專案開發、系統整合、APP設計建置、專業網路行銷。
台北網頁設計公司這麼多該如何選擇?
網動是一群專業、熱情、向前行的工作團隊,我們擁有靈活的組織與溝通的能力,能傾聽客戶聲音,激發創意的火花,呈現完美的作品
台北網頁設計公司這麼多該如何選擇?
網動是一群專業、熱情、向前行的工作團隊,我們擁有靈活的組織與溝通的能力,能傾聽客戶聲音,激發創意的火花,呈現完美的作品