迄今為止,教導機器人執(zhí)行任務(wù)通常涉及直接編碼,反復試驗或手持機器。但是很快,您可能只需要像前一天一樣執(zhí)行該任務(wù)。麻省理工學院的科學家們開發(fā)了一個系統(tǒng),即“不確定規(guī)格計劃”(PUnS),該系統(tǒng)可以幫助機器人學習復雜的任務(wù),否則他們會遇到麻煩,例如設(shè)置餐桌。PUnS代替了機器人因執(zhí)行正確的動作而獲得獎勵的通常方法,而是讓機器人對各種規(guī)格持有“信念”,并使用一種語言(線性時態(tài)邏輯)讓其推理現(xiàn)在要做的事情并在未來。
為了將機器人推向正確的結(jié)果,團隊設(shè)定了有助于機器人滿足其整體信念的標準。這些標準可以滿足概率最高,公式數(shù)量最多,甚至失敗幾率最小的公式。如果使用危險材料,設(shè)計人員可以優(yōu)化機器人的安全性;如果是工廠模型,設(shè)計人員可以優(yōu)化其質(zhì)量。
MIT的系統(tǒng)在早期測試中比傳統(tǒng)方法有效得多。基于PUnS的機器人在設(shè)置桌子的20,000次嘗試中僅犯了6個錯誤,即使研究人員出現(xiàn)了諸如隱藏叉子之類的麻煩時,自動機也完成了其余任務(wù),并在彈出時回到了叉子。這樣,它表現(xiàn)出了類似人的能力,可以設(shè)定明確的總體目標和即興創(chuàng)作。
開發(fā)人員最終希望該系統(tǒng)不僅可以通過觀看來學習,還可以對反饋做出反應(yīng)。例如,您可以對其進行口頭更正或?qū)ζ湫阅苓M行批評。這將涉及更多工作,但它暗示著家用機器人可以通過樹立榜樣來適應(yīng)新職責的未來。