AI 研究人員的目標之一是弄清楚如何使機器學習模型更具可解釋性,以便研究人員能夠理解他們做出預測的原因。谷歌表示,這是對深度神經網絡的預測的改進,而不是理解模型輸出的原因。研究人員展示了如何構建一個能夠分析烘焙食譜的可解釋機器學習模型。
該機器學習模型可以開發(fā)自己的新的食譜,并且不需要數(shù)據(jù)的科學專業(yè)知識來建立模型。Sara Robinson 致力于 Google Cloud 的 AI。在大流行期間,她喜歡烘焙,并將她的人工智能技能轉向了業(yè)余愛好。她首先收集了一組食譜數(shù)據(jù),并構建了一個 TensorFlow 模型來吸收一系列成分并輸出諸如“97% 的面包、2% 的蛋糕、1% 的餅干”之類的預測。
該模型能夠準確地按類型對食譜進行分類,她用它來想出一個新的食譜。她的模型確定配方是 50% 的餅干和 50% 的蛋糕。它被稱為蛋糕。羅賓遜說人工智能的食譜很好吃,嘗起來就像她想象的如果她告訴人工智能制作混合蛋糕餅干會發(fā)生什么。
Robinson 與另一位研究人員合作,使用更大的數(shù)據(jù)集、新工具和可解釋的模型構建了烘焙 2.0 模型,以深入了解蛋糕、餅干和面包的制作過程。該模型提出了一種名為“breakie”的新食譜,這是一種混合面包餅干。研究人員使用的數(shù)據(jù)集包括一份包含 16 種核心成分和 600 種食譜的洗衣清單。
作為預處理的最后一部分,研究人員使用了數(shù)據(jù)增強技巧。數(shù)據(jù)增強是一種從您已有的數(shù)據(jù)中創(chuàng)建新訓練示例的方法。人工智能被設計成對食譜的份量不敏感,因此研究人員會隨機將配料量增加一倍或三倍。
機器學習模型可以預測食譜類型并提供對話,允許研究人員命名模型、他們希望模型訓練多長時間,并指示在訓練中使用哪些輸入特征。結果是一個模型能夠預測正確給出的食譜的類別,并指定對其預測貢獻最大的成分的重要性分數(shù)。