欢乐颂第一季,千年殇

前沿動態(tài) |下一代認知機器人的作用是什么

07-28 文章來源：瀏覽量：3330

作者：Shingo Shimoda等

翻譯：阿康

編者按：

隨著社會發(fā)展和技術(shù)進步，機器人將逐漸成為我們工作、生活中的重要伙伴。認知機器人結(jié)合了機器人和人工智能前沿技術(shù)，讓機器人像人類一樣觀察、思考、感知世界。本文原載于《Advanced Robotics》Volume 36（2022），有助于我們?nèi)媪私庹J知機器人的發(fā)展。

1. 引言

認知機器人的角色作用是什么？今天，自動機械和人們通常稱之為機器人的界限變得越來越模糊。然而，機器人最初被設(shè)想為以更生物或類似動物的方式移動的人工制品。因此，許多機器人研究人員正在尋求開發(fā)能夠與我們一起生活并相互幫助的機器人。

最近，社會對機器人成為我們合作伙伴的需求迅速增加。為此，機器人需要感知環(huán)境，了解周圍環(huán)境，與人交流，并與人類共享相同的環(huán)境。盡管“高水平的認知功能對這些機器人至關(guān)重要”的抽象論點沒有爭議，但所需的認知功能的種類仍然是一個懸而未決的問題。

在心理學中，認知是指通過感官、思想和經(jīng)驗獲得知識和理解的過程，這意味著認知主要是從感知到理解環(huán)境的單向過程。在行為生物學和人工智能領(lǐng)域，更多地關(guān)注動態(tài)問題，認知的含義已經(jīng)擴大到不僅包括理解給定情況的單向過程，還包括以學習，記憶和運動控制功能作為信號循環(huán)創(chuàng)建運動的過程。我們非常好奇機器人技術(shù)將如何為改善認知概念做出貢獻。

2014年，在IEEE機器人與自動化學會成立了認知機器人技術(shù)委員會（TC-CoRo），以鼓勵對認知機器人研究的討論。TC-CoRo的創(chuàng)始首席主席Giulio Sandini教授在TC-CoRo啟動時表示，各個科學領(lǐng)域之間的合作對于實現(xiàn)真正有用的認知系統(tǒng)至關(guān)重要，機器人技術(shù)需要成為整合這些科學的“大熔爐”。

這一信息源于機器人技術(shù)的重要特征，即控制器中實現(xiàn)的所有功能都體現(xiàn)為現(xiàn)實世界中的機器人行為。我們可以觀察和分析行為中實現(xiàn)功能的細節(jié)，超越理論和抽象的討論。機器人技術(shù)的這一特性可以防止對概念功能的討論變得過于多樣化和過于籠統(tǒng)。從機器人技術(shù)對提高認知概念的貢獻來看這一特征，機器人可以提供一個領(lǐng)域，將計算和行為與環(huán)境的物理接觸和與他人的交流聯(lián)系起來，在這里我們可以討論深入的認知功能，包括認知在過程中的存在和認知的作用。

為了闡明機器人技術(shù)的這一作用，我們舉辦了一場名為“下一代認知機器人的作用是什么？”的在線圓桌會議。在圓桌會議上，我們討論了從認知功能的基本技能到現(xiàn)實世界中實現(xiàn)的主題。

在本文中，我們總結(jié)了圓桌會議的討論，以闡明適合機器人控制的認知系統(tǒng)和未來認知機器人研究的正確方向。為了總結(jié)圓桌會議的討論，我們首先需要從機器人學的角度澄清為什么認知系統(tǒng)是必要的。在經(jīng)典機器人技術(shù)中，機器人使用如圖1（a）所示的系統(tǒng)進行控制。在該框架中，對機器人主體、環(huán)境、行為目標和約束條件等重要控制信息進行建模，并設(shè)計與模型匹配的控制器。這種基于模型的方法的關(guān)鍵問題之一是模型的錯誤。即使在工廠等穩(wěn)定環(huán)境中，只要機器人移動并且該運動由傳感器測量，不確定的建模錯誤和傳感器噪聲是不可避免的。處理這些不確定性的常用方法是在控制器中設(shè)計魯棒性。通過對建模方法和魯棒控制器設(shè)計的許多討論，基于模型的方法在創(chuàng)造機器人方面取得了巨大成功，這些機器人在穩(wěn)定環(huán)境中快速準確的重復性任務(wù)中具有優(yōu)于人類的能力，例如工業(yè)機器人。

圖1.常規(guī)方法：一切都經(jīng)過建模，控制器設(shè)計為適合模型。建模誤差和測量噪聲等不確定性由控制器的魯棒性處理。

所需的控制系統(tǒng)：控制回路中存在更高水平的不確定性，例如上下文和與人類通信方面的行為目標。在這種情況下，機器人控制需要認知系統(tǒng)。

然而，隨著機器人的應(yīng)用變得更加多樣化，僅通過控制器的魯棒性來處理不確定性變得越來越困難。特別是在日常生活中，機器人面臨的不確定性與工廠中的不確定性有質(zhì)的不同，例如環(huán)境總是在變化或行為目標只能在上下文中設(shè)置的情況。與人類的互動，包括使用模棱兩可的表達進行交流，也是日常生活中重要的不確定性。這些類型的不確定性無法通過控制器的傳統(tǒng)魯棒性來處理。在這個階段，我們清楚地認識到，機器人需要的認知功能超出了傳統(tǒng)的魯棒性。

在圓桌討論中，除了高度的不確定性外，我們還認為連續(xù)控制是機器人認知系統(tǒng)的另一個重要特征。為了使機器人成為日常生活中的伙伴，它必須在不停止控制的情況下以適當?shù)姆绞焦芾聿淮_定性，即使這種不確定性是一個全新的不確定性。

圖1（b）中描述的這兩點可能是認知機器人的關(guān)鍵問題。換句話說，通過機器人身體-環(huán)境相互作用在線克服新不確定性的能力將認知機器人與其他領(lǐng)域的認知系統(tǒng)區(qū)分開來。

在不確定的情況下進行持續(xù)控制的關(guān)鍵問題是什么？在圓桌會議上，提出了關(guān)鍵問題的幾個重要因素，即概括、主動感知、預(yù)測和語言交流。在這篇綜述論文中，我們討論了這些主題，重點是具有不確定性的連續(xù)控制。如上所述，在現(xiàn)實世界中建立這些功能而不停止機器人控制的方法，是認知機器人的關(guān)鍵問題。

本文的討論從這個角度回顧了認知機器人的各種系統(tǒng)，并推導出了認知機器人研究的未來方向?；跈C器學習的人工智能也是認知機器人的重要工具。如何在連續(xù)控制中使用各種類型的工具也是討論的重要目標。

在第2章節(jié)中，我們首先討論了環(huán)境信息泛化的重要性和與之相關(guān)的問題，并推導出了使用泛化信息的重要方法。我們還討論了主動感知在信息泛化中的作用。在第3章節(jié)中，我們展示了在與人類生活在同一環(huán)境中時，預(yù)測對機器人的重要性，超越了傳統(tǒng)的基于動力學的預(yù)測。在第4章節(jié)中，我們加深了對人類和機器人之間語言交流創(chuàng)造的可能性的討論。在第5章節(jié)中，我們通過展示為認知機器人問題建立共同目標的重要性來結(jié)束本文。

2. 對環(huán)境的理解

2.1信息泛化對認知機器人的重要性

當環(huán)境變得復雜時，機器人應(yīng)該如何處理環(huán)境信息？“環(huán)境的復雜性創(chuàng)造了行為的復雜性”的概念，正如包容架構(gòu)所代表的那樣，其中各種反應(yīng)行為是先驗設(shè)計的，具有許多含義。然而，作為另一種重要的方法，許多認知機器人研究人員會同意這樣一種觀點，即環(huán)境信息的泛化是機器人了解環(huán)境并在復雜環(huán)境中移動的重要解決方案。此外，當環(huán)境的復雜性包括行為目標和與人類溝通的模糊性時，環(huán)境信息的泛化對于機器人是必要的。因此，在本節(jié)中，我們將總結(jié)幾種信息泛化方法，以了解環(huán)境并討論復雜環(huán)境中機器人控制的適當功能。

2.2環(huán)境理解標簽

周圍環(huán)境的分類標記是了解環(huán)境的重要的第一步。已經(jīng)討論了幾種用機器人標記環(huán)境的方法。Nishihara等人通過機器人與人之間的交互，成功地將圖2所示的500多個物體與約100個單詞分類對應(yīng)。本研究基于這樣一種觀點，即對象類別可以通過對象多模態(tài)特征的共現(xiàn)關(guān)系在無監(jiān)督的情況下學習。換句話說，通過聚類多模態(tài)特征，可以提取可以表示類別的主要特征，并丟棄不相關(guān)的特征。

圖2.實驗中使用的物體和機器人。左圖顯示了 500 個對象。機器人顯示在右上角。右下角顯示了實驗中使用的人工標記類別。

這個結(jié)果可以說是實現(xiàn)了泛化。此外，人類給出的語言信息也是形成范疇的重要線索。但是，由于機器人事先不具備詞典等語言知識，因此無法立即使用該語言知識。機器人需要對人類的話語進行分割，并學習存在哪些語音模式來獲取單詞。作者解決了在學習這個詞的同時找到它們之間的聯(lián)系的問題，同時從對象中獲得的多模態(tài)特征。這模仿了一個完全無法理解單詞含義的嬰兒通過與父母的互動逐漸從統(tǒng)計學上學習物體名稱的過程。此外，Miyazawa等人將這一想法擴展到機器人動作學習。這表明機器人可以概括物體，它們的名稱和動作，并同時將它們相互聯(lián)系。

2.3認知機器人對環(huán)境的敏感性和不敏感性

在環(huán)境信息泛化的過程中，計算需要對小的環(huán)境變化“不敏感”。例如，圖2中的泰迪熊需要標記為“泰迪熊”，即使發(fā)生微小的變化，例如變得輕微破碎或變臟。對微小變化不敏感的能力對于穩(wěn)定地理解環(huán)境至關(guān)重要。

然而，以穩(wěn)定的方式了解環(huán)境并不總是一個優(yōu)勢。穩(wěn)定的理解可能會減少機器人行為的多樣性，以應(yīng)對環(huán)境的復雜性。這一事實意味著，如果機器人只使用廣義信息，機器人的行為將變得統(tǒng)一，缺乏適應(yīng)環(huán)境變化的能力。因此，控制器需要對環(huán)境具有高靈敏度和低靈敏度。

人們已經(jīng)提出了幾種平衡穩(wěn)定理解和反應(yīng)行為控制的方法。Solak等人提出了一種強大的兼容控制器，通過將用于廣義運動的動態(tài)運動基元與虛擬Spring框架相結(jié)合，用于機器人指尖上測量的接觸力的實時反饋，從而實現(xiàn)靈巧的手部操作。他們在實驗上成功地完成了未知物體的手部平移和旋轉(zhuǎn)，如圖3所示。Choi等人通過組合反應(yīng)運動控制器和目標姿勢設(shè)置控制器來討論對象處理問題。這種方法考慮了現(xiàn)實的傳感器模態(tài)，每個控制器在日常生活中具有合理的延遲，以創(chuàng)建適當?shù)男袨?，從而?chuàng)建靈巧的處理運動。

圖3.人類用戶正在教授對特定對象的手動操作操作。然后，機器人可以將學習到的動作推廣到不同的物體上，例如更小或更大的物體。

最近，深度強化學習已被用于學習使用靈巧的機器人手操作魔方。雖然令人印象深刻的是，看到有趣的策略（例如手指步態(tài)，多指協(xié)調(diào)，受控使用重力）如何自然地出現(xiàn)在機器人行為中以解決任務(wù)，但這種方法需要收集大量標注數(shù)據(jù)，并且機器人不需要在操縱物體時用手指握住物體以對抗重力（即魔方的立方體放在機器人手掌的頂部）。有趣的是，強化學習過程與基于觸覺反饋的低級反應(yīng)控制器相結(jié)合，允許學習更復雜的手操作任務(wù)，同時最大限度地減少學習過程中的失敗量。然而，這些工作都沒有表現(xiàn)出對操縱不同對象的泛化。有的研究工作通過使用連接到指尖的虛擬參考框架來表示對象運動，從而實現(xiàn)對新對象的泛化，該框架基于虛擬Spring框架。通過使用此描述，從使用動態(tài)運動基元的人類演示中學習手部操作操作，然后使用兼容的反應(yīng)式控制器執(zhí)行，該控制器使用機器人指尖上測量的接觸力的反饋。報告的實驗表明，機器人可以在不同的物體上執(zhí)行學習的手部運動（例如任意平移和旋轉(zhuǎn)），如圖3所示。

廣義信息和反應(yīng)控制的組合不僅在手部操作中有用，而且在移動控制中也很有用。Okajima等人提出了雙足行走控制，使用廣義行為目標和通過隱性學習進行反應(yīng)行為調(diào)整，這是一種基于行為的適應(yīng)架構(gòu)。他們通過改變代表運動意圖的簡單信號，成功地改變了行走方向。單個控制系統(tǒng)中不同頻率的控制回路有助于平衡穩(wěn)定性和對環(huán)境信息的反應(yīng)性。Miyazaki等人展示了雙足行走控制的穩(wěn)定性，將其分為兩種模式進行奇異擾動分析。他們討論了慢速模式子系統(tǒng)中重心的運動作為全局運動因子，而每個關(guān)節(jié)運動都在快速模式子系統(tǒng)中處理。Taniguchi和Nagai等人證明，移動機器人可以為了購物而四處移動，同時對商店中的物體進行符號化。

這些研究結(jié)果表明，通過概括環(huán)境信息來穩(wěn)定理解的一個重要優(yōu)勢是，在連續(xù)控制回路中自主設(shè)定行為目標，同時利用反應(yīng)運動來適應(yīng)復雜的環(huán)境變化。同時使用對環(huán)境變化敏感和不敏感的這兩種功能，對于適應(yīng)環(huán)境變化和利用廣義信息了解環(huán)境，可能會變得更加主流。

2.4有效認知的主動感知

要實現(xiàn)信息的泛化、信息的選擇，即使用哪些信息，丟棄哪些信息，也是一個重要問題。當我們考慮人類的感官時，我們不僅對環(huán)境變化不敏感，而且為了泛化的目的，我們也無意識地忽略了一些環(huán)境信息。在圓桌討論中，我們提出了“何時停止感知并開始行動？”的問題，并討論了在復雜環(huán)境中需要傳感和行動啟動的結(jié)合才能產(chǎn)生適當?shù)膫鞲小Ｔ诖吮尘跋?，Dimitri Ognibene教授提到了主動傳感的重要性。他指出了對任何非平凡環(huán)境的直接和完全感知的局限性，因為即使我們成功地創(chuàng)建了組織良好的信息泛化系統(tǒng)，傳感器中從環(huán)境中流動的數(shù)據(jù)量也很大。同時，感官限制，如遮擋、分辨率有限、信噪比等，即使使用最先進的傳感器和算法，也阻礙了對環(huán)境的感知。

通過將控制擴展到機器人自己的傳感器，主動視覺代表了一種受生物啟發(fā)的策略，用于應(yīng)對感官限制。引導傳感器使機器人對環(huán)境的相關(guān)部分變得敏感，這些部分可能在那一刻之前一直無法進入，同時對在改變感官配置后變得無法進入的不相關(guān)部分變得不敏感，例如離開視野。

然后，主動視覺可以被看作是前面討論的敏感性和不敏感性之間相互作用的物理體現(xiàn)。通過將這種復雜相互作用的部分計算實現(xiàn)轉(zhuǎn)移到物理層面，主動視覺可以具有這樣的優(yōu)勢，以至于進化似乎已經(jīng)將其蝕刻到人眼的解剖結(jié)構(gòu)中。事實上，眼睛具有高分辨率區(qū)域（中央凹），可最大限度地提高對相關(guān)信息的敏感性，而低分辨率外圍區(qū)域有助于引導中央凹。人類的眼控也反映了敏感性和不敏感性的情境優(yōu)化：事實上，人類在執(zhí)行不同的任務(wù)時遵循不同的感知策略，并“按需”訪問與任務(wù)當前狀態(tài)最相關(guān)的信息。

然而，這種計算簡化只是主動感知系統(tǒng)的補充優(yōu)勢，它解決了在不可避免的感官限制下最小化不確定性的必要性。雖然在一些相對簡單的環(huán)境中，有用的主動感知策略甚至可以通過反應(yīng)式控制器來實現(xiàn)，即直接的傳感器-動作映射，但在一般情況下，主動感知可能需要表示和計算，比典型機器人控制任務(wù)中通常發(fā)現(xiàn)的那些更復雜。這是由于需要積累在下一個時間步長可能無法訪問的有用信息，并預(yù)測下一個信息量最大的操作，所有這些都可能很難計算。考慮到其計算和表征需求以及它在非平凡環(huán)境中使用機器人的關(guān)鍵作用，主動感知可能是開發(fā)“認知”機器人的主要原因之一。

“決定何時停止感知并開始行動"，或者換句話說，在收集更多信息或積極地執(zhí)行當前最佳行動之間的權(quán)衡，著名的探索-開發(fā)困境的表述，是主動感知的一個重要方面。在考慮社交互動和學習時，這一方面變得更加重要，這是認知機器人應(yīng)用的兩個核心要求。

另一個挑戰(zhàn)來自在主動感知條件下的學習。最近，已經(jīng)提出了幾種在具有逼真刺激的模擬環(huán)境中學習主動感知技能的方法。然而，這些方法通常允許幾種類型的簡化，使得如何在現(xiàn)實環(huán)境中學習新的主動感知技能仍然是一個懸而未決的問題。事實上，學習克服感官限制已被證明會帶來幾個理論問題。然而，一些實驗結(jié)果表明，注意力和主動感知都可以利用它們對不相關(guān)的刺激不敏感的能力，在很大程度上加快學習并改善泛化。

2.5認知機器人信息處理的未來方向

正如Doyle教授所指出的，生物控制系統(tǒng)可以用蝴蝶結(jié)結(jié)構(gòu)來表示，其中環(huán)境輸入信號的維數(shù)先降低，然后使用低維信號進行幾個信號處理，然后再次將信號帶回更高的維度，以實現(xiàn)復雜環(huán)境中的自適應(yīng)電機控制。在生物控制系統(tǒng)中，似乎不同水平的廣義信號被用于不同的目的，從較高的大腦功能（如行為目標設(shè)定，決策制定）到低級行為控制（如力量控制，運動技能調(diào)整和傳感器集成）。生物系統(tǒng)可以使用這些功能克服連續(xù)控制中的新不確定性。雖然生物學方法不是唯一的解決方案，但它絕對是我們應(yīng)該學習的方法。我們需要加快討論如何觀察和分析信號，以便在了解復雜環(huán)境的情況下進行更具適應(yīng)性和穩(wěn)定性的行為控制。

3. 行為預(yù)測

3.1認知機器人的適當預(yù)測

機器人能夠很好地使用廣義信息的最重要好處之一可能是對未來事件的預(yù)測。TC-CoRo的創(chuàng)始首席主席Sandini教授為認知機器人提出了“超越實時”的概念，這表明超越實時響應(yīng)對未來事件的預(yù)測的能力對于未來的認知機器人技術(shù)至關(guān)重要。他表示，這種能力有望導致認知安全的概念，如果機器人能夠預(yù)測人類將要做什么或想要做什么，那么人類和機器人就可以高度安全地生活在同一空間中。

機器人如何在了解環(huán)境的同時，在連續(xù)控制回路中做出預(yù)測？與數(shù)據(jù)科學中的預(yù)測有什么關(guān)鍵區(qū)別？機器人預(yù)測的最重要特征是環(huán)境和場景被視為動態(tài)。這與具身認知的概念密切相關(guān)，其中機器人的身體，運動和與環(huán)境的相互作用在認知中起著重要作用。然而，如果機器人作為我們的伙伴變得更加活躍，“動態(tài)”需要具有更像人類的含義，而不是簡單地說它們有身體或運動。

3.2認知機器人預(yù)測的重要動力學

對于類似人類的認知來說，外部環(huán)境的重要動力之一是物體含義的變化?？捎眯缘母拍?，即環(huán)境賦予我們物體的意義的概念，是這個范圍內(nèi)環(huán)境動力學的關(guān)鍵概念。就機器人控制中可用性的重要性而言，Lorenzo Jamone教授的論文激發(fā)了機器人學領(lǐng)域的幾項工作。因此，即使我們在這里沒有深入研究，我們也希望機器人可以做出預(yù)測，例如，當機器人控制器中很好地實現(xiàn)可用性時，“他將坐在這張桌子上”。

另一個重要類型的認知動力可能是機器人根據(jù)情況的內(nèi)部狀態(tài)以及對外部環(huán)境的解釋。在圓桌會議上，Alessandra Sciutti博士提出了關(guān)于“具身傳播”重要性的問題。人類在其他代理中無意識地執(zhí)行和處理各種運動。例如，當人們環(huán)顧四周時，他們的眼睛會立即揭示他們視覺注意力的焦點在哪里，并且很容易預(yù)測他們最有可能從凝視分析中獲取哪個物體。人類理解內(nèi)隱信號能力的其他例子包括：從面部表情、聲音甚至身體動作的細微變化中識別出某人的情緒狀態(tài)的可能性，或者從瞳孔大小的變化中推斷出他們的注意力激發(fā)。這些類型的預(yù)測是由所有人類共享的運動規(guī)律促成的。隱式信號對于交互非常重要，因為它們代表了“緊急協(xié)調(diào)”的骨干：相互適應(yīng)、同步和預(yù)期，這些信號在沒有意識的情況下發(fā)生，并大大減少了認知負荷和交互延遲。

這些具體通信的重要性最近在認知科學和神經(jīng)科學中得到了認可，而且在機器人和人工智能中也得到了認可。機器人認知需要允許理解人類伙伴的運動，以便能夠預(yù)測他們的意圖。此外，機器人需要能夠計劃傳輸類似信號的運動，以使機器人的動作直觀可解釋和清晰，以促進與人類的有效協(xié)作（圖4）。

眾所周知，這些行為不僅與情緒密切相關(guān)，而且與大腦的高級功能密切相關(guān)，例如主導感（SoA）和時間感知（TP），近年來這些功能因理解人類的行為而受到關(guān)注，這些內(nèi)部狀態(tài)也是只能在連續(xù)控制系統(tǒng)中討論的概念。

圖4.人機相互理解需要利用各種具體信號的交換和理解。它們通常在人與人之間的互動過程中由大腦下意識地處理，從而實現(xiàn)快速有效的協(xié)作。

雖然目前還不知道人類究竟扮演什么角色，但可以肯定的是，它們強化了導致意識的知和決策的更高級大腦功能。機器人的認知系統(tǒng)有必要具有這樣的功能嗎？雖然SoA在機器人行為中的重要性尚未得到充分討論，但量化機器人SoA的優(yōu)點可以發(fā)展為人機協(xié)作的討論。例如，Ueda等人研究了手術(shù)過程中受試者的協(xié)助量與SoA之間的關(guān)系，以量化自動駕駛系統(tǒng)的適當協(xié)助水平。研究表明，在SoA的感知中也出現(xiàn)了類似于所謂的“神秘谷”的現(xiàn)象。在他們的實驗中，隨著協(xié)助量的增加，SoA增加到一定程度，因為目標對象更按照受試者的意圖移動。然而，當協(xié)助超過一定水平時，受試者開始感到一種失去SoA的不適感。

正如某論文中所描述的，很明顯，人類對機器人的過度支持感到不舒服，盡管機器人對人類的適當支持水平尚未得到澄清。最近，SoA的數(shù)學模型被提出，我們可以說，討論機器人SoA的基礎(chǔ)已經(jīng)奠定。幫助在人類和機器人之間共享適當?shù)腟oA可能是未來的理想愿景之一。

3.3. 超越現(xiàn)實的預(yù)測

Sciutti博士在圓桌會議上介紹了吸引人的短語“超越現(xiàn)實”，建議機器人不應(yīng)該感知世界的本來面目，而應(yīng)該對與人類合作有感知和認知偏見。眾所周知，人類大腦將“真實”的感覺信號轉(zhuǎn)化為我們想要感知的信息，這有時被稱為“擬人化鏡頭”。因此，對行動或環(huán)境的時間和空間屬性的感知可能是不準確的，例如視覺錯覺所證明的那樣。但是，這些流程為協(xié)作帶來了幾個優(yōu)勢。例如，當觀察一個通過的動作時，人類不會檢測到動作的細節(jié)，而是自然地理解動作的特征，例如動作目標，這比良好協(xié)作的細節(jié)更重要。因此，超越現(xiàn)實的概念可以成為上一節(jié)所討論的信息概括的一個重要指標。

4. 語言交流

4.1認知機器人的語言

語言交流是最重要的高階認知功能之一，正如圓桌會議所強調(diào)的那樣。沒有語言交流，我們的社會活動是不可能的，這使我們能夠在沒有詳細定義的情況下使用抽象的表達。這種能力是通過與人的交流來學習的，從嬰兒的反射性語音反應(yīng)和兩個單詞的句子開始，然后自然地發(fā)展語法規(guī)則。令人驚訝的是，根據(jù)我們在嬰兒期如何以及與誰交流，我們可以將任何語言作為我們的母語。因此，機器人必須學習和使用語言才能融入人類社會。

Oseki教授指出，為了構(gòu)建像人一樣處理和學習自然語言的認知機器人，我們應(yīng)該像計算認知科學文獻中倡導的那樣，對人類語言處理和學習進行“逆向工程”。具體而言，在語言的計算認知科學中，語言處理和學習的計算模型是由最初在自然語言處理（NLP）中開發(fā)的符號生成模型和人工神經(jīng)網(wǎng)絡(luò)構(gòu)建而成的，然后根據(jù)在認知和腦科學中實驗測量的人類行為和神經(jīng)成像數(shù)據(jù)進行評估。這里的關(guān)鍵思想是，以科學為導向的“象征主義”方法與以工程為導向的“連接主義”語言處理和學習方法之間的融合對于下一代認知機器人技術(shù)非常重要。

Oseki教授還介紹了最近的研究結(jié)果，這些結(jié)果表明，盡管通過工程評估指標取得了令人印象深刻的表現(xiàn)，但與在較少的訓練數(shù)據(jù)上訓練的較小模型相比，稱為Transformers的較大最先進的模型并不總是“像人”，以及稱為遞歸神經(jīng)網(wǎng)絡(luò)語法（RNNGs）的符號神經(jīng)架構(gòu)優(yōu)于長短期記憶（LSTM）基線，最重要的是，更好地推廣到看不見的語言環(huán)境。對于未來的研究，鑒于語言處理是信息處理的一個實例，最終在人腦中實現(xiàn)信息處理的實例，Marr描述的三個層次中的“硬件實現(xiàn)”水平必須與語言處理和學習的計算認知科學相結(jié)合，以實現(xiàn)計算認知神經(jīng)科學，以便認知機器人在不確定的環(huán)境中與人類進行交流。

圖5.SpCoNavi可以使用空間概念，詞匯表，以無監(jiān)督方式學習的地圖來執(zhí)行路徑規(guī)劃。該理論與基于CaI（作為概率推理的控制）概念的基于模型的強化學習一致。

4.2. 通過語言學習和理解進行認知

語言學習和理解也是機器人應(yīng)該具備的重要認知能力。Taniguchi教授指出了人類語言的作用的重要特征，它區(qū)分了人類的語言交流與其他動物的語言交流。人類的認知不僅適應(yīng)物理環(huán)境，而且適應(yīng)符號學環(huán)境。在認知機器人的許多傳統(tǒng)討論中，術(shù)語“符號”和“符號化”被天真地用于指代與單詞相關(guān)的內(nèi)部表征。該討論受到物理符號系統(tǒng)假說的影響，該假說將符號表征為離散標記。符號學中的特征概念被忽視了。特征統(tǒng)應(yīng)被視為涉及涌現(xiàn)屬性的動態(tài)系統(tǒng)，即符號涌現(xiàn)系統(tǒng)。機器人需要具備適應(yīng)符號出現(xiàn)系統(tǒng)的認知能力，才能與人進行長期交流。這意味著機器人至少需要具備語言學習和理解能力。因此，Taniguchi教授強調(diào)了認知機器人學符號學交流中適應(yīng)性的重要性。

語言基于多模態(tài)信息，集成傳感器-運動信息的認知系統(tǒng)將是語言交流的關(guān)鍵。學習一門語言不僅僅是處理文本數(shù)據(jù)的問題。我們?nèi)祟惱斫庹Z言的含義與現(xiàn)實世界的傳感器運動信息以及我們基于具體的身體體驗和符號學交流形成的廣義概念的關(guān)系。例如，當我們試圖理解一個句子，“請去廚房給我?guī)б黄克辈⑦M行所要求的行為時，我們需要將單詞與特定的對象，地點和行為聯(lián)系起來。這意味著廣泛的語言理解實際上是基于現(xiàn)實世界的多模態(tài)傳感器-電機信息。

因此，開發(fā)綜合認知系統(tǒng)是在認知機器人中實現(xiàn)語言交流的關(guān)鍵一步。Taniguchi教授認為，基于概率生成模型的方法很有希望。Taniguchi等人提出了一種名為SpCoSLAM的多模態(tài)空間概念形成方法，該方法將定位和映射、圖像和語音識別、空間分類和詞匯獲取集成到單個概率生成模型中（圖5）。眾所周知，概率建模和推理是機器學習的一般概念。例如，作為概率推理（CaI）的控制理論表明，強化學習可以被視為概率生成模型上的推理。SpCoNavi是一種基于SpCoSLAM和CaI的導航方法。SpCoNavi表明，在室內(nèi)導航任務(wù)中學習口語和理解句子可以完全基于機器人的傳感器-電機多模態(tài)信息進行。

4.3語言對認知機器人技術(shù)的進一步發(fā)展的重要性

為了取得進一步進展，開發(fā)一個完全適應(yīng)性的綜合認知架構(gòu)不僅在泛化、感知和預(yù)測中至關(guān)重要，而且在語言交流中也非常重要。Taniguchi教授認為，SERKET作為一種可以組成和分解大規(guī)模概率生成模型的框架，對于發(fā)展機器人的未來認知是有用的。開發(fā)全腦概率生成模型是未來的挑戰(zhàn)（圖6）。

圖6.信號系統(tǒng)概況。

5. 認知機器人問題的結(jié)論

本文根據(jù)2020年12月舉行的圓桌會議的討論，回顧了認知機器人面臨的問題。圓桌會議指出，跨學科討論對于認知系統(tǒng)的進一步發(fā)展是必要的，機器人技術(shù)可以在具有不確定性的連續(xù)控制回路中發(fā)揮體現(xiàn)認知功能的作用。在本文中，我們繼續(xù)討論了基于“具有廣義信息的環(huán)境理解”，“主動感知”，“未來事件預(yù)測”和“語言交流”的關(guān)鍵功能的認知機器人的必要系統(tǒng)。

對于環(huán)境理解，我們提到了對環(huán)境投入的高靈敏度和低敏感性對于實現(xiàn)穩(wěn)定理解和對不確定性的適應(yīng)性的重要性。信息泛化是穩(wěn)定理解的重要方法，它將引導指定的功能，如自主行為目標設(shè)定。

在復雜的環(huán)境中，信息泛化可能不足以感知所有信息。機器人應(yīng)通過主動感應(yīng)來選擇重要和有用的信息。除了信息選擇之外，我們還闡明了主動感知對于超越感知的新型學習架構(gòu)非常有用。

預(yù)測未來事件是基于對環(huán)境的理解可以實現(xiàn)的重要功能。盡管眾所周知，基于機體動力學的預(yù)測是機器人控制的重要因素，但更多的類似人類的預(yù)測，有時甚至超越了現(xiàn)實，對于與人類的順利合作是必要的。這些類型的預(yù)測強調(diào)機器人的體現(xiàn)，而不是數(shù)據(jù)科學的預(yù)測，數(shù)據(jù)科學的預(yù)測顯示事件最有可能發(fā)生。

語言交流是未來認知機器人的另一項關(guān)鍵技能。除了信息交換之外，人與機器人之間的語言還需要適應(yīng)符號學交流。我們需要進一步討論語言的計算模型。

雖然身體和環(huán)境之間的物理相互作用總是代表實時事件，但眾所周知，隨著信息逐漸普及，信息處理對不確定性變得更加靈活。這意味著，當控制回路中使用廣義信息時，我們可以在連續(xù)控制期間保持剩余的不確定性。不確定性有時包括時間不確定性，這表明未來事件可能成為超越現(xiàn)實的控制目標。因此，在一個控制回路中使用各種層次的廣義信息，是控制機器人從詳細的運動控制到正常生活活動的必要條件，如圖7所示，我們相信這種類型的控制回路可以成為跨學科討論的大熔爐。

圖7.使用廣義信息的控制回路可以允許時間和語義的不確定性，并且可以處理語言、預(yù)測和可用性，而使用具體信息的控制回路專注于實際運動和動力學。

通過討論，下一代認知機器人的作用越來越清晰。我們?nèi)祟惪梢酝ㄟ^有時條件反射性地做出反應(yīng)，有時使用廣義信息來應(yīng)對不確定性。我們通過使用各種有吸引力的功能來實現(xiàn)這一目標，例如可用性，SoA和語言通信。認知機器人必須體現(xiàn)自己的方法，因為機器人具有不同的身體、不同的計算機制和與人類不同的存儲設(shè)備，而不是針對這些功能本身。

為了實現(xiàn)認知機器人的作用，我們認為為認知機器人研究設(shè)定原始但具體的目標是很重要的。正如引言中提到的，基于現(xiàn)實世界中行為的討論是機器人技術(shù)的一個重要特征。為了鼓勵認知機器人技術(shù)的進一步發(fā)展，我們需要根據(jù)需要設(shè)定具體的行為目標，以解決重要的認知機器人問題。我們將繼續(xù)討論這些目標的設(shè)定，作為認知機器人的一個重大挑戰(zhàn)。

原文鏈接：

https://www.tandfonline.com/doi/full/10.1080/01691864.2021.2011780