來源:博觀科技日期:2023-08-09 14:52:17
前段時間,前特斯拉總監、OpenAI大牛Karpathy的一句話,引起了業內的關注。
在7月初的一次開發者大會上,Karpathy聲稱:“我被自動駕駛分了心,AI智能體才是未來!”并表示將來會全力投入對智能體的研發工作中。
其實,早在2016年,當Karpathy開始在OpenAI工作時,就已經錨定了智能體的方向,只是由于當時的研究方法還不成熟,所以Karpathy才轉去做了自動駕駛。
那么,這所謂的“智能體”究竟是什么?為什么會讓這位AI大牛長久地念念不忘?
何謂智能體
到底什么是智能體?
如果我們將現在的生成式AI,比作一個人的話,那么它只具有了大腦(大語言模型),但卻沒有身體,因此只能躺在服務器上,做一些處理文字、生成圖片的工作。
而智能體,就相當于是大模型的“身體”,有了它,大模型才能在更多的領域施展身手。
那智能體究竟能做什么?
最近,一個名叫Fable的初創公司,發布了一個節目統籌智能體(Showrunner),如同一聲驚雷炸響,讓人們再次見證了智能體的強大。通過這樣的智能體,Fable制作出了一集完全用AI拍攝的《南方公園》!從編劇、動畫、導演、語音、編輯……到劇集制作的全流程,都是由AI完成。
在整個制作環節中,通過自然語言,給不同的智能體分配了各自的目標,人類導演只需要給出一個高層次的構思提示(標題、概要、事件),這些AI智能體就會開始「自導自演」。之后,人類幾乎就不用進行任何干涉了!
在制作過程中,不同的AI智能體,擔任了不同的角色,如演員、導演、剪輯等,它們彼此分工合作,互相配合,最終完成了整部影片的制作。而同樣的,類似的案例,也出現在前段時間清華團隊的研究中。
7月19日,清華團隊用ChatGPT打造了個零人工含量的“游戲公司”——ChatDev,只要你提出想法,從設計到測試的完整流程,都由AI幫忙搞定。
Fable與制作《南方公園》的思路類似,在游戲開發的環節中,ChatDev的十多個智能體也分別擔任了這個“公司”中的策劃、程序員、設計師等不同的崗位。
在項目開始時,人類可以對這些AI提出一個大概的想法或創意。之后,各個智能體之間就會進行一系列討論、制作、測試的環節,整個過程完全不需要人類的參與,全是自動進行的。由此可見,有了智能體之后,大模型就能根據人類給出的規則和策略來做出決策,而不需要人類的干預或指令。
在這個過程中,智能體還會通過習得的經驗或知識,來改善自己的性能和適應性,并根據目標函數或獎勵函數來評估自己的行為。
而這樣的能力,是以往的大模型(LLM)無論如何都不具備的。
因此,LLM即使再聰明,也是一個沒有身體的“大腦”,而正是智能體的出現,讓LLM有了行動的能力,有了自主完成復雜任務的能力。
而這樣的能力,正是LLM下一階段進行在應用層面進行落地的關鍵。
AI智能體需要從神經科學中汲取靈感
就像深度學習早期的發展一樣,AI智能體的發展可能會從神經科學中獲得啟發。
思考AI智能體和神經科學的關系是很有意思的。
尤其是現在很多人都把大語言模型作為AI智能體解決方案的一部分。
但是如何構建一個完整的,擁有人類所有認知能力的數字實體呢?
顯然,我們都認為需要某種潛在的系統來規劃、思考和反思我們在做的事情。
這可能就是神經科學能發揮作用的地方。
舉個例子,海馬體是大腦非常重要的部分。
但是AI智能體中什么東西發揮著海馬體的作用,來存儲記憶,實現標記和檢索等等的這些功能呢?
我們大致已經了解如何構建視覺和聽覺皮層,但還有許多的東西我們并不知道在AI智能體中到底意味著什么。
比如潛意識的所在地——丘腦在AI Agents中又相當于什么呢?
這些都是非常有趣的問題。
我專門帶了一本神經科學方面的書,是有David Eagleman的《大腦與行為》,我發現這本書非常有趣,很有啟發性。
就像早期AI研究在設計神經元時所做的那樣,從神經科學中汲取有趣的靈感,也許是我們應該重新嘗試的方向。
無論是人類智能體還是機器人智能體,它們都以不同的傳感器和執行器來與環境進行交互。
智能傳感器和執行器是主要零件
對于人類智能體而言,我們擁有眼睛、耳朵和其他器官作為傳感器,以及手、腿、聲道等作為執行器。通過眼睛觀察周圍的景象,通過耳朵聆聽聲音,我們能夠感知環境。而通過手和腿的動作,我們可以對環境做出反應和影響。
機器人智能體則通過不同的傳感器來感知環境,例如攝像頭和紅外測距儀。這些傳感器幫助機器人了解周圍的世界。同時,機器人還配備了各種電動機作為執行器,通過這些執行器,機器人能夠對環境進行實際的操作和動作。
除了具有物理實體的智能體外,還存在著軟件智能體。軟件智能體不像機器人那樣有實體存在,它主要通過計算機程序來感知和操作環境。軟件智能體可以接收來自文件內容、網絡數據包和人工輸入(例如鍵盤/鼠標/觸摸屏/語音)的傳感輸入。然后,它通過寫入文件、發送網絡數據包、顯示信息或生成聲音等方式對環境進行操作。
智能體的傳感和執行過程是人工智能的核心,使其能夠在不同領域發揮重要作用。通過傳感器感知環境和通過執行器作用于環境,智能體能夠做出決策和響應,從而實現智能的行為。
總結來說,智能體是通過傳感器感知環境并通過執行器作用于該環境的實體。無論是人類智能體、機器人智能體還是軟件智能體,它們都通過不同的傳感器和執行器與環境進行交互,從而表現出智能的行為。這個簡單而重要的概念是人工智能研究和應用的基石。
鄭州博觀電子科技有限公司是一家提供科技類物聯網開發軟硬件定制化方案服務商、也是中原地區領先的物聯網終端設備解決方案提供商。致力共享換電柜、智能充電樁、共享洗車機、物聯網軟硬件等服務平臺的方案開發與運維??偛课挥诤幽鲜∴嵵菔懈咝聟^,已取得國家高新技術企業認證證書。經過10多年的業務開拓,公司已經形成了以中原地區為中心、業務遍布全國的經營格局。
* 為了您的權益,您的一切信息將被嚴格保密