wordpress做社交網(wǎng)站嗎放心網(wǎng)站推廣優(yōu)化咨詢
論文內(nèi)容概述
AI要90分鐘學(xué)會的游戲,人腦細(xì)胞竟在5分鐘搞定了。Cell在2022年的研究中,使用80萬體外神經(jīng)元細(xì)胞(DishBrain)竟然學(xué)會玩70年代經(jīng)典街機(jī)游戲Pong!
- 隨著實驗的進(jìn)行,如果沒有提供電信號反饋,將觀察不到明顯的表現(xiàn)改善;如果完整提供電信號反饋,將看到因為學(xué)習(xí)而得到的表現(xiàn)改善。
- 觀察到的人類神經(jīng)元和老鼠神經(jīng)元均有學(xué)習(xí)能力,并且人類神經(jīng)元的學(xué)習(xí)能力高于老鼠神經(jīng)元。
- 實驗過程中觀察到神經(jīng)元放電活動一直在變化,一開始的游戲表現(xiàn)可能不太好,但隨著實驗的進(jìn)行會越來越好。
基本原理介紹
合成生物智能SBI(Synthetic Biological Intelligence):合成生物學(xué)與人工智能交叉領(lǐng)域,是未來腦科學(xué)發(fā)展一個可能大熱的風(fēng)口,這篇論文屬于SBI領(lǐng)域。
生物神經(jīng)網(wǎng)絡(luò)BNN(Biological Neuronal Network):生物神經(jīng)網(wǎng)絡(luò)基于動物神經(jīng)元發(fā)展,人工神經(jīng)網(wǎng)絡(luò)基于神經(jīng)元數(shù)學(xué)模型發(fā)展,兩者原理上存在較大差異。
生物智能主要分兩方面:體內(nèi)生物智能和體外生物智能。像腦機(jī)接口等等更多像體內(nèi)生物智能,生物神經(jīng)網(wǎng)絡(luò)主要存活在生物體內(nèi);而合成生物智能更多探索體外生物智能,比如這篇文章就是體外培養(yǎng)生物神經(jīng)網(wǎng)絡(luò)來與計算機(jī)系統(tǒng)結(jié)合。
自由能原理(Free Energy Principle, FEP)是由卡爾·弗里斯頓(Karl Friston)提出的理論框架,它試圖解釋生物系統(tǒng)是如何維持其內(nèi)部穩(wěn)態(tài)并預(yù)測外部環(huán)境的。該理論的核心思想是,生物系統(tǒng)通過最小化其預(yù)測誤差(即觀察到的與預(yù)期的狀態(tài)之間的差異)來降低自由能,從而保持生存和繁衍。
自由能的概述
自由能原理認(rèn)為,所有生命系統(tǒng)都在不斷地試圖降低它們的自由能,以保持一種低熵狀態(tài),即維持內(nèi)部穩(wěn)態(tài)。自由能可以被視為一個代理,用來衡量一個系統(tǒng)與它期望狀態(tài)之間的不匹配程度。當(dāng)系統(tǒng)能夠準(zhǔn)確預(yù)測其環(huán)境時,自由能就會降低。如果系統(tǒng)不能準(zhǔn)確預(yù)測,則需要通過學(xué)習(xí)或改變行為來減小預(yù)測誤差,從而降低自由能。
主動推理理論
主動推理(Active Inference)是自由能原理的一個重要組成部分,它關(guān)注的是生物系統(tǒng)如何通過行為來影響其周圍環(huán)境,以最小化預(yù)測誤差。主動推理理論認(rèn)為,生物系統(tǒng)不僅被動地適應(yīng)環(huán)境,而且還通過積極的行為來塑造環(huán)境,以使自身預(yù)測更加準(zhǔn)確。
主動推理觀點
- 預(yù)測編碼:生物系統(tǒng)通過構(gòu)建關(guān)于世界的內(nèi)部模型來進(jìn)行預(yù)測,并根據(jù)這些預(yù)測采取行動。
- 最小化預(yù)測誤差:生物系統(tǒng)通過感知輸入和主動行為來最小化預(yù)測誤差,即觀察到的狀態(tài)與預(yù)測狀態(tài)之間的差異。
- 感知行為的一致性:感知和行為被視為同一過程的不同方面,都是為了最小化自由能。
- 行為選擇:行為的選擇是基于對未來狀態(tài)的預(yù)測來最小化未來自由能的期望值。
主動推理應(yīng)用
主動推理理論已被應(yīng)用于多個領(lǐng)域,包括認(rèn)知科學(xué)、心理學(xué)、神經(jīng)科學(xué)以及人工智能。它為理解生物系統(tǒng)如何進(jìn)行決策、規(guī)劃行為以及如何與環(huán)境互動提供了理論基礎(chǔ)。
- 感知行為一致性:當(dāng)你伸手去拿一個杯子時,你的大腦會根據(jù)過去的經(jīng)歷預(yù)測杯子的位置和重量。如果預(yù)測與實際感受不符(比如杯子比預(yù)期輕),你會調(diào)整握力以減少預(yù)測誤差。
- 決策制定:在面對不確定情境時,生物體會基于其內(nèi)部模型對未來狀態(tài)進(jìn)行預(yù)測,并選擇能夠最大化降低未來自由能的行為路徑。
實驗整體設(shè)計
神經(jīng)細(xì)胞獲取
要想有一個生物神經(jīng)網(wǎng)絡(luò)(BNN)芯片,第一步就是獲取很多的神經(jīng)細(xì)胞,論文里主要使用兩類神經(jīng)細(xì)胞,即人類神經(jīng)細(xì)胞和老鼠神經(jīng)細(xì)胞,那么要怎么獲得呢?
如果想要獲取的是人類的神經(jīng)元細(xì)胞,那么需要從干細(xì)胞開始培養(yǎng),然后刺激干細(xì)胞分化成神經(jīng)細(xì)胞,干細(xì)胞分化成神經(jīng)細(xì)胞之后數(shù)量就會穩(wěn)定了,后續(xù)實驗過程只需要給人類神經(jīng)細(xì)胞提供營養(yǎng)即可,整個神經(jīng)細(xì)胞的制備周期是30天。
如果使用老鼠的神經(jīng)細(xì)胞,那就比較簡單了,沒有道德問題,可以直接培養(yǎng)老鼠胚胎,然后把腦子摘出來,然后直接用就完事了,基本不需要培養(yǎng),制備周期也短了很多。
左圖為人類神經(jīng)細(xì)胞HCC,右圖為老鼠神經(jīng)細(xì)胞MCC。
智能芯片生態(tài)
有了神經(jīng)細(xì)胞之后,下一步就是把神經(jīng)細(xì)胞放到芯片上培養(yǎng),繼續(xù)給神經(jīng)細(xì)胞提供養(yǎng)分。
可以看到,該智能系統(tǒng)有兩個子系統(tǒng):細(xì)胞芯片系統(tǒng)HD-MEA Chip和計算機(jī)系統(tǒng)Pong,兩者通過物理線路進(jìn)行信息傳輸。
信息交互過程
先給出細(xì)胞芯片子系統(tǒng)的平面圖:
在圖片中,神經(jīng)細(xì)胞是均勻分布在芯片上面的,藍(lán)點代表電極,用于神經(jīng)細(xì)胞與計算機(jī)之間交換信息。明顯圖中存在上半,左下,右下三塊電極區(qū)域,上半電極區(qū)域是感知區(qū),用于接收屏幕信息輸出(由此得到小球和平板的位置狀態(tài));左下和右下電極區(qū)域是運(yùn)動區(qū),用于輸出平板移動信息,具體設(shè)置如下:
action1為向上運(yùn)動,action為向下運(yùn)動,左下電極區(qū)域得到一組向上運(yùn)動和向下運(yùn)動的信號,右下電極區(qū)域得到另一組向上運(yùn)動和向下運(yùn)動的信號,兩組數(shù)據(jù)求平均得到最終的運(yùn)動控制信號。
實驗過程分析
學(xué)習(xí)方法的原理特別簡單,就是不停的讓這個生物芯片玩Pong這個游戲,并且在玩的好的時候獎勵它,玩的不好(沒接住球)的時候懲罰他。
當(dāng)BNN犯了一個錯誤的時候,比如沒有接到球的時候,就給他一些無法預(yù)測的電信號懲罰他(可能是隨機(jī)生成);而當(dāng)BNN接住了球的時候,那應(yīng)該獎勵他,就給他一些可以預(yù)測的電信號(可能是固定模式)。
相關(guān)參考資料
https://www.cell.com/neuron/pdfExtended/S0896-6273(22)00806-6
https://zhuanlan.zhihu.com/p/648547119
https://baijiahao.baidu.com/s?id=1746550954055561171&wfr=spider&for=pc