123,123

日常生活充滿了選擇。幾十年來，研究人員一直著迷于人類和其他動物如何決定在相互競爭的優(yōu)先事項之間分配時間和精力。心理學(xué)家發(fā)現(xiàn)，大多數(shù)動物會根據(jù)從選項中獲得的獎勵來分配時間，并根據(jù)獎勵反饋相應(yīng)地調(diào)整它們的行為，這是一種稱為“匹配”的行為法則。達(dá)特茅斯領(lǐng)導(dǎo)的研究團隊開發(fā)了衡量獎勵反饋響應(yīng)信息內(nèi)容的指標(biāo)，并使用這些指標(biāo)來預(yù)測匹配行為。結(jié)果發(fā)表在《自然通訊》上。

“匹配是我們?nèi)绾卧诳捎眠x項之間進(jìn)行選擇的基礎(chǔ)，”共同第一作者 Ethan Trepka '22 說，他是達(dá)特茅斯計算和認(rèn)知神經(jīng)科學(xué)實驗室的學(xué)生。“它控制著我們在雜貨店選擇哪條收銀臺，或者我們在不同的學(xué)?；蚬ぷ黜椖可匣ㄙM多少時間。一個人選擇在給定選項上花費多少時間取決于相對于其他選項從該選項中獲得獎勵的頻率。”

達(dá)特茅斯的一個團隊與其他研究人員合作，重新分析了分別在約翰霍普金斯大學(xué)和美國國立衛(wèi)生研究院收集的小鼠和猴子的行為數(shù)據(jù)。在實驗中，老鼠和猴子在兩個選項或行動之間做出選擇，并根據(jù)他們的選擇獲得獎勵——老鼠的水和猴子的蘋果汁。具有更高獎勵概率的選項可能會改變，因此動物在做出選擇時必須跟蹤之前的獎勵。結(jié)果表明，小鼠和猴子都表現(xiàn)出不匹配，一般傾向于選擇比匹配法規(guī)定的更少的更好的選項。

為了預(yù)測這種與匹配法則的偏差，研究人員開發(fā)了一套新的指標(biāo)，用于衡量動物根據(jù)獎勵結(jié)果繼續(xù)或從當(dāng)前選項轉(zhuǎn)換的趨勢中的“驚喜”或不一致。這些指標(biāo)基于“信息論”中的“熵”概念，這是一種數(shù)學(xué)框架，可用于量化系統(tǒng)中的不確定性或意外的數(shù)量。先前關(guān)于選擇行為的研究通常依賴于計算模型，這些模型需要對從每個獎勵反饋中學(xué)到的東西做出假設(shè)，但新的指標(biāo)不需要這樣的假設(shè)。這些指標(biāo)還提供了一種量化自適應(yīng)行為的新方法，可用于改進(jìn)以前的學(xué)習(xí)和決策計算模型。

“當(dāng)我們面臨不同的選擇時，我們會使用之前選擇的結(jié)果來做出未來的決定，這應(yīng)該讓我們在大多數(shù)情況下選擇更好(更有價值)的選擇，”資深作者Alireza Soltani說。，心理和腦科學(xué)副教授，達(dá)特茅斯計算和認(rèn)知神經(jīng)科學(xué)實驗室的首席研究員。“然而，我們并沒有像我們應(yīng)該的那樣經(jīng)常選擇更好的選擇，最終結(jié)果不匹配。雖然選擇劣質(zhì)選項可以在不斷變化的環(huán)境中發(fā)現(xiàn)新的機會，但當(dāng)對劣質(zhì)選項的獎勵反饋被忽視并且反應(yīng)不一致時，匹配不足會顯著增加。由于匹配不足通常會減少可以獲得的總獎勵，因此被認(rèn)為是不可取的。”

標(biāo)簽：

免責(zé)聲明：本文由用戶上傳，與本網(wǎng)站立場無關(guān)。財經(jīng)信息僅供讀者參考，并不構(gòu)成投資建議。投資者據(jù)此操作，風(fēng)險自擔(dān)。如有侵權(quán)請聯(lián)系刪除！

研究人員開發(fā)指標(biāo)來量化動物對獎勵反饋的反應(yīng)信息

猜你喜歡

最新文章