日常生活充滿了選擇。幾十年來(lái),研究人員一直著迷于人類和其他動(dòng)物如何決定在相互競(jìng)爭(zhēng)的優(yōu)先事項(xiàng)之間分配時(shí)間和精力。心理學(xué)家發(fā)現(xiàn),大多數(shù)動(dòng)物會(huì)根據(jù)從選項(xiàng)中獲得的獎(jiǎng)勵(lì)來(lái)分配時(shí)間,并根據(jù)獎(jiǎng)勵(lì)反饋相應(yīng)地調(diào)整它們的行為,這是一種稱為“匹配”的行為法則。達(dá)特茅斯領(lǐng)導(dǎo)的研究團(tuán)隊(duì)開發(fā)了衡量獎(jiǎng)勵(lì)反饋?lái)憫?yīng)信息內(nèi)容的指標(biāo),并使用這些指標(biāo)來(lái)預(yù)測(cè)匹配行為。結(jié)果發(fā)表在《自然通訊》上。
“匹配是我們?nèi)绾卧诳捎眠x項(xiàng)之間進(jìn)行選擇的基礎(chǔ),”共同第一作者 Ethan Trepka '22 說(shuō),他是達(dá)特茅斯計(jì)算和認(rèn)知神經(jīng)科學(xué)實(shí)驗(yàn)室的學(xué)生。“它控制著我們?cè)陔s貨店選擇哪條收銀臺(tái),或者我們?cè)诓煌膶W(xué)?;蚬ぷ黜?xiàng)目上花費(fèi)多少時(shí)間。一個(gè)人選擇在給定選項(xiàng)上花費(fèi)多少時(shí)間取決于相對(duì)于其他選項(xiàng)從該選項(xiàng)中獲得獎(jiǎng)勵(lì)的頻率。”
達(dá)特茅斯的一個(gè)團(tuán)隊(duì)與其他研究人員合作,重新分析了分別在約翰霍普金斯大學(xué)和美國(guó)國(guó)立衛(wèi)生研究院收集的小鼠和猴子的行為數(shù)據(jù)。在實(shí)驗(yàn)中,老鼠和猴子在兩個(gè)選項(xiàng)或行動(dòng)之間做出選擇,并根據(jù)他們的選擇獲得獎(jiǎng)勵(lì)——老鼠的水和猴子的蘋果汁。具有更高獎(jiǎng)勵(lì)概率的選項(xiàng)可能會(huì)改變,因此動(dòng)物在做出選擇時(shí)必須跟蹤之前的獎(jiǎng)勵(lì)。結(jié)果表明,小鼠和猴子都表現(xiàn)出不匹配,一般傾向于選擇比匹配法規(guī)定的更少的更好的選項(xiàng)。
為了預(yù)測(cè)這種與匹配法則的偏差,研究人員開發(fā)了一套新的指標(biāo),用于衡量動(dòng)物根據(jù)獎(jiǎng)勵(lì)結(jié)果繼續(xù)或從當(dāng)前選項(xiàng)轉(zhuǎn)換的趨勢(shì)中的“驚喜”或不一致。這些指標(biāo)基于“信息論”中的“熵”概念,這是一種數(shù)學(xué)框架,可用于量化系統(tǒng)中的不確定性或意外的數(shù)量。先前關(guān)于選擇行為的研究通常依賴于計(jì)算模型,這些模型需要對(duì)從每個(gè)獎(jiǎng)勵(lì)反饋中學(xué)到的東西做出假設(shè),但新的指標(biāo)不需要這樣的假設(shè)。這些指標(biāo)還提供了一種量化自適應(yīng)行為的新方法,可用于改進(jìn)以前的學(xué)習(xí)和決策計(jì)算模型。
“當(dāng)我們面臨不同的選擇時(shí),我們會(huì)使用之前選擇的結(jié)果來(lái)做出未來(lái)的決定,這應(yīng)該讓我們?cè)诖蠖鄶?shù)情況下選擇更好(更有價(jià)值)的選擇,”資深作者Alireza Soltani說(shuō)。,心理和腦科學(xué)副教授,達(dá)特茅斯計(jì)算和認(rèn)知神經(jīng)科學(xué)實(shí)驗(yàn)室的首席研究員。“然而,我們并沒有像我們應(yīng)該的那樣經(jīng)常選擇更好的選擇,最終結(jié)果不匹配。雖然選擇劣質(zhì)選項(xiàng)可以在不斷變化的環(huán)境中發(fā)現(xiàn)新的機(jī)會(huì),但當(dāng)對(duì)劣質(zhì)選項(xiàng)的獎(jiǎng)勵(lì)反饋被忽視并且反應(yīng)不一致時(shí),匹配不足會(huì)顯著增加。由于匹配不足通常會(huì)減少可以獲得的總獎(jiǎng)勵(lì),因此被認(rèn)為是不可取的。”
標(biāo)簽:
免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!