心理學家太難了:大眾弄混了相關和因果,我得背鍋?的頭圖

中国福利彩票北京赛车开奖时间: 心理學家太難了:大眾弄混了相關和因果,我得背鍋?

2019-09-15  |  神經現實 原創 收藏(21)  | 

北京汽车pk10开奖历史 www.shlvat.tw 2019年7月,克里斯托弗·弗格森(Christopher Ferguson)在Quillette發表了一篇關于心理學實驗重復?;奈惱?。心理學作為一門科學在發展過程中浮現出了許多難題,作為理論心理學家,我很欣賞他對一些難題清晰而簡明的討論,包括學術發表偏見,以及媒體對弱影響因素的大肆渲染。我認為,現今有一種不太為人所知的“疾病”正困擾著心理學及相關學科(包括保健科學、家系研究、社會學和教育研究):相關性和因果關系的混淆。而最近的研究表明,“罪魁禍首”并不是一般民眾和媒體,而是科研工作者們本身。

  • 相關性和因果關系

我們可能都聽過“相關性不是因果關系”這樣的老生常談。擔保一個變量“導致”(causes)另一個變量發生變化有三大準則,相關性只是其中第一條。

—Diablo Magazine

為了表明一個變量導致另一個變量發生變化,首先要滿足第一準則,即證明兩個變量是共變的:其一增長,另一變量亦趨向于增長(此為正相關;舉例,在SAT考試中獲得高分的學生在大學里也傾向于獲得相對較高的GPA);其一增長,另一變量趨向于下降(此為負相關;例,更喜歡在工作中和人打交道的學生,不太可能主修計算機科學和物理等無機學科)。

第二大準則為時序優先性:假定原因(The presumed cause)必須先于假定效力出現。例,兒童時期被暴打屁股的人在青少年智商測試中往往得分較低。關于時序優先性的描述往往會引發因果關系的解讀。例如,在打屁股和智商的情境中,有人會理所當然地推斷出被揍“導致”了低智商。要推斷因果關系,時序優先性必要但不充分。正如史蒂芬·平克(Steven Pinker)在《白板》(The Blank Slate)一書中寫道,假如你在睡前定好了兩個鬧鐘,一個鬧鐘6點響,另一個鬧鐘6點15分響,隨著第一個鬧鐘在第二個鬧鐘之前準時叫醒了你,你會明顯感受到系統性共變和時序優先性,但是這并不意味著第一個鬧鐘響“導致”了第二個鬧鐘響。同理,兒童時期被打屁股早于青少年智商測試,但這并不能證明打屁股“導致”低智商。接種疫苗會導致自閉癥是個早已被完全證偽的謠言,這一可憐的信念似乎源于由時序優先性推斷出因果關系的傾向:因為接種疫苗要早于自閉癥癥狀的顯現,人們隨即會錯誤地假設是疫苗“導致”了自閉癥。要是真的按這種邏輯推理,那么在孩子蹣跚學步期間,任何事物都可以是自閉癥的誘因。

第三大準則也是最重要的一條:要推斷因果關系,研究者們必須處理潛在的混雜變量(confounding variables),即能以另外一種方式解釋假定因果聯系的假定原因。以打屁股與智商的研究為例,研究者可以考慮到各種各樣潛在的(且非互斥的)混雜因素:生活壓力大,物質條件貧困可能會導致體罰和認知能力發育遲緩兩種情況;父母的低智商可能會導致體罰和孩子低智商得分;兒童時期的低智商得分可能會導致體罰和青春期的低智商得分,諸如此類......要讓特定原因(如打屁股)成立,必須將原因隔離,然后通過隨機分配施加于其中部分個體(或者說原因的不同層次必須施加于不同群體中的個體)。一般來說,這是通過實驗設計來實現的,實驗設計包括對假定原因的“操縱”,然后對預測中會受到操縱影響的變量進行測量。

沒有倫理研究者會想要隨機分配父母對孩子進行不同程度的體罰,以評估其對兒童智商的獨立影響。但是另外一些關于人類的難題“有望”通過實驗解決。例如,游玩暴力血腥電子游戲會增加玩家攻擊性。研究者要驗證這個假想,他們會在實驗設計中隨機安排被試個體玩一段時間暴力電子游戲,另一組被試會被安排玩差不多刺激,但是非暴力的游戲;在施加了操縱后,研究者會測量被試個體的攻擊性。

—Kata

在受控實驗中——研究者操縱一個具體的原因變量,隨機分配被試經歷操縱變量的不同層次,將其他因素保持恒定,然后客觀地測量操縱的影響——這是文獻撰寫中探究因果關系的“黃金準則”。要注意,一個變量對另一個變量有因果影響并不意味著它“決定”了另一個變量。在暴力電子游戲和攻擊性的例子中,或許有證據表明接觸暴力游戲會讓人在短期內產生攻擊性想法,但是接觸暴力游戲并不能“決定”一個人的暴力程度;這只是影響攻擊性的眾多變量之一。

或許你能明確認識到相關性和因果關系之間的區別。那你是幸運的少數。關于邏輯思維和思維偏見的書籍經常探討將相關性和因果關系混為一談的趨勢,例如基思·斯坦諾維奇(Keith Stanovich)的《超越智商》(What Intelligence Tests Miss)和邁克爾·舍默(Michael Shermer)的《為什么人們會相信怪事》(Why People Believe Weird Things)。

幾年前,我和我的學生發表了一系列研究,證明了無論人們的教育程度如何,把相關性和因果關系混淆的趨勢總是存在的。以其中一項研究為例,我們給社區里的一組成年人閱讀了一則虛構的研究簡介,描述的是一項學生自尊和學業表現的相關性研究,研究中的兩個變量都被測量(觀測)并且兩者都沒有被操縱;對于另一組被試,我們虛構的研究簡介描述了一項對學生自尊進行控制的實驗性研究(即隨機分配一些學生收到促進自尊的訊息,另一些學生則沒有),然后對學生的學習成績進行測量。兩組被試知悉的研究結論都聲稱:該研究揭示了自尊心與學習成績的正相關關系。隨后,我們詢問被試,可以從研究發現中推斷出什么?

自尊會“導致學業的成功”——雖然閱讀了相關性研究的被試不應該推斷出這樣的結論,但是兩組被試得出該結論的比例相同。此外,在閱讀了相關性研究的被試中,無論他們的受教育程度如何,他們做出錯誤因果推斷的可能性相差無幾?。ㄋ潮閭嵋幌?,自尊提高學業成績的推論實際上與最新科學研究相違背,該研究很清楚地表明,即便自尊與學業成功有因果關系,那也是學業成功先于自尊,而不是相反?。?/p>


  • 因果關系的語言

在英語語言中,描述因果關系的方式遠多于描述非因果關系的方式,這也許正彰顯了人類推斷因果關系的偏好。我和同事們仔細閱讀了數百篇心理學期刊文章,發現了超過100個不同的詞匯和短語被用于表示因果關系。如下面的關鍵詞云圖所示,大字體表示其中最常用的。

表示因果關系的關鍵詞云圖   圖片來源:作者提供

語言中可能有成百上千種方式來表示因果關系,這很重要,因為人們確實弄不清語言中真正的“因果關系”,人們也不知道(如前文描述)在何種情境下使用因果關系的語言是恰當的。因此,如果沒有充足證據,就使用因果語言來描述研究結果,讀者很可能無法意識到語言上的細微偏差,從而被誤導而不自知。

學者們一再指責媒體,怪罪其使用因果語言不當。2016年,來自Vox的布萊恩·雷斯尼克(Brian Resnick)向許多著名的心理學家和社會科學家發問:記者在報道科學研究、撰寫文章時犯了什么錯?在得到的答復中,相關性和因果關系的混淆位居榜首。誠然,媒體報道中充斥著不恰當的因果關系推斷。幾乎在任何新聞網站隨便一搜,你都可以看到像這樣的標題《學生飲酒如何影響GPA》、《真誠的微笑有助于長壽》還有《網絡欺凌導致青少年睡眠質量和抑郁癥狀惡化》,記者基于這些測定變量的“非因果”(相關性)研究編寫的如上標題,都屬于因果關系斷言。

—Kata

不過,最近有幾項研究指出,因果關系語言的濫用始于科研工作者自己。例如,在醫學領域,一項大規模的文獻調查表明,有半數以上的相關性研究文章包含了對研究成果的因果解讀。在教育領域,一篇發表在教學期刊上的文獻調查表明,有超過三分之一的相關性研究文章包含了因果關系陳述。在心理學領域,我和我的同事進行了兩項研究,突出表明了該問題的普遍性。首先,我們審閱了一系列隨機的摘要樣本,這些摘要的展示海報已被首屈一指的心理學專業組織——心理科學協會(APS)審核通過,并在其年會上展示。我們很失望地發現,超過一半的摘要在沒有充足證據的情況下使用了因果語言(即,所涉及的研究是相關性的)。當然,海報展示的嚴謹程度要比正式演講或期刊文章低,因此在后續研究中,我們審閱了心理學11家知名期刊中的660篇文章。我們的研究結果重復證明了:半數以上使用了因果語言描述的研究文獻實際上是相關性研究;換句話說,其因果語言的使用是不恰當的。

我把我們的分析報告提交給了心理科學協會旗下的一家雜志,雜志編輯卻退回了我們的投稿,并回復說:人類將相關性與因果關系混為一談的傾向已經眾所周知。行唄,也許這確是眾所周知的偏見,但如果在心理學最熱門的專業會議之一里,這種偏見在其海報展示中泛濫,并且在心理學的知名期刊中同樣普遍,那么很顯然事情就大條了。(應另一家期刊編輯邀請,我們已將此研究成果發表在了他們的期刊上。)


  • 忽略了混雜因素

我們在應對社會中的問題時,混淆了概念并錯誤地從相關性數據中推斷出因果關系,這阻礙了最有效解決方案的制定。例如,考慮到幼兒在早期語言習得和未來學業成績方面的巨大差異。哈特和里斯利(Hart & Risley)1995年的追蹤研究是兒童早期發展和教育中最常被引用的研究之一,該研究表明,在社會經濟狀況較差的家庭中長大的孩子,父母對他們說的話要比社會經濟狀況較好的家庭少得多,并且研究預測認為這些早期的語言經驗差異,會造成孩子未來在詞匯量和學業成績方面的差異。

“父母給子女提供的言語環境是影響子女言語發展的一個關鍵因素”,由于這一因果關系的解讀,催生出許多昂貴的強化課程,這些課程教授并助力父母與孩子之間的言語互動。然而,哈特和里斯利的研究數據是相關性的。即,該研究并沒有控制親子之間言語互動的數量與質量;該研究沒有隨機分配家長提供一種形式的語言體驗,另一些家長提供另一種形式的語言體驗,然后再測定由于操縱導致的兒童發展變化。因為一些相關變量會大大增加來自父母的言語互動和兒童言語能力,要指出早期語言體驗的差異“會導致”兒童詞匯量和學業成績的差異,就必須要消除混雜因素。

共同的遺傳性質也是潛在的混雜因素。社會經濟狀況好的父母比社會經濟狀況差的父母有更高的認知能力,社會經濟狀況和認知能力都是可繼承的(heritable)。因此,對于父母提供的語言體驗質量和兒童的言語能力,基因可能是造成影響的第三個變量。為了驗證這一可能性,行為遺傳學家充分利用“自然實驗”,一些兒童由其親生父母撫養(共享基因和環境條件),一些兒童由養父母撫養(僅共享環境條件)。在典型的家庭中(如哈特和里斯利研究中的家庭),孩子和父母的相似程度如何,在哪些方面共享基因和養育環境?在收養家庭中,孩子和父母的相似程度如何,在哪些方面共享養育環境?

—AD Marcy Atarod

事實上,這些問題的答案在20世紀20年代就有研究,并有無數研究人員在多種情境下重復實驗:在親生家庭中,孩子的詞匯量和言語能力與父母相似;而在收養家庭中并非如此。

其關鍵意義在于,在哈特和里斯利的研究中,父母的言語行為與其子女的言語能力之間存在聯系,但這并不足以推斷出父母的言語行為會“影響”子女的言語能力。

用遺傳學來解釋此種關聯更妥,因為這種關聯只有在父母和孩子有親緣關系的時候才會顯現出來。

換一種說法,研究結果表明,為子女提供高質量語言體驗的父母類型與提供低質量體驗的父母類型存在系統性差異;能從父母那里獲取高質量言語反應的子女,與難以獲取高質量言語反應的子女也存在系統性差異。由于發展心理學家和教育工作者繼續將哈特和里斯利的相關數據,解讀為早期語言經驗對言語能力因果影響的證據,因此他們繼續推進干預措施;如果不承認并考慮到環境及遺傳因素,最終這些干預措施的效果可能會打折扣。

混淆相關性和因果關系可能在另一個領域誤導人們,這個領域就是“微冒犯”(microaggression)。在推廣該術語的文章中,“微冒犯”被定義為“日常言語、行為或環境中簡短和常見的侮辱,無論是有意還是無意的,都會傳達對有色人種的敵意、貶低或負面種族歧視和侮辱?!?/p>

—Kata

這個術語最初是在種族和民族語境下使用的,但現在應用得更廣泛了。一項關鍵的相關性研究發現,如果個體自我報告遭受到“微冒犯”,那么就相對更有可能被心理健康問題侵擾。該研究的數據是“相關性的”,但是卻被人們解讀為因果關系:即,被“微冒犯”導致心理健康問題。正因為如此,單位要求員工進行用語、用詞和行為培訓,以規避所謂的“微冒犯”,現今這種情況在學術界和商界很常見。我并不是說受到“微冒犯”不會對個人健康造成實際損害;這種探究因果關系的方式看似是合理的,但是如果沒有真正的實驗研究對某些個體施加“微冒犯”并另設組對照,隨后對預定的結果進行測量,則因果推斷是“無法成立”的。不然,無異于信口開河。

斯科特·利林菲爾德(Scott Lilienfeld)在文章中呼吁對“微冒犯”進行更為嚴謹的研究,并指出消極情緒性(神經質)的人格特質是一個顯著的混雜因素:消極情緒性的敏感個體特別容易認為自己遭到“微冒犯”,并且消極情緒性的敏感個體更易遭受心理健康問題的侵襲。由于“微冒犯”沒有精確的定義,而是完全根據聽者的解讀來定義的,那么感到“微冒犯”和心理健康問題都有可能與消極情緒性有關。我認為,“微冒犯”導致心理健康問題的因果推斷會讓人做出不當的假設,在這些證據不充分的假設驅動下,杜絕“微冒犯”的研習活動可能會帶來事與愿違的結果,讓敏感個體變得更加敏感。

事實上,在我和同事們去年開展的一項研究中,我們首先告知大學生被試這樣的話語:“人們談天說地,但有時候他們的無意之言會傷害到你”,相比消極情緒性指數較低的學生,消極情緒性指數較高的學生給諸如“你應該跑跑步了(You should take up running)”這樣的含混陳述打上了更高的“有害”評分。正如盧基亞諾夫(Lukianoff)和海德特(Haidt)在《美國人心靈的溺愛》(The Coddling of the American Mind)一書中所主張,關于“微冒犯”的培訓可能無法促進人們恭敬地相互接觸(即便其愿景很美好),卻給人話里挑刺的機會。


  • 心理學界能做得更好

對于由相關性推斷出因果關系的這種傾向,我希望心理學家們能夠攜手克服,就像心理學家回應心理學實驗重復?;鞘幣謊?,自己負起責任來,實施更加嚴謹的研究和數據分析。如何克服這種傾向取決于其出現的起因、方式、時間及對象。心理學家可能和其他人一樣,難以區分相關性和因果關系;如果是這樣的話,我們就需要完善我們的科學培訓,增加更多針對性訓練,以正確表達因果關系、規范證明因果關系。

—Davide Bonazzi

另一種可能性:或許是由于意識形態差異和利己主義偏見,心理學家在審校其他人的研究時可以發覺不當的因果推斷,但卻會在自己的研究中忽略其存在。如果是這樣的話,我們就需要鼓勵質疑的聲音,把相關性和因果關系的矛盾擺到臺面上來,以便對彼此的研究進行建設性的審閱。也可能是科研工作者們故意使用不當的因果語言,讓其研究獲得更多關注?;購?,最近的研究表明,科研人員大可不必如此“操作”,因為新聞機構在挑選科研新聞稿時,使用非因果語言和使用因果性語言的文章被選中的幾率大致相同。

無論如何,這取決于心理學家們是否能把控好彼此,以達到更高標準:(1)及時辨識出因果性陳述;(2)在做出因果性陳述之前,確認研究過程是否滿足三大準則。在科學追求真理的過程中,心理學必須做得更好。

翻譯:郵貍    審校:西子    編輯:語月    封面:Jeff Csatari

特別提示:

對內容感興趣的朋友可以關注公眾號:神經現實。神經現實是一家專注于認知科學、神經科學、精神病學等前沿報道和深度解讀的科學傳播組織。


特別聲明

本文為自媒體、作者等在百度知道日報上傳并發布,僅代表作者觀點,不代表百度知道日報的觀點或立場,知道日報僅提供信息發布平臺。合作及供稿請聯系[email protected]。

為您推薦:

+1 點個贊吧 贊(0)

關注作者

頭像
神經現實
一家專注于神經科學、認知科學、精神病學等知識傳播的公益的科學傳播組織。

知道日報熱門文章

合作及供稿請聯系:[email protected]