如何測量後設認知（metacognition）

#ideas #metacognition #measurement #blog

如何測量後設認知（metacognition）

後設認知的定義

如同前次metacognition the definition所整理，後設認知（metacognition）指的是對於認知歷程的監控歷程，並在臨床領域中進一步的推廣到對於自身以及他人的認知歷程的覺察與評價，同時可以利用這個覺察與評價的結果進一步的調整自己的行為策略。

我們可以看到某些研究的領域中，後設認知著重在於對自身認知歷程的覺察與評價，而某些領域中，強調的是整體的行為能否有效地進行調控。

後設認知的測量方法

目前常見的後設認知測量方法有三種，一種是面談（interview）中由訪談者評分，一種是自陳式的量表，而第三種則是認知測驗以及相關的指標參數的計算。

在我所回顧的文獻當中，認知測驗相關的研究最多，但是也最雜。因為在不同的認知心理學次領域當中針對不同的主題（例如：記憶、學習、知覺…）都各自有不同的實驗派典。也就是說，針對不同的後設認知所要監控或是覺察評價的目標，有不同的作業。而在這些不同的作業當中有共通可以使用的測量方式。我最後再來討論這個。先從面談以及自陳式量表開始。

訪談以及自陳式量表

面談以及自陳式量表的後設認知測量方法系出同門，根據Metacognitive Multi-Function Model (MMFM)，後設認知包含三方面的能力

Understanding one’s own mind
Understanding of others’ mind
Mastery（能夠利用對於個體心理表徵以及心理狀態執行有效策略來完成認知作業或是解決困難的能力）

metacognition assessment scale (MAS)

Semerari等人（2003）根據上述理論架構設計了一個訪談的評分表，三個能力各自有9 ~ 11題不等，每一題都是是非題，由訪談的治療師進行評分。不過當時Semerari等人只有報告了幾名case的資料，並沒有大規模施測的資料。

metacognition self-assessment scale

而根據同樣的理論架構，Pedone等人（2017）發展了Metacognition Self-Assessment Scale，是18題的自陳式5點量表用來測量個體的上述三面向的能力。就其因素分析的結果，作者歸納出四個因素：

self-self-reflexivity (monitoring and integration)
differentiation and decentering
understanding of other's mind (self-other)
regulation and control abilities (mastery)

Pedone等人雖然在一個大型計畫中發展這個量表而有6000多筆的受測者資料，但並沒有進行相關的信效度分析。

後續Faustino等人（2021）將其翻譯為葡萄牙語版本，並進行了194個樣本的信效度研究。結果發現葡萄牙語版的因素結構和原版的因素結構相似，並有良好的內部一致性性度（ $α = .88$ ）以及4週的再測信度。收歛效度良好，但沒有足夠的divergent validity。他們根據受測者自陳的結果將受測者分為一般組以及臨床診斷組（自陳有憂鬱、焦慮、注意力缺失…等相關症狀者），結果發現兩組人在understanding other's mind上沒有顯著差異，其他的分向度以及總分都有差異。

short form Metacognitions questionnaire (MCQ-30)

MCQ-30並非根據上述的MMFM架構而來。但理背後的理論也是認知後設認知是一種自我調節能力（Self-Regulatory Executive Function，S-REF； Wells, 2000; Wells & Matthews, 1994, 1996），而且是針對擔憂（WORRY）所進行的調控。

MCQ原來為65題的自陳式量表（Cartwright-Hatton & Wells, 1997），但是題目太多，要寫太久，後來發展出短版測驗（Wells & Cartwright-Hatton, 2004）。短版測驗為30題的4點李克氏自陳量表，包含有三個因素：

cognitive confidence：對自我認知能力以及行為表現的信心
positive beliefs：認為擔憂能多對自己有正向的幫助
cognitive self-consciousness：對於意識內容或認知歷程的覺察傾向

根據他們（Wells & Cartwright-Hatton, 2004）的研究，MCQ-30有良好的內部一致性、再測信度以及收歛效度。

小結

雖然說後設認知在前述的測量方法中都被視為是能力，但是一個與內在歷程有關的能力要有外在評分者來進行評分（MAS）總是奇怪，而且也缺乏相關的效度研究。要以自陳式量表來測量一個人的後設認知能力本身也有一點矛盾。因為填答自陳式量表這件事情本身就需要後設認知能力，而一個後設認知能力不佳的人的作答結果是會被質疑的，若他自以為自己的後設認知能力良好，仍有可能給出高分的填答結果。要以這些方式來測量一個人的後設認知能力都不太妥當。

認知測驗

許多的認知測驗都可以被用來測量後設認知能力，它們通常是使用2AFC作業派典，強迫參與者在測驗中要做出選擇，接著對於自己的選擇做出信心的評分，然後再以選擇的對錯以及信心的高低之間的關係作為是後設認知能力高低的判斷標準。例如過去很常見到的後設記憶能力的測驗。在經過字詞的記憶過程之後，參與者一次看到一個詞出現，參與者要判斷該詞是否為記憶過的詞（只有是或否兩個選項），接著再對於自己的答案給予信心程度的評分^[1]（例如1 ~ 5分）。而信心程度和判斷正確與否之間的相關即為後設認知能力（對於自己的認知歷程的掌握程度）。

而這個作業表現和信心程度判斷間的相關要怎麼計算就是一門大學問了。過去有幾個不同的計算方式被提出，最早的是 $Γ$ ，但是這個指標在過去的研究中得到的結果並不穩定。後來台大的鄭昭明老師也提出他的c指標，但相關的研究仍少。

有學者從信號偵測理論（signal detection theory）發展出 $m e t a d^{'}$ （Maniscalco & Lau, 2012）。這個方法同時考慮了個體本身作業表現的能力以及反應的偏誤（例如：總是容易給出過高的信心），是很有發展潛力的一個後設認知能力指標的計算方法。後續還有從貝氏模型來發展的計算算則以及迴歸模型的應用， $m e t a d^{'}$ 儼然已成為後設認知研究的新主流。

然而， $m e t a d^{'}$ 畢竟只是個計算指標的方式，後設認知的測量作業在認知心理學當中並沒有一個受過較完整的信效度驗證的測量工具，只有較常被使用作業。而這些作業通常被用來研究固定的主題，例如記憶的後設認知、知覺的後設認知…等。

結論

後設認知是一種對於自己的認知歷程的評價以及掌握的能力，若要測量這個能力要使用自陳式量表或是訪談我覺得都不是好的方法，前者會受到填答者本身的後設能力的影響，後者則可能會受到評分者本身的後設能力影響。使用認知測驗會是一個相較之下較好的作法。雖然在認知測驗當中受測者仍然要給出一個主觀的信心評分也會受到他本身的後設認知影響。然而認知測驗能夠得到一個客觀的行為表現作為一個相對的參照點。計算出來的後設認知指標就成為了一個對於自己能夠做到多好有多少掌握程度的指標，這是完全符合後設認知定義的做法。

如何評分也是一個值得研究的議題，要4點、5點甚至100點？又或者只要分信心高低即可？已有研究者發現在區辨作業中，作業的難度不同的情況底下，使用不同的評分方式，信心程度和作業表現的關係並不一定會達到顯著。另外也有研究者別出心裁，不用信心評分，而是給參與者錢，問他們願意賭多少在他們的答案上（post decision wager PDW），作為另一種信心評分的方式，然而這種作法可能會受到loss aversion的偏誤影響。 ↩︎