您現在的位置是:首頁 > 籃球

瑞典語言銀行:基於閱讀時眼球運動分析的輕度認知障礙檢測

  • 由 讀芯術 發表于 籃球
  • 2021-05-25
簡介我們的研究是以瑞典語而不是西班牙語進行的,在每次試驗中,參與者被要求閱讀了整個段落,而不是單獨的句子,這影響了我們的特徵計算和分類器的選擇

掃視運動怎麼檢查

EMNLP 2017 Long Paper

基於閱讀時眼球運動分析的輕度認知障礙檢測

An analysis of eye-movements during reading for the detection of mild cognitive impairment

瑞典語言銀行

The Swedish Language Bank, Department of Swedish

【摘要】我們採用機器學習法方來對眼球的運動追蹤得到的資訊進行分析來檢測輕度認知障礙,相關認知能力的下降往往使患痴呆症的風險的提升。我們進行了兩組對比試驗(朗讀與默讀),同時對比了兩種結合實驗資料的方法(關聯與合併)。另外,我們為被讀取的詞標註上其被瀏覽的速率和語法類別,並使用這些註釋來生成新的特徵。最終,我們對是否患有輕度認知障礙的辨別準確度達到了86%。

瑞典語言銀行:基於閱讀時眼球運動分析的輕度認知障礙檢測

1 介紹

隨著全球人口老齡化現象的加劇,痴呆症的發病率正在增加(Prince et al。,2013)。術語“痴呆症”是指認知上的非典型和病理學下降,這可能是由多方面潛在原因造成的。儘早檢測痴呆症的發病很重要,原因包括可以讓患者及時接受藥物和治療,改善日常生活質量(如維持適當的營養和衛生),減少獨自行動的風險(例如駕駛汽車),並給個人、家庭和照顧者提供充足的準備時間(Solomon and Murphy, 2005; Ashford et al。,2006; Calza et al。,2015)。

在這項研究中,我們使用眼睛跟蹤資料和機器學習來探索檢測早期微妙的認知障礙跡象的可能性。前人的工作表明奧茲海默症會導致閱讀時人的眼球運動軌跡發生變化(Lueck et al。, 2000; Ferna ndez et al。, 2013; Pereira et al。, 2014; Biondi et al。,2017)。然而,這項研究的參與者並沒有被診斷為痴呆症,而是患有“輕度認知障礙”,這意味著他們開始出現認知衰退的早期跡象,並且發展為痴呆症的風險增加。我們測試比較了在默讀和朗讀兩個狀態下收集到的眼球運動資訊的優缺點,並探索用語言資訊增強眼球跟蹤特徵的想法。

我們首先介紹一些關於認知和語言變化的背景資訊並討論以前關於眼動跟蹤和自然語言處理方法來檢測認知衰退的工作。然後闡述我們的實驗設定、特徵提取和機器學習流程。我們分別以靜默閱讀和大聲朗讀兩種方式展開實驗,並討論我們的結果的總體含義和解釋。最後,我們承認當前工作的侷限性,並提出對未來研究領域的建議。

瑞典語言銀行:基於閱讀時眼球運動分析的輕度認知障礙檢測

2 背景

痴呆分為幾個不同的種類,阿爾茨海默病(AD)是其中最常見的一種。AD通常呈現出與執行認知功能和記憶相關的症狀,但也包括與語義處理有關的特定語言障礙。輕度認知障礙(MCI)在臨床角度可以看作是痴呆的前一個階段,一般發生在痴呆的前幾年。具有MCI的人在幾個認知領域中表現出症狀,其中整體認知能力、情景記憶、感知速度和執行功能最明顯受到影響。然而,患有MCI的病人和健康的控制組對照者之間的臨床表現有很大的重合,這使診斷變得更加複雜和異質。

Taler和Phillips(2008)回顧了關於MCI中的語言障礙和阿爾茨海默病的文獻,發現在AD中看到的語言障礙也存在於MCI中,儘管較少。主要的障礙是位於語言層面上(例如難於為一個照片取名或提出來自特定語義類別的單詞),而沒有關於句法處理問題的明確證據。

患有MCI的人通常在句子理解能力上受損,但也存在很大的個體差異。

以前的研究表明,對時間變數進行分析測量(如反應時間)將提高區分MCI和健康對照的能力,並且在調查MCI中的哪個因素將轉換促使其為轉化為AD提供幫助(Taler 與 Phillips,2008)。用機器學習來對語言資料進行分析從而檢測輕度認知障礙已經展現出越來越多的好處。 Roark et al。 (2011)測量了37名MCI患者和37名健康對照組重述敘述性故事的複雜性和資訊含量。並且能夠使用這些特徵進行分類的AUC達到0。73,或透過對資訊與臨床檢測評分進行組合得到的結果為0。86。T´oth et al。 (2015) 利用聲學特徵(包括髮音率,語速,發音長度,暫停持續時間,暫停次數和猶豫率),區分32位MCI患者和19位健康老年對照組,最佳準確率為80。4%。

其他研究考慮了透過自動分析語言和語言生產來區分痴呆患者與控制組的緊密相關的問題(Thomas et al。,2005; Pakhomov et al。,2010; Guinn and Habash,2012; Meila netal。,2014; Jarroldetal。,2014; Fraser et al。,2016; Rentoumi et al。,2014; Garrard et。,al,2014; Prud‘hommeaux與 Roark,2015; Yancheva et al。,2015)。

相比之下,語言處理和理解的分析中將檢測認知能力衰退為目標則更為少見,可能是因為自動量化更難。 語言處理的經典研究中關於痴呆已經考慮到了聽力(例如,Rochon等人1994; Kempler等人1998; Welland等人2002)和閱讀(例如,Patterson等人1994; Storandt等人1995)兩個方面;這裡我們專注於閱讀作為輸入模式。在閱讀理解過程中,一種較好用於估計閱讀過程中處理需求的方法是人眼跟蹤。已經有大量的文獻來描述閱讀過程中的人眼追蹤,所以我們不再做完整的概括,而只是介紹一些關鍵詞彙和基本概念。

在閱讀時,眼睛將不斷的運動,對文字進行一系列的注視和掃視。當眼睛停留在一個字上的行為叫做注視。這段時間是對輸入的資訊進行處理,並且計劃下一次的眼球運動。注視行為通常持續約200-300ms,出聲閱讀平均注視時間稍長於無聲閱讀(Rayner,1998)。在注視與注視之間,眼睛快速運動稱為掃視。掃視可以包括正向瀏覽文字(前向掃視)或反向移動眼睛(一個迴歸幻想或簡單迴歸)。在英文中掃視一般為6-8個單詞(儘管這取決於語言;例如,Liversedge等(2016)發現芬蘭語的掃視容量最大,而中文的掃視容量最少),約10%到15%的掃視是在回顧。無論閱讀能力強弱的人都會存在回顧(regressions)現象,但閱讀能力較強的人似乎有能力將眼睛準確地引導到困難或者相對迷惑的點,而較弱的讀者則會進行更多的迴歸跟蹤(Murray and Kennedy,1988)。

一個詞是否被注視,被注視多長的時間都受到一些單詞等級和上下文因素的影響。實詞(或內容詞)匯被注視的機率大概為85%,而虛詞(或功能詞)只有35%(Rayner,1998)。有一些證據表明,詞型別的影響可能更細粒化,如Barrett等人的工作(2016)展示了基於眼動跟蹤資訊的詞性標籤的可能性。注視次數和持續時間也受單詞頻率(Raney and Rayner,1995)、語境中的單詞可預測性(Kliegl等,2004)、句子中單詞的位置(Rayner等,2000 )、該詞的情感效價(Scott et al。,2012)和字長(Rayner,1998)的影響。

在分享幾個相同的特徵的同時,無聲閱讀和朗讀被認為在某些方面可能有所不同。兩種閱讀之間的主要區別與大腦中語音和語義表示的訪問有關。在默讀時,對於正交資訊的解碼是否直接對映到語義意義上,或者字母是否被對映到音素,然後與語義意義相關聯已經有很多的討論。透過使用基於先前關於閱讀的研究的計算方法,Harm和Seidenberg(2004)研究了兩條提出的路線,並提出了一種組合模型,其中,語音路徑和直接路徑被同時啟用並基於詞頻和拼音一致性等因素共享工作量。在朗讀期間啟用語義資訊也是一段時間以來的討論和研究。以前認為,在朗讀期間,資訊的語義層次不需要被啟用,而是字母可以直接與音素匹配,然後被表達。然而,計算模型(Coltheart等,2001)和諸如fMRI資料(Graves等人,2010)已經表明,語義處理與朗讀有關,但是程度不同。

以前的工作已經確定了與健康對照相關的認知障礙患者的眼睛運動之間的差異。Lueck等 (2000)報道,AD患者在閱讀時眼睛運動不規律,注視時間延長,更多的回顧掃視。Fern’andez et al(2013)發現,AD患者的固定和迴歸數量增加,並且跳過了比健康對照更多的單詞。 Pereira等 (2014)介紹了在MCI和AD中有關眼睛跟蹤的文獻綜述,並且建議這樣的技術可以預測從MCI到AD的轉換,部分是由於眼睛運動對記憶、視覺和執行過程的早期變化的敏感性。

今年早些時候,Biondi等人在ArXiv發表的一篇文章中(2017)報告,透過眼睛運動追蹤措施來區分AD患者和健康對照者的分類準確率為88。3%。他們記錄了40名健康老年人和20名AD患者的眼睛運動,同時他們閱讀了120個句子。這些句子的可預測性和熟悉度方面各不相同(例如,一些句子是眾所周知的諺語)。每個句子被記錄為單獨的實驗。在將10%的試驗作為異常值排除後,其餘90%的試驗用於訓練深度稀疏自動編碼器,保留10%作為測試資料。 假設一些訓練資料和測試資料來自同一參與者。

在本文中,我們首先旨在重現Biondi(2017)等人的實驗的樣貌,儘管有一些顯著的差異。我們的研究是以瑞典語而不是西班牙語進行的,在每次試驗中,參與者被要求閱讀了整個段落,而不是單獨的句子,這影響了我們的特徵計算和分類器的選擇。此外,我們提供兩種不同的實驗配置(默讀vs朗讀)的比較,並引入新的詞級特徵,將語言資訊與眼球運動跟蹤功能相關聯。此外,從臨床觀點來看,也許最關鍵的區別在於我們的參與者處於認知衰退的較溫和階段,並沒有被診斷為AD。因此,我們的目標是探討這種有希望的方法是否可以用於檢測認知障礙的最早階段。

瑞典語言銀行:基於閱讀時眼球運動分析的輕度認知障礙檢測

3 方法

3。1 參與者

參與者從哥德堡MCI研究招募,這是一項關於輕度認知障礙的大型縱向研究(Wallin等,2016)。哥德堡總體MCI研究由當地倫理委員會審查委員會批准(參考號:L09199,1999; T479-11-11);而目前描述的研究由當地道德委員會2016年第206-16號決定批准。

被納入本研究的參與者必須符合一定的包容和排除標準:參與者必須是瑞典語的母語人士,必須能夠閱讀和了解有關該專案的資訊,並能夠得到同意。參與者不能有與目前的認知障礙無關的閱讀障礙或其他閱讀困難。我們還排除了患有深度抑鬱症,持續濫用藥物,無法用眼鏡或隱性眼鏡校正的眼睛視力不佳的患者和被診斷患有其他嚴重精神疾病,神經系統或腦相關疾病如帕金森病、肌萎縮性側索硬化、腦腫瘤或中風的參與者。三組參與者參加了研究:輕度認知障礙患者(MCI),主觀認知障礙患者(SCI)和健康對照組(HC)。參與者都經過一系列測試,從神經心理學考試到結構評估MRI、血液檢查和腰椎穿刺。該本文分析和比較的組是MCI組和對照組。六名控制參與者和五名MCI參與者排除在目前的分析之外。

MCI(n=27)

HC(n=30)

年齡(年)

70。3(5。8)

68。0(7。5)

教育(年)

14。2(3。6)

13。3(3。7)

性別

13/14

9/21

MMSE

28。2(1。3)

29。6(0。6)

表1 輕度認知障礙(MCI)和健康對照組(HC)參與者,年齡,教育和簡易精神狀態檢查分數(MMSE)以下面格式給出:平均值(標準偏差)。 MMSE是一種輕度狀態的一般測試,最高分為30。

參與者資料見表1 各年齡組別與受教育程度無明顯差異。對照確實具有顯著更高的小型精神狀態檢查(MMSE)評分,平均(p <0。0001)。然而,我們注意到,我們的MCI參與者的平均MMSE評分為28。2(滿分為30),這被認為是“正常”(Grut等,1993)。我們與Biondi等人(2017年)的研究中的AD參與者進行對比,平均MMSE評分為24。2。事實上,這項研究的健康對照參與者的平均MMSE為27。8,與我們的MCI組非常相似。這表明在MCI類別中出現缺陷的微妙性質。

3。2 人眼追蹤實驗

眼睛跟蹤實驗在安靜的實驗室環境中進行。我們使用EyeLink 1000膝上型電腦安上裝單目視覺跟蹤器,並使用頭枕進行頭部穩定。頭部穩定性提高了眼睛可跟蹤效能。取樣率設定為1000Hz。

參與者閱讀了兩個短文,在閱讀後回答關於文字的五個問題。第一個文字是默讀的,而第二個文字是大聲朗讀。這兩個文字都來自國際閱讀速度文字(IReST),它是17種不同語言的文字集合。他們在瑞典語中長達146個字,被開發為用作評估或閱讀能力障礙的評估工具(Trauzettel-Klosinski等,2012)。我們選擇提出完整的段落(而不是單獨的句子)來模擬一個更自然的閱讀任務,要求對從段落到結尾的資訊進行整合和回憶。

在文字中我們定義出感興趣區域(AOI),每個單詞被標記為單獨的AOI。然後相對於預定義的AOI計算眼睛運動,例如跳讀和掃視。在次本分析中不考慮在AOI之外發生的注視。

使用9點校準程式對每個參與者校準眼睛跟蹤器,並在試驗1和試驗2之間進行漂移校正。然而,資料的目視檢查顯示出向下漂移的趨勢,特別是在第二次試驗。這是在兩個作者(K。C。F。和K。L。F。)所同意的程度上手動糾正的。

3。3 特徵

作為我們的基準,我們考慮了Biondi(2017)等人提出的13個特徵,並總結在表2中。在計算平均值和標準偏差之前,持續時間和幅度特徵進行對數轉換(Wotschack,2009)。每次試驗的首次注視被丟棄,分析從第二次注視開始(Holmqvist等,2011)。如Biondi等人(2017年),我們將注視分為4個類別:首次閱讀第一次注視、再次閱讀第一次注視(Biondi等(2017)將這些術語稱為“獨特”的固定,但這個術語可能是模糊的,因此我們在這裡避免了它。)、多重注視(multi—fixation)和重注視(refixations)。這些定義在表2中給出,但為了清楚起見,我們還提供了一個簡單的真值表,總結了表3中四種類型的注視。

凝視持續時間Gaze duration (平均值和標準差):試驗中所有單詞平均的平均和標準偏差,用於固定在一個單詞上的時間長度。

掃視幅度Saccade amplitude (平均值和標準差) :試驗中所有掃視的掃視幅度的平均和標準偏差平均。

注視總量Total fixations(平均值和標準差) :注視的總次數。

總第一次閱讀第一次注視Total first-pass first fixations(平均值和標準差) :在試驗的第一次透過中發生的第一次注視的總數。 也就是說,當第一次注視在給定的單詞上時,首次出現首次注視,並且在文字中稍後發生的任何單詞都沒有注視。

總再次閱讀第一次注視 Total later-pass first fixations(平均值和標準差) :在試驗第一次透過之外發生的第一次注視的總數。 也就是說,當它是給定單詞上的第一次注視時,稍後透過的第一次注視發生,但是在文字中稍後發生的單詞已經有注視。

總多次注視Total multi-fixations(平均值和標準差) : 第一次閱讀注視的單詞的總數,不包括第一次注視。 也就是說,當在首次注視的開始的執行中多次注視單詞時,發生多重注視。

總再次注視Total re-fixations(平均值和標準差) :在第一次閱讀之外的一個詞上的注視的總數,不包括第一次注視。

第一次閱讀第一次注視時間 :First-pass first fixation duration(平均值和標準差) :第一次注視持續時間的平均值和標準偏差。

再次閱讀第一次注視時間:Later-pass first fixation duration(平均值和標準差) :再次閱讀首次注視時間的平均值和標準差。

表2 人眼運動特徵

然後,我們用這些文字中的單詞,即它們的頻率和單詞型別的資訊來增加這些基準特徵。我們首先使用Sparv(https://spraakbanken。gu。se/eng/research/infrastructure/sparv)註釋工具(Borin et al。,2016)對兩個文字進行基本的句法和形態分析。具體來說,每個單詞都被拼寫,並用其詞性(POS)標註。

是否有後續的單詞被瀏覽?

否 是

這個單詞還未被瀏覽

Frist-pass first fixation

初次瀏覽第一次注視

Later-pass first fixation

再次瀏覽第一次注視

這個單詞已經被瀏覽

Multi-fixation

多重注視

Re-fixation

重注視

表3 四種注視型別

我們根據Korp瑞典語言檔案(https://spraakbanken。gu。se/eng/korp-info)的“現代”語言部分,根據每個詞引理的頻率值分配每百萬字的百分比(每百萬字),其中包含107億個詞標記寫作時間(Borin et al。,2012)。這些頻率值被POS消歧。然後,我們將頻率值分為高頻和低頻,閾值為每百萬字20次。透過觀察兩個文字中的單詞的頻率分佈來手動選擇該閾值。我們還將POS標籤分為兩類:實詞和虛詞。實詞定義為名詞、動詞、形容詞和副詞;其他的一切詞都被認為是一個虛詞。

然後,我們在Biondi+字之後定義一個增強的特徵集,其中考慮了這些單詞級註釋。具體來說,我們建立與每個基於韌體的基準特徵相對應的新功能。(原始特徵集還包括掃視幅度,其計算不附加到任何一個特定字。)當原始特徵涉及平均值和標準偏差時,我們計算在低:高頻詞和實虛詞上計算的那些值的比率。舉一個例子,對於“平均凝視持續時間”,我們計算了低頻率詞對高頻詞的平均凝視時間比,以及實詞對虛詞的凝視持續時間比。當原始特徵是原始資料時,我們會計算一個比例。因此,對於“總注視時間”,我們計算發生在低頻字上的總注視比例,以及在實詞上發生的總注視比例。以這種方式,我們定義了22個新特徵來增加原始的Biondi集。

顯然,我們預計這些新特徵可能會相互關聯,因為虛詞也是高頻詞。然而,在我們的方法論中,許多實詞也被標記為高頻,例如bil(英語:car)和potatis(英語:potato)

3。4 分類框架

我們考慮了在WEKA版本3。9。1(Hall et al。,2009)中實現的三種分類演算法:樸素貝葉斯(NB)、支援向量機(SVM)和邏輯迴歸(LR)。考慮到我們小型化的資料集,我們放棄引數最佳化並使用預設引數,即對於LR,我們使用10-8的脊迴歸引數,對於SVM,我們使用第一度多項式核心和1。0的複雜度引數。對於特徵選擇,我們使用NB分類器的包裝方法。 我們使用分析交叉驗證來評估分類器,其中在每次迭代中,將一個數據點作為測試資料進行評估,其餘剩餘的資料用於特徵選擇和分類器訓練。我們報告平均分類精度。對於我們的資料集,大多數類基準是52。6%。

瑞典語言銀行:基於閱讀時眼球運動分析的輕度認知障礙檢測

4 結果

4。1 單一實驗

我們首先單獨考慮每個試驗,因為我們預期,在默讀時(試驗1)與朗讀(試驗2)可能會有不同的眼球運動軌跡。第一次試驗的每個分類器和每個特徵集的結果在表4(a)中給出。使用增強的特徵集在所有情況下都會損害分類的準確性,並且使用樸素貝葉斯分類器和Biondi特徵集可以達到75。4%的最佳精度。

瑞典語言銀行:基於閱讀時眼球運動分析的輕度認知障礙檢測

表4 單獨試驗的分類器精確度

當使用試驗2(表4(b))的資料時,增強特徵集在所有情況下再次導致較低的精度,66。7%的最佳結果由SVM和具有Biondi特徵的貝葉斯分類器組實現的。在每種情況下,我們觀察到與試驗1相比,試驗2的分類精度相同或更差。也就是說,當參與者朗讀時,我們比默讀時更少地提取診斷上有用的資訊。這是有道理的,因為大聲朗讀是一個更為受限制的任務:讀者必須以合理的速度不斷向前推進,以避免故事敘事中的破壞。這限制了眼睛圍繞文字自由移動的機會。此外,在朗讀狀態中,實驗者一旦參加者到達文字的末尾就提出了理解問題,然而在默讀模式中,參與者在自己準備好後才選擇面對問題。

4。2 組合實驗

我們現在檢查是否可以組合來自兩個試驗的資訊來提高分類準確性。我們考慮兩種不同的方法來組合資料:(1)連線每個試驗的特徵向量,(2)計算兩個試驗的特徵,就好像它們只是一次試驗的兩半。第一種方法的優點在於保留兩個實驗範例之間的任何顯著的差異(例如,一個特徵只有在默讀過程中才呈現相關性,這個訊號會很好的保留在資料中)。第二種方法(我們將稱之為混合)的優點在於使用於計算的每個特徵的資料量大大增加一倍,可能導致更準確的估計。

每個組合的結果將在表5中給出。在大多數情況下,單獨使用Biondi功能集能夠實現最佳精度。然而,最高的準確度是86。0%,這發生在使用具有Biondi +字特徵集的樸素貝葉斯分類器的混合配置情況中。在各種情況下,透過資料的混合能夠達到更高的精度。

4。3 分類總結

圖1顯示了每個試驗和特徵集的結果,在三個分類器上進行平均。一般來說,實驗2中訓練的分類器比在試驗1中訓練的分類器效果更差。與兩次試驗相結合的特徵向量相比,單獨使用試驗2資料的準確度更高,但比單獨使用試驗1資料的精度略差。透過合併兩次試驗的資料,取得了最好的效果。使用Biondi功能集在前三種情況下比使用增強功能集更好,但是Biondi +字特徵集導致合併配置的精度略高。

SVM

NB

LR

Biondi

64。9

73。7

68。4

Biondi+word

63。2

73。7

66。7

(a)連鎖實驗

SVM

NB

LR

Biondi

84。2

82。5

78。9

Biondi+word

84。2

86。0

77。2

(b)合併實驗

表5 不同實驗分類器精度

瑞典語言銀行:基於閱讀時眼球運動分析的輕度認知障礙檢測

圖1 每個實驗的平均精度和特徵設定以及分類器的較差平均

然而,並不是所有觀察到的趨勢都具有顯著的意義。雙向方差分析揭示了試驗的顯著效果(p = 5。010-7),但不具有分類精度的特徵。Tukey事後檢驗確定合併試驗的準確度明顯優於試驗1(p =6。810-4),試驗2(p =5。010-7)和連鎖試驗(p =1。210-5)。然而,實驗1和實驗2之間沒有顯著差異,並且其與混合實驗之間也沒有顯著的關係。

4。4 特徵分析

為了確定哪些特徵有助於區分組之間的差異,我們對所有特徵進行了雙尾異方差t檢驗two-tailed heteroscedastic t-test,並透過Bon-ferroni校正進行重複比較。對於這種分析,我們考慮合併試驗的資料,因為它們具有最佳的準確性。發現糾正後組間僅有兩個特徵明顯不同;這些將在表6中給出。與分類結果一致,沒有頻率或字型特徵是顯著的。在對照組中首次第一次閱讀首次注視(first-pass first fixations )的總數明顯較高,但MCI組中再次閱讀首次注視(later-pass first fixations)次數較高。這表明控制組有更大的傾向從頭到尾閱讀文字,而MCI患者更傾向於跳過單詞然後再返回回顧。圖2中是這些不同閱讀模式的一個例子。雖然這個數字僅顯示了兩位參與者的資料,但值得注意的是,默讀實驗(圖2(a)和圖2(c))和朗讀實驗(圖2(b)和圖2(d))有著比較明顯的差異。

瑞典語言銀行:基於閱讀時眼球運動分析的輕度認知障礙檢測

(a)控制組實驗參與者,默讀

瑞典語言銀行:基於閱讀時眼球運動分析的輕度認知障礙檢測

(b)控制組實驗參與者,朗讀

瑞典語言銀行:基於閱讀時眼球運動分析的輕度認知障礙檢測

(c)MCI實驗參與者,默讀

瑞典語言銀行:基於閱讀時眼球運動分析的輕度認知障礙檢測

(d)MCI實驗參與者,朗讀

圖2 認知健康參與者(上)和MCI參與者的眼睛運動示例(底部),他們從靜音(左)和試聽2的文字(右)讀取文字(左)。圖中的每個藍框代表AOI(即文字中的一個單詞); 圈子表示固定線條顯示了眼睛的運動。 圖(a)示出了相對簡單的示例透過文字1的路徑,而圖(c)顯示了一個包含更多的回溯和重讀。

Ferna ndez et al。 (2013年)發現,AD患者的總注視(fixations)次數,一次閱讀注視(first-pass fixations )和二次閱讀注視(second-pass fixations ) 增加。不過,他們指出,二次閱讀注視(second-pass fixations )比一次閱讀注視(first-pass fixations )更顯著。我們的結果與第二次閱讀注視(second-pass fixations)的顯著增加是一致的,但不符合報道的第一次閱讀注視的增加。這種差異的一個潛在原因可能在於“第一次閱讀注視first pass fixations”的定義,在Ferna ndez等人(2013年)被賦予“初讀”的含義中,其中包括一個詞的所有向前注視,而第二次定義則被定義為“重讀”;在這個框架下,我們可以將我們的再次閱讀首次注視定義為第一次閱讀注視。儘管如此,費爾南德斯研究和我們目前的結果都表明了在控制組資料中沒有看到的跳過和反向追尋的模式。

瑞典語言銀行:基於閱讀時眼球運動分析的輕度認知障礙檢測

5 侷限

在這項研究中,像許多涉及臨床資料的研究一樣,我們的樣本相當小。此外,這兩個文字不是特別難以閱讀,也沒有具體包含MCI患者難以閱讀的文字(例如,Patterson等人1994年歸納出的低頻率非正規讀音的詞語)。此外,一些資料必須經過調整,或者在某些情況下,由於校準質量而完全被排除在外。

瑞典語言銀行:基於閱讀時眼球運動分析的輕度認知障礙檢測

6 結論以及未來工作

在這項分析中,我們發現我們可以使用眼動跟蹤資訊來區分MCI患者與健康控制組,精度超過80%,最佳情況下精度高達86%。正如預期的那樣,這比Biondi等人(2017)報道的區分對照組和AD患者的準確性要低一些。但是,這表明眼睛跟蹤可能有望成為檢測早期衰退階段的一種方法。

我們還發現跟蹤眼球運動時,參與者默讀提供了比朗讀更多的診斷資訊。與單獨使用任一試驗相比,從兩個試驗條件合併資料導致分類準確性顯著增加。在合併的資料集中,觀察到特定組之間的初次透過第一遍閱讀首次注視次數(first- pass first fixations )(對照組較高)和再次閱讀首次注視(MCI組較高),建議在文字中有一些雜亂無章和非線性的路徑。

儘管對注視的頻率和語法類別進行標註確實帶來最高的分類精度,但是這種提升還是不夠有顯著的統計學意義,並且沒有一個增廣特徵展示出HC人群和MCI人群的區別。或許這些參與者正處在病理學下降的前期(並且這些文字在語言上太過簡單)導致看不到顯著的進展。又或者這些變數並沒有捕獲到最相關的語言資訊。特別地,這些特徵都非常的粗糙,只是對高頻/低頻詞和虛詞/實詞進行是與否的區分。未來一個研究方向應該是去設計一個更為精密的把語言資訊組合成眼球追蹤模型,特別是要要考慮到上下文的呼應而不是在單一字面上進行操作。

另一個還未開發的資訊來源是適度過程中的聲音訊號。把眼球的運動和聲學資訊結合起來,例如停頓、過濾、猶豫或者單詞錯誤都可能提供一個更加完整的閱讀時認知處理的過程。此外,包含在Biondi研究中的其他眼睛跟蹤特徵可能證明對早期認知障礙更敏感。

在未來的工作中,我們還計劃探討眼球運動與閱讀理解之間的聯絡。本研究的每個參與者也回答了與他們閱讀的段落有關的理解問題。分析不同眼睛運動特徵與反應精確度之間的關係可能有助於我們更好地瞭解健康和認知受損讀者使用的閱讀策略。

最後,未來的工作將在實驗分析中包括主觀認知障礙(SCI)組。這類人群在神經功能測試中得分正常。因此,在臨床症狀出現之前,將其與健康對照區分開來的可靠方法可以幫助提供早期預警系統。

後臺回覆“連結”獲取論文下載連結!!!

Top