面向康復工程的腦電信號分析和判別模型
背景和意義
大腦是人體中高級神經活動的中樞,擁有着數以億計的神經元,並經過相互鏈接來傳遞和處理人體信息。腦電信號按其產生的方式可分爲誘發腦電信號和自發腦電信號。誘發腦電信號是經過某種外界刺激使大腦產生電位變化從而造成的腦電活動;自發腦電信號是指在沒有外界特殊刺激下,大腦自發產生的腦電活動。算法
(1)誘發腦電信號(P300腦-機接口)
在平常生活中,人的大腦控制着感知、思惟、運動及語言等功能,且之外圍神經爲媒介向身體各部分發出指令。所以,當外圍神經受損或肌肉受損時,大腦發出指令的傳輸通路便會受阻,人體將沒法正常完成大腦指令的輸出,也就失去了與外界交流和控制的能力。研究發現,在外圍神經失去做用的狀況下,人的大腦依舊能夠正常運行,並且其發出指令的部分信息能夠經過一些路徑表徵出來。腦-機接口技術旨在不依賴正常的由外圍神經或肌肉組織組成的輸出通路的通信系統,實現大腦與外部輔助設備之間的交流溝通。
P300事件相關電位是誘發腦電信號的一種,在小几率刺激發生後300毫秒範圍左右出現的一個正向波峯(相對基線來講呈現向上趨勢的波)。因爲個體間的差別性,P300的發生時間也有所不一樣,圖1表示的是在刺激發生後450毫秒左右的P300波形。P300電位做爲一種內源性成分,它不受刺激物理特性影響,與知覺或認知心理活動有關,與注意、記憶、智能等加工過程密切相關。基於P300的腦-機接口優勢是使用者無需經過複雜訓練就能夠得到較高的識別準確率,具備穩定的鎖時性和高時間精度特性。
工具
圖1 P300波形示意圖性能
(2)自發腦電信號(睡眠腦電)
睡眠是身體休整積蓄能量的重要環節,睡眠質量對人的身心狀態也有着重大影響。如何提升睡眠質量,減小睡眠相關疾病對健康的影響,日益受到普遍關注。睡眠過程當中採集的腦電信號,屬於自發型的腦電信號。自發型的睡眠腦電信號可以反映身體狀態的自身變化,也是用來診斷和治療相關疾病的重要依據。
睡眠過程是一個動態變化的複雜過程。在國際睡眠分期的判讀標準R&K中,對睡眠過程當中的不一樣狀態給出了劃分:除去清醒期之外,睡眠週期是由兩種睡眠狀態交替循環,分別是非快速眼動期和快速眼動期;在非快速眼動期中,根據睡眠狀態由淺入深的逐步變化,又進一步分爲睡眠I期,睡眠II期,睡眠III期和睡眠IV期;睡眠III期和睡眠IV期又可合併爲深睡眠期。圖2給出了不一樣睡眠分期對應的腦電信號時序列,自上而下依次爲清醒期、睡眠I期、睡眠II期、深睡眠和快速眼動期。從圖2中能夠觀察到,腦電信號在不一樣睡眠分期所呈現的特色有所不一樣。基於腦電信號進行自動分期,可以減輕專家醫師的人工負擔,也是評估睡眠質量、診斷和治療睡眠相關疾病的重要輔助工具。
學習
(a) 清醒期測試
(b) 睡眠I期spa
© 睡眠II期設計
(d) 深睡眠期接口
(e) 快速眼動期
圖2 各睡眠分期的睡眠腦電信號時序列
事件
課題任務
本賽題包含2個附件(數據文件),四個課題任務。具體說明以下,
附件1:P300腦機接口實驗數據
提供了5個健康成年被試(S1-S5)的P300腦機接口實驗數據,平均年齡爲20歲。在實驗的過程當中,要求每一位被試(被測試者)集中注意力。P300腦機接口實驗的設計以下:每位被試可以觀察到一個由36個字符組成的字符矩陣,如圖3所示,字符矩陣以行或列爲單位(共6行6列)。每輪實驗的設計流程:首先,提示被試注視「目標字符」,例如在圖3的字符矩陣上方,出現的灰色字符「A」;其次,進入字符矩陣的閃爍模式,每次以隨機的順序閃爍字符矩陣的一行或一列,閃爍時長爲80毫秒,間隔爲80毫秒;最後,當全部行和列均閃爍一次後,則結束一輪實驗。在被試注視「目標字符」的過程當中,當目標字符所在行或列閃爍時,腦電信號中會出現P300電位;而當其餘行和列閃爍時,則不會出現P300電位。上述實驗流程爲1輪,共重複5輪。
圖片
圖3 字符矩陣界面
每位被試的P300腦電數據包含有4個文件,具體說明以下,
train_data:訓練用數據;
train_event:訓練數據的事件標籤;
test_data:測試用數據;
test_event:測試數據的事件標籤。
訓練用數據包括12個已知目標字符的數據(char01char12),測試用數據包括10個待識別目標字符的數據(char13char22)。每一個字符矩陣閃爍實驗中,腦電數據表格包含有20列(每列表示1個記錄通道,記錄通道依次進行編號,表1爲記錄通道的標識符,圖5對應了記錄通道的位置),腦電數據表格的行表示樣本點數據,採樣頻率爲250Hz。信號採集設備設置了參考電極和接地電極,即記錄通道的信號爲做用電極與參考電極之間的差值。
表1採集通道的標識符
標識符 通道
名稱 標識符 通道
名稱
1 Fz 11 CP5
2 F3 12 CP6
3 F4 13 Pz
4 Cz 14 P3
5 C3 15 P4
6 C4 16 P7
7 T7 17 P8
8 T8 18 Oz
9 CP3 19 O1
10 CP4 20 O2
圖5 腦電信號採集通道圖
訓練數據中的標籤文件一樣是以子表形式與實驗數據相對應,子表的名稱爲「charXX(Y)」,XX對應相應字符的序列號,Y表示實際的目標字符。子表的內容包含了兩列,第一列表示標籤,第二列爲採樣點序號。每輪實驗的起始標籤爲目標字符對應的標識符(字符矩陣中36個字符的標識符詳見表2,如「101」表示「A」),接下來爲閃爍的行或列的標識符(詳見圖6,如「2」表示第2行,「9」表示第3列),一輪實驗的結束標籤爲「100」。在訓練數據的事件標籤文件中,第一行給出了目標字符的標識符和對應的採樣點序號,接下來是隨機閃爍的行和列的標識符和對應的採樣點序號,每輪實驗以「100」標識符結束,共重複5次;
測試數據中的標籤文件一樣是以子表形式與實驗數據相對應,子表的名稱爲「charXX」,XX對應相應字符的序列號。在測試數據的事件標籤文件中,第一行給出了待識別目標字符的標識符,統一表示爲「666」,須要經過對腦電信號進行分析後,獲得出現P300電位的行和列,並判斷獲得目標字符的識別結果。
表2 字符矩陣的標識符
A 101 B 102 C 103 D 104 E 105 F 106
G 107 H 108 I 109 J 110 K 111 L 112
M 113 N 114 O 115 P 116 Q 117 R 118
S 119 T 120 U 121 V 122 W 123 X 124
Y 125 Z 126 1 127 2 128 3 129 4 130
5 131 6 132 7 133 8 134 9 135 0 136
圖6行/列的標識符
附件2:睡眠腦電數據
提供3000個睡眠腦電特徵樣本及其標籤,取自不一樣的健康成年人整夜睡眠過程。第一列爲「已知標籤」,用數字形式來表示不一樣的睡眠分期:清醒期(6),快速眼動期(5),睡眠I期(4),睡眠II期(3),深睡眠期(2);第二至五列爲從原始時序列中計算獲得的特徵參數,依次包括「Alpha」,「Beta」,「Theta」,「Delta」,分別對應了腦電信號在「8-13Hz」,「14-25Hz」,「4-7Hz」和「0.5-4Hz」頻率範圍內的能量佔比,特徵參數單位爲百分比。
根據以上附件所給出的數據來源和實驗數據,請研究如下問題:
問題一:在腦-機接口系統中既要考慮目標的分類準確率,同時又要保證必定的信息傳輸速率。請根據附件1所給數據,設計或採用一個方法,在儘量使用較少輪次(要求輪次數小於等於5)的測試數據的狀況下,找出附件1中5個被試測試集中的10個待識別目標,並給出具體的分類識別過程,可與幾種方法進行對比,來講明設計方法的合理性。
問題二:因爲採集的原始腦電數據量較大,這樣的信號勢必包含較多的冗餘信息。根據圖5和表1,在20個腦電信號採集通道中,無關或冗餘的通道數據不只會增長系統的複雜度,且影響分類識別的準確率和性能。請分析附件1所給數據,並設計一個通道選擇算法,給出針對每一個被試的、更有利於分類的通道名稱組合(要求通道組合的數量小於20大於等於10,每一個被試所選的通道能夠不相同,具體的通道名稱見圖5和表1)。基於通道選擇的結果,進一步分析對於全部被試都較適用的一組最優通道名稱組合,並給出具體分析過程。爲了方便參賽者對最優通道組合進行選擇,賽題給出了測試數據(char13-char17)的結果,它們的字符分別是:M、F、五、二、I。
問題三:在P300腦-機接口系統中,每每須要花費很長時間獲取有標籤樣原本訓練模型。爲了減小訓練時間,請根據附件1所給數據,選擇適量的樣本做爲有標籤樣本,其他訓練樣本做爲無標籤樣本,在問題二所得一組最優通道組合的基礎上,設計一種學習的方法,並利用問題二的測試數據(char13-char17)檢驗方法的有效性,同時利用所設計的學習方法找出測試集中的其他待識別目標(char18-char22)。
問題四:根據附件2中所給出的特徵樣本,請設計一個睡眠分期預測模型,在儘量少的訓練樣本的基礎上,獲得相對較高的預測準確率,給出訓練數據和測試數據的選取方式和分配比例,說明具體的分類識別過程,並結合分類性能指標對預測的效果進行分析。
思路分析
今年題目簡單
這題無非是, 分類, 關聯分析, 迴歸問題
逐個解決便可, 有些問題其實這幾年的paper已經給出解決方法了
須要的留言