EEG zeitlich

Wissenschaftliche Berichte Band 12, Artikelnummer: 14378 (2022) Diesen Artikel zitieren

4079 Zugriffe

1 Zitate

3 Altmetrisch

Details zu den Metriken

Immer mehr Studien widmen sich der Identitätserkennung im Elektroenzephalogramm (EEG), da EEG-Signale nicht so leicht gestohlen werden können. Die meisten der bestehenden Studien zur EEG-Personenidentifizierung haben sich nur mit Gehirnsignalen in einem einzigen Zustand befasst, abhängig von spezifischen und sich wiederholenden Sinnesreizen. In Wirklichkeit sind die menschlichen Zustände jedoch vielfältig und verändern sich schnell, was ihre Praktikabilität in realistischen Umgebungen einschränkt. Unter vielen möglichen Lösungen ist der Transformer weit verbreitet und erzielt eine hervorragende Leistung bei der Verarbeitung natürlicher Sprache, was die herausragende Fähigkeit des Aufmerksamkeitsmechanismus zur Modellierung zeitlicher Signale demonstriert. In diesem Artikel schlagen wir einen transformatorbasierten Ansatz für die EEG-Personenidentifizierungsaufgabe vor, der mithilfe eines Selbstaufmerksamkeitsmechanismus Merkmale im zeitlichen und räumlichen Bereich extrahiert. Wir führen eine umfangreiche Studie durch, um die Verallgemeinerungsfähigkeit der vorgeschlagenen Methode in verschiedenen Staaten zu bewerten. Unsere Methode wird mit den fortschrittlichsten EEG-Biometrietechniken verglichen und die Ergebnisse zeigen, dass unsere Methode Ergebnisse auf dem neuesten Stand der Technik erreicht. Insbesondere müssen wir keine Funktionen manuell extrahieren.

In der heutigen globalisierten Informationswelt ist die Sicherheit personenbezogener Daten besonders wichtig geworden1, was zu einem Bedarf an neuen und ausgefeilteren Identifikationstechnologien führt. Obwohl bestehende Identifikationstechnologien im täglichen Leben weit verbreitet sind und eine hohe Genauigkeit erreicht haben, einschließlich Fingerabdruck-, Iris- oder Gesichtserkennung2,3,4 und hohe Erkennungsgenauigkeitsraten erreicht haben. Das Problem bei diesen biometrischen Daten besteht jedoch darin, dass sie leicht gestohlen oder unbeabsichtigt preisgegeben werden können. Die Sicherheit dieser Technologien ist nicht wirksam gewährleistet. Im Vergleich zur oben erwähnten konventionellen Biometrie hat die kognitive Biometrie aus Sicherheitsgründen mehr Forschungsinteresse geweckt.

Im Gegensatz zur herkömmlichen Biometrie, die auf physiologischen oder Verhaltensmerkmalen beruht, handelt es sich bei der kognitiven Biometrie um eine Art Biometrie, die die Aktivität des menschlichen Gehirns misst und analysiert, wie Menschen „denken“5. Es gibt verschiedene Methoden zur Messung der menschlichen Gehirnaktivität, und diese Methoden basieren auf unterschiedlichen Prinzipien, um die Gehirnaktivität widerzuspiegeln. Mithilfe der funktionellen Magnetresonanztomographie (fMRT) wurde die Konzentration von Oxyhämoglobin und Desoxyhämoglobin gemessen, was auf hämodynamische Veränderungen hinweisen kann, die durch neuronale Aktivität verursacht werden. Die Positronen-Emissions-Tomographie (PET) misst den neuronalen Stoffwechsel durch die Injektion einer radioaktiven Substanz in den Körper des Probanden. Nahinfrarotspektroskopie (NIRS) misst die Konzentration von Oxyhämoglobin und Desoxyhämoglobin anhand der Intensität der Reflexion von Infrarotlicht von der Großhirnrinde, um die Gehirnaktivität widerzuspiegeln. Die Magnetenzephalographie (MEG) erfasst das durch Gehirnströme erzeugte Magnetfeld, während die Elektroenzephalographie (EEG) die erzeugten elektrischen Felder erfasst.

Für die Identifizierungsaufgabe haben wir das EEG gewählt. Im Vergleich zu anderen Techniken kann das EEG mit tragbaren und relativ kostengünstigen Geräten erfasst werden6,7. Insbesondere wird häufig die nicht-invasive Gehirn-Computer-Schnittstellentechnologie zur Erfassung von EEG-Signalen eingesetzt, was sicherer und bequemer ist als die invasiven Ansätze. Die Amplitude des EEG-Signals normaler Menschen liegt zwischen 10 und 200 \(\upmu \)V, während die Frequenz normalerweise zwischen 0,5 und 40 Hz variiert. Es hat eine hohe zeitliche Auflösung, normalerweise in der Größenordnung von Millisekunden5. In Bezug auf die räumliche Auflösung weist das EEG aufgrund der Größenbeschränkung des Erfassungsgeräts und der Wechselwirkung der elektrischen Felder zwischen verschiedenen Gehirnregionen eine geringere räumliche Auflösung auf. Dennoch ist es erwähnenswert, dass die individuelle Variabilität die Grundlage für die Identifizierung einer Person ist und das EEG keine Ausnahme darstellt. Einige Studien8,9 haben gezeigt, dass EEG-Signale eine starke individuelle Variabilität aufweisen, insbesondere bei Alphawellen10. Konsistenz ist ein weiterer entscheidender Faktor für die Identifizierung, da diese Biometrie einen Test-Retest erfordert, was bedeutet, dass die Merkmale über Zeit und Ort hinweg stabil invariant bleiben11,12. Auch das EEG-Signal ist äußerst sicher. Dies ist besonders wichtig für die Personenidentifizierung, da zur Personenidentifizierung spezielle Erfassungsgeräte und Verstärker zum Sammeln von Informationen erforderlich sind. Solche personenbezogenen Daten dürfen nicht unbeabsichtigt durchsickern oder aus der Ferne abgerufen werden. Aus Sicht der Datensicherheit ist die EEG-basierte Identifizierung daher zuverlässig, da sie für Kriminelle schwieriger auszunutzen ist. EEG gewährleistet Informationssicherheit durch Emotionserkennung. Die Identifizierung kann nicht ohne Zustimmung des Benutzers durchgeführt werden, da die durch das EEG erkannte Nervosität zu einem Fehler bei der Authentifizierung führen kann. Darüber hinaus ist das EEG-Signal zwar ein internes Merkmal, das nur erzeugt werden kann, wenn das Gehirn aktiv ist, es hat aber natürlich auch die Funktion der Lebenderkennung13. Last but not least sind EEG-Signale universell und EEG-Signale können von jeder Person erfasst werden, es sei denn, eine Pathologie verursacht strukturelle Schäden im Gehirn, die die Produktion von EEG-Signalen verhindern.

Zusammenfassend lässt sich sagen, dass die EEG-Personenidentifizierung vielversprechend für die Anwendung ist. Die meisten aktuellen Forschungsarbeiten untersuchten jedoch nur die Erkennung in einem einzelnen Zustand, was immer noch nicht in der Lage ist, die Genauigkeit und Robustheit der Erkennung zu garantieren. Deshalb haben wir den Aufmerksamkeitsmechanismus angewendet, um ein Netzwerk für Identifikationsaufgaben aufzubauen, und große Fortschritte gemacht. Die Hauptbeiträge dieses Papiers werden im Folgenden beschrieben:

Wir schlagen das auf Transformator-Encoder basierende neuronale Netzwerkmodell ETST, EEG temporal-räumlicher Transformator, vor, das die Informationen von EEG-Signalen über individuelle Unterschiede in Zeit- und Raumdomänen gut extrahieren und die Genauigkeit der Identifizierung auch im Fall von Cross-State gewährleisten kann .

Es werden umfangreiche Experimente durchgeführt und die Ergebnisse zeigen, dass unser Modell alle hochmodernen Modelle übertrifft. Wir untersuchen die Rolle der zeitlichen und räumlichen Informationen von EEG-Signalen bei der Personenidentifikationsaufgabe. Darüber hinaus wird die Auswirkung unterschiedlicher Positionskodierung auf den EEG-Transformator untersucht.

Wir untersuchen die Auswirkung der Stichprobenlänge auf unser transformatorbasiertes Modell und führen eine Datenerweiterungsmethode ein, um die Leistung zu verbessern. Die Methode erhöht die Stichprobengröße, indem sie die Überlappungsrate zwischen den Stichproben im Laufe der Zeit erhöht, und schließlich wird mit der Strategie eine Verbesserung zwischen 1 und 3 % beobachtet.

Die aktuellen EEG-basierten biometrischen Systeme lassen sich grob in zwei Ansätze unterteilen. Die eine besteht darin, zunächst unterscheidbare Merkmale zu extrahieren und dann traditionelle Methoden des maschinellen Lernens zur Klassifizierung zu nutzen, die andere darin, einen End-to-End-Deep-Learning-Ansatz zu verwenden, der sowohl die Merkmalsextraktion als auch die Klassifizierung ermöglicht. Kong et al. Gehen Sie davon aus, dass das aufgabenbezogene EEG in zwei Teile zerlegt werden kann, einschließlich Hintergrund-EEG (BEEG) und Rest-EEG (REEG). BEEG enthält die charakteristischen Merkmale einer Person, während REEG aus aufgabenbedingten EEGs und Geräuschen besteht. Kong nutzte den auf Low-Rank-Matrix-Dekomposition (LRDM) basierenden Identifikationsalgorithmus, um das EEG-Signal zu zerlegen, und verwendete dann den Maximum-Correntropy-Kriterium-Algorithmus (MCC), um die Klassifizierung durchzuführen14. Wang et al. argumentierten, dass die funktionelle Konnektivität des Gehirns die individuelle Spezifität widerspiegelt. Sie berechneten die Konnektivität des EEG-Signals, indem sie Metriken von EEG-Signalen als Merkmalsvektoren berechneten und verwendeten dann ein Diskriminanzmodell basierend auf der Mahalanobis-Distanz, um eine Personenidentifizierung durchzuführen15. Moctezuma et al. übernahm die empirische Moduszerlegung (EMD), um EEG-Signale in einen Satz intrinsischer Modusfunktionen (IMFs) zu zerlegen, wählte anschließend die beiden nächstgelegenen IMFs aus und zerlegte sie in vier Merkmale. Auf diese Weise gibt jeder Kanal acht Funktionen zurück. Schließlich verwendeten sie eine Support Vector Machine (SVM) mit radialer Basisfunktion (RBF) als Klassifikator16. Neben der Verwendung von SVM als Klassifikator haben Alyasseri et al. wendete FPA\(\beta \)-hc an, eine hybride Optimierungstechnik, die auf dem Binary Flower Bestäubungsalgorithmus (FPA) und \(\beta \)-Hill Climbing basiert, um Features zu extrahieren17. Yıldırım et al. konstruierte ein 1D-CNN-Modell, das mit mehreren Schichten gestapelt ist, um tiefgreifende Merkmale von EEG-Signalen über die individuelle Spezifität zu extrahieren18. Wilaiprasitporn et al. versucht, ein Faltungs-Neuronales Netzwerk (CNN) und ein Rekurrentes Neurales Netzwerk (RNN) zu kombinieren, wobei CNN zum Extrahieren räumlicher Merkmale und RNN zum Extrahieren zeitlicher Merkmale verwendet wird19. Özdenizci et al. hat einen kontradiktorischen Inferenzansatz innerhalb einer tiefen Faltungsnetzwerkstruktur ausprobiert, der in der Lage ist, sitzungsinvariante und personendiskriminierende Merkmale zu lernen20.

Derzeit hat Transformer sowohl in den Bereichen Natural Language Processing (NLP) als auch Computer Vision (CV) gute Ergebnisse gezeigt21,22,23. Transformer ist in der Lage, Abhängigkeiten über große Entfernungen zu modellieren und verfügt aufgrund seiner parallelen Recheneigenschaften über eine schnellere Rechengeschwindigkeit im Vergleich zu RNN oder Long Short-Term Memory (LSTM). Daher hat Transformer die Führung im NLP-Bereich übernommen und das Interesse von Forschern geweckt. Die Fähigkeit von Transformer zur Verarbeitung von EEG-Signalen muss jedoch noch von Wissenschaftlern untersucht werden. Arjun et al. ViT, das bei Bildern eine gute Leistung erbringt, wurde direkt auf EEG-Signale migriert. Das EEG-Signal in 1D wurde in der Zeitdimension in verschiedene Patches geschnitten und als Eingabe für das ViT-Modell24 verwendet. Lee et al. kombiniertes EEGNet und Transformator unter Verwendung eines EEGNet-basierten Faltungs-Neuronalen Netzwerks, um die zeitlich-spektral-räumlichen Merkmale zu erhalten25. Tao et al. schlug einen Gated Transformer vor, der eine Kombination aus dem selbstaufmerksamen Mechanismus und dem Gating-Mechanismus in GRU darstellt, um die Informationen von EEG-Signalen in Zeitreihen zu erhalten26. Lied et al. schlugen eine Methode vor, die auf einem gemeinsamen räumlichen Muster (CSP) basiert, um die räumlichen Merkmale der EEG-Signale zu extrahieren, sowie einen Selbstaufmerksamkeitsalgorithmus, um sie zu dekodieren. Mit dieser Methode wird ein State-of-the-Art-Effekt erzielt27. Diese Ansätze zeigen, dass der selbstaufmerksame Mechanismus die Leistung von Brain-Computer-Interface-Systemen (BCI) verbessern kann. Deshalb haben wir unser Modell basierend auf dem Selbstaufmerksamkeitsmechanismus entworfen.

In diesem Artikel schlagen wir ein EEG-Personenidentifikationsmodell vor, das auf dem Aufmerksamkeitsmechanismus21 basiert. Das Gesamtrahmendiagramm ist in Abb. 1 dargestellt. Im Gegensatz zu anderen Modellen erfordert unser Ansatz keine zusätzliche Extraktion künstlicher Merkmale von EEG-Signalen, sondern nur Rohdaten Für die Identifikationsaufgabe werden EEG-Signale genutzt. Unter Berücksichtigung der Tatsache, dass das EEG-Signal sowohl zeitlich kontinuierlich als auch funktionell zwischen den Kanälen verbunden ist, entwerfen wir das Modell so, dass es sowohl zeitliche als auch räumliche Merkmale erfasst. Das Modell besteht aus zwei Hauptteilen, die einen zeitlichen Transformator-Encoder (TTE) und einen räumlichen Transformator-Encoder (STE) enthalten. Im TTE-Teil verwenden wir den Aufmerksamkeitsmechanismus im Zeitbereich, um die Korrelation zwischen Abtastpunkten in Proben zu berechnen, die zum Extrahieren der Zeitbereichsmerkmale des EEG verwendet wird. Da es eine individuelle Spezifität in der Kopplungsbeziehung von Kanälen zwischen Individuen gibt, entwerfen wir den STE-Teil zur Berechnung der räumlichen Domänenaufmerksamkeit für Kanäle, um die Kopplungsbeziehung zwischen verschiedenen Kanalsignalen zu erfassen, was es dem Modell ermöglicht, verschiedene Individuen basierend auf stabiler zu identifizieren spezifische Kopplungsbeziehung. Schließlich wird eine einfache, vollständig verbundene Schicht angewendet, um globale Informationen zu aggregieren und eine Klassifizierung durchzuführen. Im Folgenden erläutern wir die Vorverarbeitung des Roh-EEG und Komponenten des ETST-Modells im Detail.

Die Architektur des ETST-Modells.

Bevor wir Daten in ETST einspeisten, verarbeiteten wir zunächst das Roh-EEG. Das ursprüngliche EEG-Signal wird mit einem [0,5–42] Hz-Bandpassfilter gefiltert, um nieder- und hochfrequente Geräusche zu entfernen. Wir entfernen die Augen- und Muskelartefakte mithilfe der unabhängigen Komponentenanalyse (ICA). Die Größe jeder Stichprobe beträgt T \(\times \) C, wobei T die Anzahl der Stichprobenpunkte und C die Anzahl der EEG-Kanäle ist. Für jede Stichprobe wird im Laufe der Zeit für jeden Kanal die folgende Z-Score-Standardisierung angewendet:

wobei t, c in \(x_{t,c}\) den Abtastpunkt und den Kanal der Stichprobe bezeichnet, \({\overline{x}}_{c}\) den Mittelwert der Stichprobe auf Kanal c bezeichnet und \(\sigma _{c}\) bezeichnet die Standardabweichung der Stichprobe auf Kanal c. Nach der Standardisierung beträgt der Mittelwert der Daten auf jedem Kanal der Probe 0 und die Standardabweichung 1.

Wir nutzen die zeitliche Korrelation oder die Korrelation zwischen zwei Zeitpunkten, um die Zeitbereichsinformationen von EEG-Signalen zu erfassen. Inspiriert durch den Aufmerksamkeitsmechanismus21 verwenden wir mehrere Transformatorblöcke, um die zeitlichen Informationen des EEG zu kodieren. Anstatt sich bei der Faltung auf lokale Informationen zu konzentrieren, berücksichtigt TTE die zeitliche Abhängigkeit von der Ferne. Wir speisen vorverarbeitete EEG-Daten direkt in den Transformator ein, anstatt komplizierte Transformationen wie Faltungen28,29 oder trainierbare lineare Projektionen24 zu verwenden. Für eine gegebene Eingabe \(X=[x^{1},x^{2},\ldots ,x^{T}]\in {\mathbb {R}}^{T\times C}\), wir Berechnen Sie die Selbstaufmerksamkeit im Transformatorblock, um zeitliche Korrelationen abzuschätzen, und gewichten Sie dann die Summe, um die neue Darstellung zu erhalten. Die Selbstaufmerksamkeit wird wie folgt berechnet:

wobei Q, K und V alles Matrizen sind, die durch lineare Projektionen der Eingabe erhalten werden, und \(d_{k}\) ein Skalarfaktor ist. Um gemeinsam auf Informationen aus verschiedenen Repräsentationsunterräumen an verschiedenen Positionen zu achten, übernehmen wir den Mehrkopf-Aufmerksamkeitsmechanismus21 für die Eingabe. Jeder Transformator-Encoder besteht aus zwei Teilen: Multi-Head Attention (MHA) und Multi-Layer Perceptron (MLP). Jeder Teil nutzt Restverbindung30 und Schichtnormalisierung (LN)31, um die Trainingsgeschwindigkeit und Robustheit des Modells zu verbessern. Abbildung 2 veranschaulicht den obigen Berechnungsprozess. Der TTE-Anteil kann ausgedrückt werden durch:

(links) Die Architektur eines Transformator-Encoders. (rechts) Mehrköpfige Aufmerksamkeit.

Die Kanäle im EEG-Signal stellen die Positionen der Elektroden auf der Kopfhaut dar, und die funktionelle Konnektivität zwischen verschiedenen Gehirnregionen kann durch Berücksichtigung der Abhängigkeiten zwischen verschiedenen Kanälen berechnet werden. Ähnlich wie bei TTE nutzten wir auch bei STE den Aufmerksamkeitsmechanismus, um die räumlichen Informationen zwischen verschiedenen Kanälen zu modellieren. Um die räumlichen Standortinformationen beizubehalten, haben wir der Eingabe die Positionskodierung der räumlichen Domäne hinzugefügt und das Ergebnis dann an STE weitergeleitet:

wobei tran() die Transponierungsoperation darstellt und \(E_{pos}\in {\mathbb {R}}^{C\times T}\) die Positionskodierung darstellt. In diesem Artikel verwenden wir die Positionskodierung in Form einer trigonometrischen Funktion an einer festen Position. \(z^{s}_{0}\) bezeichnet die Darstellung mit der Hinzufügung räumlicher Positionsinformationen. Im STE verwenden wir eine ähnliche Struktur wie im TTE, um die räumlichen Informationen auf den verschiedenen Kanälen des EEG zu lernen. Die Prozessgleichung wird ausgedrückt als:

Die Ausgabe der Transformator-Encoder-Schichten TTE und STE liefert eine bessere Darstellung, die sowohl Zeitdomänen- als auch Raumdomänenmerkmale enthält. ETST lernt die Zeitbereichsinformationen der EEG-Daten an den verschiedenen Probenahmepunkten in TTE. Im anschließenden STE lernt ETST die räumlichen Informationen zwischen den Kanälen. Um dann die globalen Informationen in der Darstellung für die Klassifizierung zusammenzuführen, wird eine einfache, vollständig verbundene Schicht mit nur einer Schicht verwendet, um die endgültige Klassifizierungsausgabe zu erhalten, die mithilfe der Kreuzentropieverlustfunktion optimiert wird.

Dabei bezeichnet N die Anzahl der Losgrößen und C die Anzahl der Kategorien. \(y^{c}_{n}\) ist das wahre Hot-Label, \({\hat{y}}^{c}_{n}\) ist die vorhergesagte Wahrscheinlichkeit der entsprechenden Kategorie.

Dieses Papier enthält keine Studien mit menschlichen oder tierischen Teilnehmern, die von einem der Autoren durchgeführt wurden.

Wir validieren unsere Methode anhand eines von PhysioNet32 bereitgestellten EEG-Datensatzes. Dieser Datensatz wurde mit dem BCI2000-System33 aufgezeichnet und besteht aus über 1500 1- und 2-minütigen EEG-Aufzeichnungen von 109 Probanden. Die Abtastfrequenz betrug 160 Hz. Diese EEG-Daten wurden mit 64 Elektroden aufgezeichnet, die dem 10–10-System entsprachen. Die Probanden wurden gebeten, motorische/bildliche Aufgaben zu erledigen, während das EEG-Signal vom System aufgezeichnet wurde. Jeder Proband absolvierte 14 Versuchsdurchläufe, darunter 2 1-minütige Basisdurchläufe und 12 2-minütige Aufgabendurchläufe. In den Basisdurchläufen wurden die EEG-Signale aufgezeichnet, während die Probanden ihre Augen offen (EO) bzw. geschlossen (EC) hielten. In den Aufgabenläufen wurden die Probanden gebeten, vier motorische/bildliche Aufgaben zu erledigen, einschließlich der tatsächlichen Ausführung der entsprechenden physischen Aktion (PHY) oder der Vorstellung, die entsprechende Aktion auszuführen (IMA), wenn das Ziel auf dem Computer erschien, und sich auszuruhen, wenn das Ziel verschwand. Aufgabe 1 besteht darin, die entsprechende Faust zu öffnen und zu ballen, wenn sich ein Ziel auf der linken oder rechten Seite des Computerbildschirms befindet. Aufgabe 2 besteht darin, sich vorzustellen, wie man die entsprechende Faust öffnet und ballt, wenn sich ein Ziel auf der linken oder rechten Seite des Computerbildschirms befindet. Aufgabe 3 besteht darin, beide Fäuste zu öffnen und zu ballen, wenn ein Ziel oben oder unten auf dem Computer erscheint. Aufgabe 4 besteht darin, sich vorzustellen, wie man beide Fäuste öffnet und ballt, wenn oben oder unten am Computer ein Ziel erscheint. Jede Aufgabe wird dreimal wiederholt, sodass insgesamt zwölf Aufgaben ausgeführt werden. In unseren Experimenten verwenden wir alle Probanden im Datensatz. Zur Generierung von Samples wird ein 1-s-Fenster mit 50 % Überlappung jedes Kanals verwendet. Daher beträgt die Form einer Probe 160 \(\times \) 64.

Um die EEG-Personenidentifikationstechnologie realistisch und umsetzbar zu machen, muss die Stabilität und Robustheit des Systems gewährleistet werden können. Das bedeutet auch, dass das Modell in der Lage sein muss, Probanden konsistent und genau anhand ihrer EEG-Signale zu identifizieren, selbst wenn sich die Probanden in unterschiedlichen Zuständen befinden, etwa glücklich oder ruhig, oder sogar über etwas nachdenken. Wir haben mehrere Experimente durchgeführt, um die Wirksamkeit und Praktikabilität von ETST bei der EEG-Biometrie zu überprüfen. Das EEG-Signal im Physionet-Datensatz enthält vier Zustände: EO, EC, PHY und IMA. Wir haben verschiedene Experimente basierend auf diesen vier verschiedenen Zuständen entworfen, um die Leistung von ETST in verschiedenen Szenarien zu testen. Die von uns durchgeführten Experimente werden im Folgenden beschrieben.

Wir haben unser Modell mit modernsten EEG-Identifizierungsmethoden sowie mit traditionellen neuronalen Netzwerkmethoden wie CNN, MLP und traditionellen maschinellen Lernmethoden wie SVM verglichen. Bei den Vergleichsexperimenten mit anderen Methoden haben wir drei Teilexperimente aufgebaut. Das erste ist das Training und Testen in einem einzelnen menschlichen Zustand, und wir haben Training und Tests in vier Staaten durchgeführt: EC, EO, IMA und PHY, was dem Fall der EEG-Personenidentifizierung in einem festen Zustand entspricht. Die zweite Möglichkeit besteht darin, in einem Staat zu trainieren und in einem anderen Staat zu testen. Wir werden nach EC- und EO-Daten trainieren und nach IMA und PHY testen. Diese Art von Aufgabe ist die anspruchsvollste und testet, ob das durch Training unter einem EEG-Paradigma erhaltene Modell auf andere EEG-Paradigmen verallgemeinert werden kann. Der dritte ist eine Mischung aus EC-, EO-, IMA- und PHY-Datensätzen für Training und Tests. Für Experimente innerhalb des Staates und in verschiedenen Staaten teilen wir den Datensatz zufällig in 4:1 als Trainingssatz bzw. Testsatz auf.

Wir haben Ablationsexperimente durchgeführt, um die Auswirkung jedes Teils des Modells auf die Ergebnisse zu untersuchen. Die Positionskodierung ist ein wichtiger Bestandteil des Modells. Das EEG-Signal enthält Positionsinformationen sowohl im Zeit- als auch im Raumbereich. Transformer stellt sicher, dass das Modell die Standortinformationen beibehält, indem es der Eingabeart eine Positionskodierung hinzufügt. Wir untersuchen die Auswirkung der getrennten Hinzufügung von Zeitbereichs-Positionskodierung und Raumbereichs-Positionskodierung auf die Personenidentifikation. Neben dem Vergleich räumlicher und zeitlicher Positionskodierungen führten wir auch Ablationsexperimente am Encoder-Teil von ETST durch. Wir haben die Leistung von ETST beim Entfernen von TTE bzw. STE untersucht, um die Rolle jedes Encoderteils zu untersuchen.

Bei EEG-Identifizierungsmethoden besteht kein Konsens über die beste Segmentierungslänge von Proben. Beispielsweise ist die von Wang et al. beträgt 1s34, während die von Thiago Schons et al. verwendete Segmentierungslänge. beträgt 12s35, und es kann eine große Lücke zwischen den Probensegmentierungslängen verschiedener Methoden geben. Daher haben wir in unseren Experimenten den Datensatz mit unterschiedlichen Teilungslängen unterteilt, um die Leistung von ETST mit unterschiedlichen Stichproben-Teilungslängen zu untersuchen.

Zusätzlich zu den unterschiedlichen Segmentierungslängen wirkt sich die Stichprobenüberlappungsrate auch direkt auf die Größe der resultierenden Stichprobengröße und den Grad der Informationsüberlappung zwischen verschiedenen Stichproben aus. Die Verlustfunktion von Transformer ist glatter als die von CNN36, was die Konvergenz von Transformer bei kleineren Stichprobengrößen potenziell erschwert, was zu einer schlechteren Leistung führt. Daher entwerfen wir Experimente mit unterschiedlichen Stichprobenüberlappungslängen und erhalten Trainingsdatensätze mit unterschiedlichen Stichprobengrößen, um die Auswirkung der Stichprobengröße auf unser Modell zu untersuchen.

Alle Experimente in diesem Dokument werden auf der NVIDIA TITAN Xp-GPU durchgeführt. Die Anzahl der TTE-Schichten, die Anzahl der Köpfe der TTE-Schichten, die Anzahl der STE-Schichten und die Anzahl der Köpfe der STE-Schichten im Modell sind auf 2, 8, 2 bzw. 8 festgelegt. Wir verwenden den AdamW37-Optimierer mit einer Lernrate, einem Gewichtsabfall und einer Stapelgröße von 4e−5, 1e−6 bzw. 256, um das Netzwerk zu optimieren.

Derzeit werden EEG-basierte Algorithmen zur Personenidentifizierung grob in zwei Kategorien eingeteilt. Einer davon sind die herkömmlichen Algorithmen für maschinelles Lernen, die im Allgemeinen eine manuelle Merkmalsextraktion einschließlich Leistungsspektraldichte (PSD), Autoregressionskoeffizient (AR) und Fuzzy-Entropie (FuzzEn) erfordern. Eine weitere Kategorie sind Deep-Learning-Algorithmen, beispielsweise CNN-basierte oder RNN-basierte neuronale Netzwerkmodelle. Da das Konzept des Graphen außerdem gut zur funktionalen Konnektivität in den Neurowissenschaften passt, wo Graphmerkmale zur Darstellung der Beziehungen zwischen Gehirnregionen verwendet werden, erfreuen sich Graph Convolutional Neural Networks (GCNN) auch im Bereich des EEG zunehmender Beliebtheit. Wang et al. berechnete den Phasenverriegelungswert (PLV) und die Pearson-Korrelation (COR) als Kantenmerkmal zwischen Knoten, um Diagramme zu erstellen, und erzielte Ergebnisse auf dem neuesten Stand34. Wir haben unsere Methode mit anderen fortgeschrittenen Methoden verglichen15. Außerdem haben wir die Wirkung der jüngsten transformatorbasierten Modelle untersucht, die CNN und Aufmerksamkeit kombinieren38,39. Daher haben wir die oben genannten Methoden als Basis verwendet und sie mit den Ergebnissen unseres Modells verglichen.

Im ersten Experiment untersuchten wir die Leistung von ETST im selben Einzelzustand. Wir haben ETST an einem Einzelzustandsdatensatz trainiert und getestet, um die erwähnte Leistung zu bewerten. Die Ergebnisse sind in Tabelle 1 aufgeführt. Die experimentellen Ergebnisse zeigen, dass unsere vorgeschlagene Methode alle Methoden übertrifft, wenn sich die Daten im gleichen Zustand befinden, mit Ausnahme eines Ergebnisses ist etwas niedriger als die von GCNN, nur 0,2 % niedriger.

Die EEG-Signale können je nach Zustand drastisch variieren. Delta-Wellen sind beispielsweise mit erhöhter Aufmerksamkeit verbunden40, Alpha-Wellen sind mit verschiedenen kognitiven Merkmalen wie der Aufgabenerfüllung verbunden41, während Beta-Wellen mit Bewegung oder motorischen Vorstellungen verbunden sind42. Damit die EEG-Biometrie jedoch im wirklichen Leben praktikabel ist, muss der Algorithmus robust gegenüber Zustandsänderungen sein. Mit anderen Worten: Das Modell sollte in der Lage sein, die Identität des Benutzers in verschiedenen Zuständen zu erkennen. Daher bewerten wir im zweiten Experiment die Generalisierungsfähigkeit unserer vorgeschlagenen Methode in verschiedenen Zuständen, indem wir ETST an verschiedenen Datensätzen trainieren und testen. EO- und EC-Daten wurden als Trainingssätze verwendet und anhand von PHY- bzw. IMA-Daten getestet. Tabelle 2 zeigt die Ergebnisse dieses Experiments, bei dem es sich um Trainingssätze und Testsätze in verschiedenen Zuständen handelt. Die Ergebnisse zeigen, dass ETST im Vergleich zu anderen Methoden den Zustand verschiedener Staaten deutlich verbessert. Im Vergleich zu GCNN betragen die Verbesserungen 10,3 % bei PHY und 10,27 % bei IMA. Wenn die Zustände in den Trainings- und Testsätzen unterschiedlich waren, litten alle Methoden in unterschiedlichem Maße unter Leistungseinbußen, wobei GCNN um etwa 13 %, SVM um etwa 40 % sank und die Genauigkeit der übrigen Methoden auf weniger als 30 % sank. . Dies weist darauf hin, dass die anderen Modelle darauf beschränkt sind, Merkmale aus denselben Zuständen zu extrahieren und über eine schwache Generalisierungsfähigkeit für verschiedene Zustände verfügen. Im Gegensatz dazu nimmt das ETST-Modell nur um etwa 3 % ab, was darauf hindeutet, dass das ETST in der Lage ist, Merkmale zu extrahieren, die über verschiedene Staaten hinweg gültig sind.

Um die Robustheit des Modells gegenüber verschiedenen mentalen Zuständen zu verbessern, besteht neben der starken Generalisierungsfähigkeit des Modells selbst ein weiterer Ansatz darin, mehrere Zustände in den Trainingssatz einzubeziehen und das Modell lernen zu lassen, Merkmale zu extrahieren, die allen Zuständen gemeinsam sind. Daher haben wir im dritten Experiment alle Zustände sowohl in die Trainings- als auch in die Testsätze einbezogen, einschließlich EO, EC, PHY und IMA. ETST erzielt nahezu die besten Ergebnisse, wie in Tabelle 3 gezeigt. Im Vergleich zu den Ergebnissen des vorherigen Experiments zeigen die Ergebnisse dieses Experiments einen geringeren Rückgang der Genauigkeit, und nur SVM weist einen erheblichen Rückgang auf, bis hin zu 73 %. Es zeigt, dass verschiedene Algorithmen gute Ergebnisse erzielen können, wenn die Trainings- und Testsätze alle Zustandsdaten enthalten. Diese Verbesserungsmethode ist jedoch nicht auf realistische Szenarien anwendbar. Aufgrund der Komplexität und Variabilität menschlicher Zustände ist es unmöglich, Daten aller Zustände im Trainingssatz zu enthalten. Daher liegt der Schlüssel zur Lösung des EEG-basierten Personenidentifikationsproblems darin, die Generalisierungsfähigkeit des Modells zwischen verschiedenen Staaten zu verbessern. Und unser vorgeschlagener ETST verfügt über eine starke Generalisierungsfähigkeit.

In Transformer berechnet die Selbstaufmerksamkeit Aufmerksamkeitsgewichte für alle Eingaben gleichzeitig und summiert die Gewichte, um die Ausgabe zu erhalten. In diesem Prozess berücksichtigt die Selbstaufmerksamkeit die globalen Informationen und verwirft die Standortinformationen der Eingabedaten. Bei EEG-Daten enthält das Signal Ortsinformationen sowohl im Zeit- als auch im Raumbereich, die unterschiedliche zeitliche Abtastpunkte bzw. verschiedene Gehirnregionen repräsentieren. Um die Auswirkung von Standortinformationen im EEG auf die Personenidentifizierung zu untersuchen, haben wir versucht, die Standortinformationen des EEG beizubehalten, indem wir der Eingabe der TTE- bzw. STE-Schichten eine Positionskodierung hinzugefügt haben. Wir vergleichen die Auswirkung des Hinzufügens einer Positionskodierung zu ETST in den Zeit- und Raumdomänen unter dem zustandsübergreifenden Datensatz. Die Ergebnisse sind in Tabelle 4 dargestellt. Es zeigt, dass das Hinzufügen nur der räumlichen Positionskodierung zu einem besseren Ergebnis führte als das der zeitlichen Positionskodierung. Dieses Modelldesign erbrachte auch die beste Leistung unseres Modells (97 % in IMA, 97 % in PHY). Das Hinzufügen der zeitlichen und räumlichen Positionskodierung ergab das nächstbeste Ergebnis (96 % in IMA, 95 % in PHY). Wir haben festgestellt, dass die Modellleistung durch das Hinzufügen räumlicher Informationen verbessert, während sie durch das Hinzufügen zeitlicher Informationen verringert werden kann. Darüber hinaus haben wir durch Beobachtung des Trainingsprozesses des Modells herausgefunden, dass das Hinzufügen von Standortinformationen im Zeitbereich bis zu einem gewissen Grad auch die Trainingseffizienz beeinflusst, wodurch die Wahrscheinlichkeit einer Konvergenz des Modells zu schlechteren Minima steigt, was zu schlechten Ergebnissen führt. Wir glauben, dass die absolute Positionskodierung im Zeitbereich die Übersetzungsinvarianz von EEG-Signalen unterbricht und es somit für das Modell schwieriger macht, Zeitbereichsmerkmale zu extrahieren. Die absolute räumliche Positionskodierung behält die Positionsinformationen verschiedener Kanäle bei. Anders als derselbe Abtastpunkt, der in benachbarten Samples an verschiedenen Stellen erscheinen kann, sind die Kanalpositionen in Samples fest. Daher könnte die Einbeziehung der absoluten Positionskodierung in den Raumbereich stattdessen die Fähigkeit des Modells zur Extraktion räumlicher Merkmale verbessern.

Das ETST-Modell enthält zwei Teile, die TTE-Schicht und die STE-Schicht, zum Extrahieren von Zeitdomänen- bzw. Raumdomänenmerkmalen. Um die Bedeutung der beiden unterschiedlichen Merkmale für die experimentellen Ergebnisse zu veranschaulichen, haben wir Ablationsexperimente im Cross-State-Modus für das Modell durchgeführt, um die Notwendigkeit jedes Teils unseres Modells widerzuspiegeln. Wie in Tabelle 5 zu sehen ist, haben wir die Ergebnisse unter den Modellen TTE, STE und TTE + STE verglichen. Die Ergebnisse zeigen, dass die Genauigkeit deutlich geringer ist, wenn nur die TTE-Schicht oder nur die STE-Schicht verwendet wird. Darüber hinaus zeigen die Ergebnisse, dass die TTE-Schicht eine etwas höhere Klassifizierungsgenauigkeit aufweist als STE (75,19 % in IMA und 72,98 % in PHY gegenüber 70,22 % in IMA und 68,98 % in PHY). Daher kann gezeigt werden, dass Zeitbereichsinformationen für die Personenidentifizierung wichtiger sind als Raumbereichsinformationen. Um gleichzeitig zeitliche und räumliche EEG-Informationen zu erfassen, besteht unser Modell aus TTE- und STE-Schichten, die die Leistung des Modells erheblich verbessern und so den State-of-the-Art-Effekt erzielen können.

Die Länge der Probensegmentierung variiert bei früheren Methoden. Daher funktionieren einige Methoden möglicherweise nur mit kürzeren Probensegmentierungslängen, während andere das Gegenteil bewirken. Die gleiche Methode mit Proben unterschiedlicher Spaltlänge kann zu sehr unterschiedlichen Ergebnissen führen. Um die Generalisierbarkeit der Stichprobenlänge unserer Methode zu veranschaulichen, haben wir die Klassifizierungsgenauigkeit des Modells bei Stichproben unterschiedlicher Segmentierungslänge verglichen. Es ist zu beachten, dass die Verwendung einer längeren Stichprobenlänge zu einer kleineren Stichprobengröße führen würde. Beispielsweise beträgt die Stichprobengröße einer 5-Sekunden-Segmentierungslänge nur etwa ein Fünftel der Stichprobengröße einer 1-Sekunden-Segmentierung. Aus Abb. 3 geht hervor, dass die Stichprobe mit einer Länge von 1 Sekunde die besten Ergebnisse bei gleicher Überlappungsrate erzielt. Wir können auch sehen, dass die Klassifizierungsgenauigkeit umso geringer ist, je länger die Stichprobenlänge ist. Namuk Park et al.36 erwähnten, dass sich bei Transformer die Größe des Datensatzes aufgrund seiner glatteren Verlustfunktion direkt auf die endgültigen Trainingsergebnisse auswirkt, d. h. Transformer schneidet bei weniger Stichproben schlechter ab.

Wir versuchen, die Anzahl der Stichproben zu erhöhen, indem wir die Überlappungsrate des Schiebefensters erhöhen. Die Datenerweiterung der Stichproben erfolgt mit einer Überlappungsrate von 80 % und die Ergebnisse werden für verschiedene Trainingssatzgrößen verglichen. Wie in Abb. 3 zu sehen ist, erhöhte sich die Modellgenauigkeit, als wir das Überlappungsverhältnis auf 80 % änderten und damit die Stichprobengröße des Datensatzes um das Zweifache vergrößerten. Die 5-Sekunden-Genauigkeit steigt auf 95,44 %, was im Vergleich zur 1-Sekunden-Genauigkeit um etwa 2 % etwas niedriger ist. Dies deutet darauf hin, dass eine unzureichende Stichprobengröße der Daten die Leistung des transformatorbasierten Modells verschlechtert. Im Allgemeinen erzielt unser Modell unabhängig von der Stichprobenlänge Ergebnisse auf dem neuesten Stand der Technik.

Ergebnisse des ETST-Modells in unterschiedlicher Segmentlänge und Überlappung.

In diesem Artikel schlagen wir ETST vor, ein Deep-Learning-Modell, das auf dem Aufmerksamkeitsmechanismus basiert. Wir verwendeten einen mehrköpfigen Aufmerksamkeitsmechanismus, um die zeitlichen und räumlichen Merkmale von EEG-Signalen zu extrahieren. Der zeitliche Transformator-Encoder im Modell ist in der Lage, über große Entfernungen unterscheidbare Darstellungen zu extrahieren, und der räumliche Transformator-Encoder ist in der Lage, räumliche Abhängigkeiten zwischen Kanälen zu erfassen, was die funktionale Konnektivität zwischen Gehirnregionen charakterisiert. Auf diese Weise kann sich das Modell durch mehrere Runden der Aufmerksamkeitsgewichtung auf die Merkmale konzentrieren, die für die tatsächlichen Klassifizierungsbezeichnungen am relevantesten sind. Die experimentellen Ergebnisse zeigen, dass unsere Methode eine hochmoderne Genauigkeit bei der Personenidentifizierung erreicht, was auch die Machbarkeit des EEG bei der Biometrie bestätigt. Das Modell ist auch gegenüber verschiedenen Zuständen robust. Die Ergebnisse der Ablationsexperimente zeigen, dass die zeitlichen Merkmale einen relativ signifikanten Einfluss auf das Ergebnis der EEG-Biometrie haben. Es zeigt auch, dass die absolute Positionskodierung im Raum das Modell verbessert. Dies weist darauf hin, dass sowohl bestimmte Kanäle als auch die Korrelation zwischen Kanälen einen Einfluss auf die Personenidentifikation haben können. Die Experimente zeigen, dass längere EEG-Daten zu einer leichten Leistungsminderung des Aufmerksamkeitsmechanismus führen. Darüber hinaus erfordert die Anwendung von Transformer im EEG ausreichende Daten, um seine Leistung sicherzustellen. Daher ist es notwendig, die Datenargumentationsmethode für EEG-Daten in zukünftigen Studien zu untersuchen. Darüber hinaus ist die Auswahl der Hyperparameter für unser Modell aufgrund der zeitlichen Begrenzung noch nicht optimal, was zu einer suboptimalen Modellleistung führt.

Die Stabilitäts- und Konsistenzprobleme sind zwei Schlüsselprobleme bei der Implementierung der EEG-Biometrie in praktische Anwendungen, und es muss sichergestellt werden, dass das Modell Benutzer unabhängig von Bedingungen und Zeiten korrekt wieder identifizieren kann. Dies erfordert, dass das Modell in der Lage ist, zeitinvariante und zustandsinvariante Merkmale zu extrahieren. In zukünftigen Arbeiten werden wir neue Ansätze untersuchen, um eine effektivere Merkmalsextraktion für EEG-Signale durchzuführen. Mögliche Methoden umfassen das Filtern der Alpha-Band-Merkmale von EEG-Signalen, die im Ruhezustand eine starke interindividuelle Varianz aufweisen; und Auswahl der Kanäle mit starker Korrelation zur Personenidentifikation unter Beseitigung der Auswirkungen redundanter Kanäle. Gleichzeitig müssen noch Experimente zur EEG-basierten Personenidentifizierung an verschiedenen Tagen durchgeführt werden.

Der für diese Studie verwendete Datensatz ist öffentlich verfügbar und online in der PhysioNet-Datenbank [https://physionet.org/content/eegmmidb/1.0.0/]32 zugänglich.

Soomro, ZA, Shah, MH & Ahmed, J. Informationssicherheitsmanagement braucht einen ganzheitlicheren Ansatz: Eine Literaturübersicht. Int. J. Inf. Geschäftsführer 36, 215–225 (2016).

Artikel Google Scholar

Cappelli, R., Ferrara, M. & Maltoni, D. Minutia-Zylindercode: Eine neue Darstellungs- und Vergleichstechnik für die Fingerabdruckerkennung. IEEE Trans. Muster Anal. Mach. Intel. 32, 2128–2141 (2010).

Artikel Google Scholar

Masek, L. et al. Erkennung menschlicher Irismuster zur biometrischen Identifizierung. Ph.D. These, Citeseer (2003).

Guillaumin, M., Verbeek, J. & Schmid, C. Sind Sie das? Metrische Lernansätze zur Gesichtserkennung. Im Jahr 2009 IEEE 12. Internationale Konferenz über Computer Vision 498–505 (IEEE, 2009).

Campisi, P. & La Rocca, D. Gehirnwellen für die automatische biometrische Benutzererkennung. IEEE Trans. Inf. Forensik sicher. 9, 782–800 (2014).

Artikel Google Scholar

Tan, D. & Nijholt, A. Gehirn-Computer-Schnittstellen und Mensch-Computer-Interaktion. In Brain-Computer Interfaces (Hrsg. Tan, DS & Nijholt, A.) 3–19 (Springer, 2010).

Kapitel Google Scholar

Min, B.-K., Marzelli, MJ & Yoo, S.-S. Neuroimaging-basierte Ansätze in der Gehirn-Computer-Schnittstelle. Trends Biotechnologie. 28, 552–560 (2010).

Artikel CAS Google Scholar

Berkhout, J. & Walter, DO Zeitliche Stabilität und individuelle Unterschiede im menschlichen EEG: Eine Analyse der Varianz spektraler Werte. IEEE Trans. Biomed. Ing. 3, 165–168 (1968).

Artikel Google Scholar

Vogel, F. Die genetische Grundlage des normalen menschlichen Elektroenzephalogramms (EEG). Human Genetics 10, 91–114 (1970).

Artikel CAS Google Scholar

Van Dis, H., Corner, M., Dapper, R., Hanewald, G. & Kok, H. Individuelle Unterschiede im menschlichen Elektroenzephalogramm im ruhigen Wachzustand. Elektroenzephalologe Klin. Neurophysiol. 47, 87–94 (1979).

Artikel Google Scholar

Henry, CE Elektroenzephalographische individuelle Unterschiede und ihre Konstanz: I. Während des Schlafs. J. Exp. Psychol. 29, 117 (1941).

Artikel Google Scholar

Henry, CE Elektroenzephalographische individuelle Unterschiede und ihre Konstanz: II. Beim Aufwachen. J. Exp. Psychol. 29, 236 (1941).

Artikel Google Scholar

Ruiz-Blondet, MV, Jin, Z. & Laszlo, S. Cerebre: Eine neuartige Methode zur ereignisbezogenen potenziellen biometrischen Identifizierung mit sehr hoher Genauigkeit. IEEE Tran. Inf. Forensik sicher. 11, 1618–1629 (2016).

Artikel Google Scholar

Kong, Im Jahr 2018 IEEE International Conference on Bioinformatics and Biomedicine (BIBM) 412–419 (IEEE, 2018).

Wang, M., Hu, J. & Abbass, HA Brainprint: Biometrische EEG-Identifizierung basierend auf der Analyse von Gehirnkonnektivitätsdiagrammen. Mustererkennung. 105, 107381 (2020).

Artikel Google Scholar

Moctezuma, LA & Molinas, M. Multiobjektive Optimierung für die EEG-Kanalauswahl und genaue Eindringlingserkennung in einem EEG-basierten Subjektidentifikationssystem. Wissenschaft. Rep. 10, 1–12 (2020).

Artikel Google Scholar

Alyasseri, ZAA, Khader, AT, Al-Betar, MA & Alomari, OA Personenidentifizierung mithilfe der EEG-Kanalauswahl mit hybridem Blütenbestäubungsalgorithmus. Mustererkennung. 105, 107393 (2020).

Artikel Google Scholar

Yıldırım, Ö., Baloglu, UB & Acharya, UR Ein tiefes Faltungs-Neuronales Netzwerkmodell zur automatisierten Identifizierung abnormaler EEG-Signale. Neuronale Berechnung. Appl. 32, 15857–15868 (2020).

Artikel Google Scholar

Wilaiprasitporn, T. et al. Affektive EEG-basierte Personenidentifikation mittels Deep-Learning-Ansatz. IEEE Trans. Kognitiv. Entwickler Syst. 12, 486–496 (2019).

Artikel Google Scholar

Özdenizci, O., Wang, Y., Koike-Akino, T. & Erdoğmuş, D. Adversarial Deep Learning in der EEG-Biometrie. IEEE-Signalprozess. Lette. 26, 710–714 (2019).

Artikel ADS Google Scholar

Vaswani, A. et al. Aufmerksamkeit ist alles, was Sie brauchen. In Advances in Neural Information Processing Systems, vol. 30 (2017).

Dosovitskiy, A. et al. Ein Bild sagt mehr als 16x16 Worte: Transformatoren für die Bilderkennung im Maßstab. arXiv-Vorabdruck arXiv:2010.11929 (2020).

Liu, Z. et al. Swin-Transformator: Hierarchischer Vision-Transformator mit verschobenen Fenstern. In Proceedings of the IEEE/CVF International Conference on Computer Vision 10012–10022 (2021).

Arjun, A., Rajpoot, AS & Panicker, MR Einführung in den Aufmerksamkeitsmechanismus für EEG-Signale: Emotionserkennung mit Sehtransformatoren. Im Jahr 2021 43. jährliche internationale Konferenz der IEEE Engineering in Medicine and Biology Society (EMBC) 5723–5726 (IEEE, 2021).

Lee, Y.-E. & Lee, S.-H. EEG-Transformator: Selbstaufmerksamkeit durch Transformatorarchitektur zur Dekodierung des EEG von imaginärer Sprache. Im Jahr 2022 10. Internationale Winterkonferenz zum Thema Brain-Computer Interface (BCI) 1–4 (IEEE, 2022).

Tao, Y. et al. Gated-Transformator zur Dekodierung von EEG-Signalen des menschlichen Gehirns. Im Jahr 2021 43. jährliche internationale Konferenz der IEEE Engineering in Medicine and Biology Society (EMBC) 125–130 (IEEE, 2021).

Song, Y., Jia, X., Yang, L. & Xie, L. Transformer-basiertes räumlich-zeitliches Merkmalslernen für die EEG-Dekodierung. arXiv-Vorabdruck arXiv:2106.11170 (2021).

Kostas, D., Aroca-Ouellette, S. & Rudzicz, F. Bendr: Verwendung von Transformatoren und einer kontrastiven selbstüberwachten Lernaufgabe, um aus riesigen Mengen an EEG-Daten zu lernen. Vorderseite. Summen. Neurosci. 15, 1–15 (2021).

Artikel Google Scholar

Bagchi, S. & Bathula, DR EEG-Konverter für die EEG-basierte Klassifizierung visueller Reize in einem Versuch. Mustererkennung. 129, 108757 (2022).

Artikel Google Scholar

He, K., Zhang, X., Ren, S. & Sun, J. Deep Residual Learning für die Bilderkennung. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition 770–778 (2016).

Ba, JL, Kiros, JR & Hinton, GE Layer-Normalisierung. arXiv-Vorabdruck arXiv:1607.06450 (2016).

Goldberger, AL et al. Physiobank, Physiotoolkit und Physionet: Komponenten einer neuen Forschungsressource für komplexe physiologische Signale. Auflage 101, e215–e220 (2000).

CAS PubMed Google Scholar

Schalk, G., McFarland, DJ, Hinterberger, T., Birbaumer, N. & Wolpaw, JR BCI 2000: Ein universelles Gehirn-Computer-Schnittstellensystem (BCI). IEEE Trans. Biomed. Ing. 51, 1034–1043 (2004).

Artikel Google Scholar

Wang, M., El-Fiqi, H., Hu, J. & Abbass, HA Faltungs-Neuronale Netze nutzen dynamische funktionale Konnektivität für die EEG-basierte Personenidentifizierung in verschiedenen menschlichen Zuständen. IEEE Trans. Inf. Forensik sicher. 14, 3259–3272 (2019).

Artikel Google Scholar

Schons, T., Moreira, GJ, Silva, PH, Coelho, VN & Luz, EJ Faltungsnetzwerk für EEG-basierte Biometrie. In Iberoamerican Congress on Pattern Recognition, 601–608 (Springer, 2017).

Park, N. & Kim, S. Wie funktionieren Vision Transformer? arXiv-Vorabdruck arXiv:2202.06709 (2022).

Loshchilov, I. & Hutter, F. Entkoppelte Regularisierung des Gewichtsabfalls. arXiv-Vorabdruck arXiv:1711.05101 (2017).

Wu, Z., Liu, Z., Lin, J., Lin, Y. & Han, S. Lite-Transformator mit Fern- und Kurzstreckenaufmerksamkeit. arXiv-Vorabdruck arXiv:2004.11886 (2020).

Wang, Y. et al. Sich entwickelnde Aufmerksamkeit mit verbleibenden Windungen. In International Conference on Machine Learning 10971–10980 (PMLR, 2021).

Harmony, T. et al. EEG-Delta-Aktivität: Ein Indikator für die Aufmerksamkeit für die interne Verarbeitung während der Ausführung geistiger Aufgaben. Int. J. Psychophysiol. 24, 161–171 (1996).

Artikel CAS Google Scholar

Jann, K., Koenig, T., Dierks, T., Boesch, C. & Federspiel, A. Zusammenhang zwischen der individuellen Alpha-Frequenz des Ruhezustands-EEG und dem zerebralen Blutfluss. Neuroimage 51, 365–372 (2010).

Artikel Google Scholar

McFarland, DJ, Miner, LA, Vaughan, TM & Wolpaw, JR Mu und Beta-Rhythmus-Topografien während motorischer Bilder und tatsächlicher Bewegungen. Gehirntopogr. 12, 177–186 (2000).

Artikel CAS Google Scholar

Referenzen herunterladen

Diese Autoren trugen gleichermaßen bei: Yang Du, Yongling Xu und Xiaoan Wang.

Big Data Center, Nanfang Hospital, Southern Medical University, Guangzhou, 510515, China

Yang Du, Li Liu und Pengcheng Ma

Brainup Research Lab, Naolu Technology Co., Ltd., Peking, 100124, China

Yongling Xu & Xiaoan Wang

Sie können diesen Autor auch in PubMed Google Scholar suchen

YD und YX schlugen die Methode vor, führten die Experimente durch und verfassten das Manuskript. XW, LL und PM gaben Hinweise zum Experiment und überprüften das Manuskript.

Korrespondenz mit Xiaoan Wang, Li Liu oder Pengcheng Ma.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Springer Nature bleibt neutral hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Du, Y., Xu, Y., Wang, X. et al. Zeitlich-räumlicher EEG-Transformator zur Personenidentifizierung. Sci Rep 12, 14378 (2022). https://doi.org/10.1038/s41598-022-18502-3

Zitat herunterladen

Eingegangen: 11. April 2022

Angenommen: 12. August 2022

Veröffentlicht: 23. August 2022

DOI: https://doi.org/10.1038/s41598-022-18502-3

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.

Nachricht