Rapidly adapting machine learning methods for brain-computer interfaces
Abstract: Ein "Brain-Computer Interface" (BCI) ist ein System, das Gehirnaktivität misst, die Signale auswertet und dann in der Regel eine entsprechende Aktion durchführt.
Hervorzuheben ist, dass ein BCI es möglich macht, Anwendungen oder Geräte zu nutzen, ohne dass Muskelkraft benötigt wird.
Dadurch ist es eine vielversprechende Technologie für beispielsweise Patienten, die unter neurologischen Krankheiten leiden, welche ihre motorischen Fähigkeiten einschränken.
Hirnaktivität verlässlich zu messen ist an sich schon eine Herausforderung.
Insbesondere, wenn die Signale außerhalb des Gehirns gemessen werden, wie beispielsweise bei einem Elektroenzephalogramm.
Aufgrund des Abstands zwischen den Messelektroden auf der Kopfhaut und den Quellen der Signale innerhalb des Gehirns sind die Aufzeichnungen eher schwach und verrauscht.
Hinzu kommt, dass sich die Signale von verschiedenen Personen stark unterscheiden können.
Daher muss ein BCI für jeden einzelnen Nutzer angepasst werden.
Normalerweise nutzt man Methoden des Maschinellen Lernens, um mit diesen Herausforderungen umzugehen, da diese in der Lage sind, die individuell relevanten Hirnsignale zu identifizieren, sofern genug Trainingsdaten vorhanden sind.
Allerdings ist das Aufnehmen von genügend Daten zeitaufwendig, wodurch die Benutzerfreundlichkeit eines BCIs eingeschränkt wird.
In dieser Arbeit stelle ich neue Ansätze vor, die es BCI Systemen möglich machen, in verschiedenen Kontexten mit sehr wenig Trainingsdaten umzugehen.
Eine Art von BCIs nutzt sogenannte ereigniskorrelierte Potentiale (englisch "event-related potentials (ERP)"), also Hirnaktivität, die durch Stimuli ausgelöst wird.
Diese können visuell oder auditorisch sein, also beispielsweise ein Aufblinken auf einem Bildschirm oder ein Ton von einem Lautsprecher.
BCIs, die diese Signale nutzen, müssen in der Lage sein, verschiedene Arten von ERPs unterscheiden zu können.
Allerdings wird die generelle Form von ERPs, und damit auch deren Unterscheidbarkeit, von den Eigenschaften der genutzten Stimuli beeinflusst.
Mein erster Beitrag zeigt, dass die Stimulationsparameter für jeden Nutzer eines BCIs während der Nutzung individuell optimiert werden können, sodass die ERP Klassifikation einfacher wird.
Ich konnte in Experimenten mit 13 Probanden meinen Optimierungsansatz, der auf Methoden aus der Hyperparameteroptimierung aufbaut, evaluieren.
Für acht Teilnehmer wurden die optimalen Stimulationsparameter ermittelt. Generell hing der Erfolg meiner Methode allerdings stark davon ab, wie gut die Qualität der Stimulationsparameter auf sehr kurzen EEG Aufnahmen gemessen werden konnte.
Eine beliebte Methode, um ERPs zu klassifizieren, selbst wenn wenig Daten vorhanden sind, ist die lineare Diskriminanzanalyse (LDA).
Für die LDA ist eine genaue Schätzung der Kovarianzmatrix nötig.
Ich zeige in dieser Arbeit, wie man sich domänenspezifische Annahmen zu Nutze machen kann, um selbst mit wenig Daten die Kovarianzmatrix zu schätzen.
Eine Evaluation auf 13 verschiedenen ERP Datensätzen, die insgesamt Daten von 213 Versuchspersonen enthalten, hat ergeben, dass eine LDA, die meinen Ansatz zur Schätzung der Kovarianzmatrix nutzt, nur ungefähr halb so viele Daten benötigt wie der bisher immer noch weit verbreitete "shrinkage" Ansatz.
Daher könnte meine neue Methode genutzt werden, um die Dauer der Kalibrationsphase -- also die Zeit während der die Trainingsdaten der BCI Nutzer aufgenommen werden und sie das BCI nicht wirklich benutzen können -- wesentlich zu verkürzen.
Anstatt die Kalibrationsphase lediglich kürzer zu machen, kann man alternativ auch Klassifikationsmethoden nutzen, die unüberwachtes Lernen einsetzen.
Dadurch wird es möglich ein BCI ohne Kalibrationsphase zu benutzen.
In diesem Kontext stelle ich eine neue Methode namens "UMM" vor.
Im Gegensatz zu bisherigen Ansätzen versucht UMM nicht mehr einzelne ERPs korrekt zu klassifizieren, sondern löst direkt das Anwendungsproblem, also beispielsweise zu dekodieren welches Symbol der Benutzer buchstabieren möchte.
Angewandt auf fünf öffentlich verfügbaren Datensätzen, erreichte UMM eine komplett fehlerfreie Klassifizierung für 58 von 108 Nutzern.
Für einen der Datensätze ist ein direkter Vergleich mit der aktuellen State of the Art Methode im Bereich des unüberwachten Lernens für BCI möglich, welche dort 85,7% aller Buchstaben korrekt klassifiziert.
Auf denselben Daten erreicht UMM hingegen eine Klassifikationsrate von 99,8%.
Damit behebt UMM das Problem, das bisherige unüberwachte Ansätze haben, nämlich ihre vergleichsweise hohe Fehlerrate, insbesondere zu Beginn der Nutzung des BCIs.
Zusammenfassend lässt sich sagen, dass meine entwickelten Methoden wesentliche Herausforderungen im Bereich von ERP-basierten BCIs lösen und die Entwicklung von BCI Systemen, die sich sehr schnell an verschiedene Nutzer anpassen können, ermöglichen
Abstract: A brain--computer interface (BCI) is a system that measures brain activity, interprets the obtained signals and usually performs a corresponding action.
Notably, a BCI allows its user to control applications or devices without requiring muscle activity, thus, making it a promising technology for, e.g., neurological patients with no or limited motor control.
Obtaining reliable measurements of brain activity is a challenge in and of itself.
This is especially true, if the signal is recorded from outside the brain, as is the case for the electroencephalogram.
Given the distance between the measuring electrodes on the scalp and the sources inside the brain, the recordings tend to be weak and noisy.
On top of this, the signals between individuals are usually very different from one another.
As a result, a BCI has to be carefully adapted to each specific user.
This is typically achieved by using machine learning methods, as they can identify each user's distinct brain activity when given enough training data.
However, obtaining enough data is time-consuming and therefore limits the usability of a BCI.
In this thesis, I propose new approaches that can deal with scarce data in different areas of a BCI system.
One class of BCIs makes use of so-called event-related potentials (ERPs), i.e., brain activity triggered by stimuli such as visual flashes or auditory sounds.
Here, the BCI needs to be able to distinguish different types of ERPs.
However, their discriminability and overall shape depend on the characteristics of the used stimuli.
In my first contribution, I show that the stimulation parameters can be optimized for each individual user in order to facilitate ERP classification, even during an online experiment.
I evaluated my proposed combined random search and Bayesian optimization approach with 13 participants, where the optimal stimulation parameters could be found for eight subjects.
However, the success of this optimization depended strongly on how well the suitability of a stimulation parameter could be estimated from very short brain activity recordings.
A popular classifier for ERPs, which tends to perform well with limited data, is the linear discriminant analysis (LDA).
This method requires a good covariance matrix estimate of the data.
I show that incorporating domain-specific assumptions makes the covariance estimation considerably more sample efficient.
An evaluation on 13 different ERP datasets, with data from 213 participants in total, showed that an LDA using my proposed approach requires approximately half as much data to reach the same classification performance as a traditional---but still widely used---shrinkage estimation approach.
Thus, my approach could be used to considerably shorten the calibration phase of a BCI, i.e., the time during which training data needs to be collected from the user and he or she cannot actually use the BCI.
A different approach to reduce the length of the calibration phase is to make use of unsupervised classifiers, which remove the need for calibration altogether.
In this context, I propose a new unsupervised classification approach for ERP-based BCIs that directly solves the application level problem instead of trying to classify each individual ERP.
I evaluated my proposed method 'UMM' on five publicly available datasets across 108 participants.
For 58 participants UMM makes no misclassifications at all.
Compared to the current state of the art unsupervised classification method for ERP-based BCI, which correctly classified 85.7% of letters in a visual speller experiment, UMM reaches a classification rate of 99.8% on the same data.
UMM is therefore able to mitigate a core problem of unsupervised methods for ERP-based BCI, i.e., the comparatively high error rate, especially at the beginning of a BCI session.
Taken together, the proposed methods tackle vital challenges in the domain of BCI using ERPs and enable practitioners to design BCI systems that are able to rapidly adapt to each individual user
- Location
-
Deutsche Nationalbibliothek Frankfurt am Main
- Extent
-
Online-Ressource
- Language
-
Englisch
- Notes
-
Universität Freiburg, Dissertation, 2024
- Keyword
-
Gehirn-Computer-Schnittstelle
Elektroencephalogramm
Bewegungssteuerung
Elektroencephalographie
Elektroencephalographie
Gehirn-Computer-Schnittstelle
Maschinelles Lernen
Unüberwachtes Lernen
Ereigniskorreliertes Potenzial
- Event
-
Veröffentlichung
- (where)
-
Freiburg
- (who)
-
Universität
- (when)
-
2024
- Creator
- Contributor
- DOI
-
10.6094/UNIFR/246982
- URN
-
urn:nbn:de:bsz:25-freidok-2469820
- Rights
-
Open Access; Der Zugriff auf das Objekt ist unbeschränkt möglich.
- Last update
-
14.08.2025, 11:04 AM CEST
Data provider
Deutsche Nationalbibliothek. If you have any questions about the object, please contact the data provider.
Associated
Time of origin
- 2024