Mikroelektronik, Neurophysiologie und maschinelles Lernen rütteln auf, vermischen sich jedoch nicht

Mitte 2018 wurden Arbeiten zur Elektrophysiologie des Rattenhirns veröffentlicht , mit denen ein einzigartiger Datensatz öffentlich zugänglich gemacht wurde . Der Datensatz ist insofern einzigartig, als er gleichzeitig das lokale Feldpotential mit Hilfe einer neuen Neuropixels- Elektrode (Probe oder Sonde) hoher Dichte und einer Patch-Elektrode aus einer Zelle in der Nähe der Probe aufzeichnet . Das Interesse an solchen Aufzeichnungen ist nicht nur von grundlegender Bedeutung, sondern wird auch angewandt, da es die Validierung von Modellen zur Analyse neuronaler Aktivität ermöglicht, die von modernen Proben erfasst werden. Und dies wiederum betrifft direkt die Entwicklung neuer Neuroprothesen. Was ist die wichtigste Neuheit und warum dieser Datensatz so wichtig ist - ich werde es unter der Kürzung erzählen.


KDPV: Das Ergebnis der Modellierung des extrazellulären Potentials in der Nähe eines Neurons bei der Erzeugung eines Aktionspotentials ( Quelle ). Die Farbe gibt die Amplitude des Potentials an. Diese Abbildung wird für das weitere Verständnis wichtig sein.

Elektrophysiologische ForschungsmethodenGehirn basierend auf der Registrierung des elektrischen Potentials des Gehirns. Sie können in nicht-invasiv - hauptsächlich Elektroenzephalographie (EEG) und invasiv - beispielsweise Elektrokortikographie (ECOG, ECoG), Patch-Clamp (Patch-Clamp) oder Erfassung des lokalen Feldpotentials (BOB = lokales Feldpotential, LFP) unterteilt werden. . Für letztere wird eine kleine Elektrode mit einer Größe von 10-100 μm direkt in das Gehirn injiziert und deren Potenzial erfasst. Um die Aktivität des Säugetiergehirns auf zellulärer Ebene zu untersuchen, d. H. Um die Aktivität einzelner Zellen zu messen, können die verfügbaren nicht-invasiven Verfahren nicht angewendet werden, da das Potential einer Zelle im Weltraum sehr schnell nachlässt, buchstäblich über 100 Mikrometer (siehe KDPV). Daher kann in jedem Tiermodell wie beim Menschen

Aber mit invasiven Methoden ist das nicht so einfach. Um die Aktivität eines Neurons aufzuzeichnen, ist es notwendig, die Elektrode sehr nahe an das Neuron zu bringen, idealerweise in die Zelle zu platzieren, wie in der Patch-Klemme oder mit Hilfe von Sharp-ElektrodenDas ist in der Praxis schwierig, sehr schwierig. Auf der anderen Seite registriert jede extrazelluläre Elektrode mit einer Größe von ~ 10 Mikrometern aufgrund der hohen Neuronendichte und der hohen Ionenleitfähigkeit der extrazellulären Lösung Aktionspotentiale um 5-10 Zellen herum. Die Registrierung einzelner Zellen wird daher technisch gelöst, indem die Dichte der Elektroden in der Nähe der Zelle erhöht wird. In dieser Hinsicht bewegt sich die moderne Elektrophysiologie in Richtung einer Erhöhung der Dichte der Elektroden, einer Erhöhung ihrer Anzahl und einer Verringerung der Größe. Selbst unter den Anforderungen besteht die Notwendigkeit, das Signal näher an der Registrierungsstelle zu verstärken, um das Rauschen zu reduzieren, und einen Multiplexer zu platzieren, um seine Größe zu verringern. 2016 wurde es im Preprint angekündigt, 2017 wurde es in Nature veröffentlicht und 2018 war es bereits auf dem Markt, ein neues Neuropixel-Sample mit hoher Dichte, hergestellt durch CMOS-Technologie, auf 960 Elektroden, von denen 384 für die gleichzeitige Aufzeichnung verfügbar sind. Die Größe einer Registrierungsstelle beträgt 12 Mikrometer. Die Probendicke beträgt 24 µm. Mit Elektroden mit hoher Dichte sowie mit aktiver Verstärkung begann man bereits vor langer Zeit zu arbeiten, aber Neuropixels war das erste Unternehmen, das Produktion und Vertrieb erreichte. Daher wird dieser Test in naher Zukunft immer häufiger in Artikeln vorkommen.

Abb. Neuropixel-Schema. Auf einem monolithischen Siliziumsubstrat befinden sich 960 Standorte sowie ein vollwertiger Multiplexer und eine AD-Schnittstelle mit 384 Kanälen.

Datenstruktur


Neben den klassischen Aktivitätsrhythmen (Alpha, Beta, Gamma usw.), die für die Gruppensynchronisation verantwortlich sind, enthalten die Daten, die mit ähnlichen Proben erhalten werden, auch die Aktionspotentiale einzelner Zellen (PD = Aktionspotentiale, AP, Spikes, Spikes). die in der Aufzeichnung als kurze Peaks mit einer Dauer von ~ 1 ms erscheinen.


Abb. Signalisiert Neuropixel. Es werden zwei Teile des Signals unterschieden: lokales Feldpotential (LFP bis ~ 300 Hz) und Zellaktivität (AP von 300 Hz).

Wenn das niederfrequente lokale Feldpotential üblicherweise im Rahmen von Schwingungen analysiert wird und die Spektral- oder Wavelet-Analyse wie im EEG verwendet wird, dann enthält die Zellaktivität die Aktionspotentiale einzelner Zellen, sie besteht aus diskreten Ereignissen vor dem Hintergrund des Rauschens. Die Aufgabe, die Aktivität einzelner Zellen zu isolieren, wird formal auf das Problem der Cocktailparty reduziert, wenn aus einer Vielzahl von Sprechern ein separater Sprecher ausgewählt werden muss. Große Daten werden angezeigt, wenn wir den Datenstrom von einer solchen Probe auswerten. Für die Analyse von Spitzen wird die Abtastung bei 30–40 kHz mit Digitalisierung aus 16 Bits pro Punkt (uint16) durchgeführt. Die Aufzeichnung von bereits 100 Elektroden für 1 Sekunde wiegt also 8 MB. Gleichzeitig dauern die Experimente in der Regel Stunden, was an einem Arbeitstag hunderte Gigabyte ausmacht, und für eine vollwertige Studie benötigen Sie beispielsweise von 10 solcher Datensätze. Daher hängt das Potenzial dieses Beispiels auch stark von den maschinellen Lernalgorithmen ab, die zur Datenanalyse verwendet werden.

Maschinelles Lernen und zelluläre Aktivität


Normalerweise besteht eine Pipeline zur Analyse der Zellaktivität aus Vorverarbeitung, Segmentierung von Spitzen und Clustering. Diese Forschungsarbeit wird im Allgemeinen als Clusteranalyse oder Spikesortierung bezeichnet. Als Vorverarbeitung wird normalerweise eine Niederfrequenzfilterung (> 300 Hz) verwendet, da angenommen wird, dass es keine anderen physiologischen Rhythmen oberhalb von 300 Hz gibt und nur Informationen über die individuelle Zellaktivität übrig bleiben. Auch während der Vorverarbeitung in dichten Abtastwerten ist es möglich, das korrelierte Rauschen, beispielsweise Interferenz bei 50 Hz, zu reduzieren. Die Segmentierung wird meistens als einfache Schwelle angesehen. Zum Beispiel kann alles, was über 5 Standardabweichungen des Rauschens liegt, als Ereignis betrachtet werden. Es kommt vor, dass die Zwei-Schwellensegmentierung mit einem weichen und einem harten Schwellwert verwendet wird, um verwandte Ereignisse in Raum und Zeit hervorzuheben, wie im Algorithmus des Einzugsgebiets (Wasserscheiden-Segmentierung ), nur bei Clustering-Spikes berücksichtigt die Verteilung der Marker die Topologie der Stichprobe. Nach der Segmentierung wird ein Fenster mit einer Dauer von 1-2 ms in der Nähe der Mitte jedes Ereignisses aufgenommen, und das Signal in diesem Fenster, das von allen Kanälen erfasst wird, dient als Abtastwert für das weitere Clustering. Dieses Beispiel wird als Spike-Wellenform bezeichnet. Unterschiedliche Zellen und ihre unterschiedlichen Entfernungen von der Registrierungsstelle führen dazu, dass sich ihre Wellenformen unterscheiden (siehe CDRV). Als Wellenform-Clustering-Algorithmus selbst werden EM, Vorlagenübereinstimmung (Vorlagenübereinstimmung), tiefes Lernen und viele Variationen verwendet ( Thema bei Github)). Die einzige Voraussetzung ist das Lernen ohne Lehrer. Aber es gibt ein Problem. Niemand weiß genau, welche Parameter für Ihre Pipeline erforderlich sind, um die Analyse am effektivsten zu gestalten. Normalerweise durchläuft der Analyst nach dem Clustering die Ergebnisse manuell und nimmt nach Wunsch Änderungen vor. Somit können die Analyseergebnisse sowohl Algorithmusfehler als auch menschliche Fehler enthalten. Und das ist möglicherweise nicht der Fall, daher bleibt die Frage der objektiven Validierung offen.

Die Validierung der Pipeline kann auf verschiedene Arten erfolgen. Erstens durch Ändern der äußeren Bedingungen für den Untersuchungsgegenstand. Wenn Sie beispielsweise während des Experiments den visuellen Kortex studieren, können Sie die Textur, Farbe und Helligkeit des Bildes ändern. Wenn sich in der Analyse eine Zelle befindet, die ihre Aktivität je nach Stimulus ändert, haben Sie Glück. Zweitens können Sie die Aktivität eines bestimmten Zelltyps pharmakologisch steigern oder reduzieren, z. B. durch die Verwendung von Blockern bestimmter Kanäle. Dann nimmt die Aktivität Ihrer Zelle zu oder ab und Sie werden den Unterschied beim Clustering sehen. Diese Modulation der Aktivität führt jedoch auch zu Änderungen in den Wellenformen, da der zeitliche Verlauf des Aktionspotentials vollständig von der Kinetik der Ionenkanäle bestimmt wird. Drittens können Sie wie in diesem Datensatz optogenetisch oder mit einer Patch-Pipette messen oder induzieren die Aktivität bestimmter Zellen. Aufgrund des großen Signal-Rausch-Verhältnisses und der Stabilität der Patch-Elektrode können Sie sich voll und ganz auf die Aktivität einer einzelnen Zelle verlassen. Konzeptionell befasste sich die Veröffentlichung mit dem Zusammenstellen eines validierenden Datensatzes unter Verwendung einer Patch-Klemme.


Abb. Schematische Darstellung der gegenseitigen Anordnung der Probe (AB - Linie) und eine Patchpipette (C'CT Linie) in der Rattenhirnrinde, verantwortlich für die Verarbeitung sensorische Information aus den Vorderpfoten (S1FL = sensorische Kortex 1 forelimb.

Unnötig zu sagen , dass die Arbeit ist methodisch äußerst komplex Denn die Experimentatoren mussten ein Verfahren zur gegenseitigen Anordnung zweier Elektroden in der Großhirnrinde ohne Sichtprüfung mit einer Genauigkeit von ~ 10 μm entwickeln.

Der Effekt der Elektrodendichte auf das Clustering von Spitzen


Warum ist es so wichtig, die Dichte der Registrierungsseiten zu erhöhen? Zur Analogie nehmen wir die unter den EEG-Forschern bekannte Tatsache an, dass ab einer bestimmten Schwelle die Erhöhung der Anzahl der Elektroden in einer Kappe nicht zu einer spürbaren Zunahme der empfangenen Informationen führt, das heißt, das Signal von der Elektrode unterscheidet sich geringfügig von der linearen Interpolation von Signalen benachbarter Elektroden. Jemand sagt, dass diese Schwelle bereits bei 30, jemand bei 50, jemand bei 100 Elektroden erreicht ist. Wer im Detail mit dem EEG arbeitet, kann das korrigieren. Bei zellulärer Aktivität ist jedoch die Dichte der Registrierungsstellen in einer Probe noch nicht bekannt. Daher wird die Konkurrenz von Proben mit hoher Dichte fortgesetzt. Dafür arbeitet das Kampff Lab-Team weiterhin mit der Probe mit einer 5x5-Mikron- 2- Site . Dazu haben wir vorläufige Daten veröffentlicht. Spezialisten, die mit dichten Elektroden arbeiten, teilen die Erfahrung, dass unerwartet die spezifische Anzahl einzelner Zellen, die aus Proben desselben Bereichs isoliert werden können, höher ist, wenn die Dichte der Registrierungsstellen höher ist. Dieser Effekt wird in einer anderen Studie derselben Mitautoren gut veranschaulicht , in der nur ein Teil der Standorte mit dichten Proben künstlich ausgewählt wurde und die Qualität der erhaltenen Cluster nach der tSNE-Konvertierung anhand von PCA-Werten aus Wellenformen der Spikes visuell bewertet wurde. Dies ist kein Kanon für das Clustering, aber es ist gut für die Darstellung von Abhängigkeiten. Als Test wurde der Neuroseeker auf 128 Kanälen mit einer Gesamtgröße von 700 x 70 µm 2 mit einer Fläche von 20 x 20 µm 2 durchgeführt .


Abb. Diagramme tSNE über PCA in nassen Wellenformen mit künstlicher Abnahme der Stationsdichte in der Probe. Arbeitsorte werden schematisch über jedem Diagramm angezeigt. Es wird deutlich gezeigt, wie genau die Anzahl der getrennten Cluster mit zunehmender Ortsdichte wächst, A ist die beste, F ist die schlechteste.

Was ist das Wesentliche an Arbeit?


In den Daten haben Marques-Smith et al. Es werden gleichzeitig Patch-Clamp und Samples aufgenommen. Mit den Daten eines Patch-Clamp fanden Wissenschaftler Momente von Aktionspotentialen und nutzten diese Momente, um bereits im Test vorhandene Wellen zu segmentieren und zu mitteln. Dadurch gelang es ihnen, zeitlich und räumlich sehr hochwertige Verteilungen des Aktionspotentials über die gesamte Probenfläche aufzubauen.


Abb. Links werden Spuren der Zellaktivität gleichzeitig in der Patch-Clamp (schwarz) und auf dem nächsten der Neuropixels-Kanäle (blau) übertragen. In der Mitte - 500 Einzelproben und deren Durchschnitt. Rechts - die Verteilung des Aktionspotentials im Raum über die Probenfläche und in der Zeit.

Weiterhin stellt sich die Frage nach der Variation der extrazellulären Wellenform von Spitze zu Spitze - ja, sie ist greifbar und muss berücksichtigt werden. Sie zeigen dann, dass es grundsätzlich möglich ist, die Ausbreitung des Aktionspotentials über die Zellmembran mit Hilfe seiner dichten Elektroden zu verfolgen, was jedoch bereits in den Arbeiten anderer Gruppen gezeigt wurde. Zusammenfassend bieten sie potenziellen Kooperationspartnern einige grundlegende Fragen aus der Neurophysiologie, die mit Hilfe ihrer Datensätze beantwortet werden können, und schlagen vor, Datensätze zur Validierung der Pipelines für das Clustering der Zellaktivität zu verwenden. Letzteres klingt nach einer kühnen Herausforderung, denn jetzt gibt es viele Cluster-Algorithmen und der Wettbewerb zwischen den Methoden ist sehr groß. Nicht jede Methode arbeitet erstens mit so vielen Kanälen und zweitens

Was weiter


Zum einen ist auch die neue Version von Neuroseeker für 1300 Kanäle mit CMOS-Technologien unterwegs, vorläufige Daten liegen bereits vor .

Zweitens warten wir auf ein weiteres Datenpaket, bereits vom Allen Institute for Brain Science, das auf der FENS-Konferenz im Jahr 2018 angekündigt wurde. Dabei werden vier (!) Neuropixel-Proben gleichzeitig verwendet, um den visuellen Kortex von Mäusen mit verschiedenen visuellen Reizen zu untersuchen. Sie versprachen, Ende 2018 hier neben den Daten auf dem Biphoton (auch sehr mächtigen Datensatz) zu veröffentlichen, bisher aber nichts.

Drittens erscheint mir die Aufgabe, Zellen zu sammeln, um das extrazelluläre Potential zu erfassen, ästhetisch schön. Es konvergiert Methoden der Mikroelektronik, Neurophysiologie und des maschinellen Lernens. Darüber hinaus ist es von grundlegender und angewandter Bedeutung. Ich denke, das Publikum von Habr wird an der technischen Küche der Elektrophysiologie interessiert sein, nämlich an Clustering-Algorithmen, da sich in diesem Bereich bereits ein eigener Zoo entwickelt hat. Ich habe wiederum mehrere Fragen zu diesen Algorithmen gesammelt, aber diese darf nicht übersehen werden. Daher werden wir im nächsten Teil mit der Analyse einiger Algorithmen fortfahren, angefangen beim kanonischen Klustakwik über die Standardmethoden Kilosort oder Spyking Circus bis hin zu YASS, das sich sehr stark deklariertdas funktioniert schneller und besser als jeder andere, weil DL und weil es kann. Ein Github-Thema mit einer Liste einiger Clusterer hier . In Erwartung einiger Fragen sehe ich keinen Sinn darin, meinen eigenen Algorithmus zu entwickeln, da die Konkurrenz bereits sehr groß ist und viele Ideen bereits umgesetzt und von anderen getestet wurden. Aber wenn es mutige Seelen gibt, werde ich gerne dazu beitragen.

Vorschläge und Vorschläge werden akzeptiert. Vielen Dank für Ihre Aufmerksamkeit!

Jetzt auch beliebt: