Andere GitHub: Data Science Repositories, Datenvisualisierungen und Deep Learning Repositories


    ( c )

    Github ist nicht nur eine Plattform für das Hosting und die gemeinsame Entwicklung von IT-Projekten, sondern auch eine riesige Wissensbasis, die von Hunderten von Experten zusammengestellt wird. Glücklicherweise bietet der Service nicht nur Werkzeuge für das Arbeiten mit Open Source, sondern auch hochwertige Materialien für die Schulung. Wir haben einige beliebte Repositories ausgewählt und nach absteigender Anzahl der Sterne sortiert.

    Mit dieser Auswahl können Sie herausfinden, auf welche Repositorys Sie achten sollten, wenn Sie an Daten arbeiten und im Bereich des tiefen Lernens interessiert sind.

    Datenwissenschaft


    The Open Source Data Science Masters
    Sterne: 11.227, Gabeln: 4.737

    Das offizielle Repository des Data Science Masters- Lehrplans, entwickelt als Alternative zu der formalen Open-Source-Ausbildung im Bereich Data Science. Das Repository ist eine Sammlung von Lehrmaterial, das über mehrere Jahre gesammelt wurde.

    Awesome Data Science
    Sterne: 9.240, Gabeln: 2,761

    Eine leistungsstarke Sammlung, die die Fragen beantwortet: "Was ist Data Science?" Und "Was müssen Sie wissen, um sich in dieser Wissenschaft gut auskennen zu können?". Günstig kategorisiert. Zum Beispiel gibt es eine Liste mit Büchern über Data Science, eine Auswahl von Infografiken und sogar thematische Gruppen auf Facebook .

    Jupyter Interactive Notebook
    Sterne: 5,242, Gabeln: 2,313 Der

    Vorläufer dieses Repositorys ist eine Plattform für die Arbeit mit Skripts in 40 Programmiersprachen, Data Science iPython Notebooks , die mehr als 14.000 Sterne und 4.000 Gabeln gesammelt hat. Die Spezialisten für Datenverarbeitung und maschinelles Lernen nutzten es aktiv für das wissenschaftliche Rechnen.

    Heute ist Jupyter Notebook eine praktische Sammlung von Notepad-Dateien, die aus Absätzen bestehen, in denen Anforderungen geschrieben und ausgeführt werden. Mit Hilfe der eingebauten Visualisierer wird aus einem Notizblock mit Abfragen ein volles Dashboard mit Daten.

    Data Science Blogs
    Sterne: 4,510, für For78: 1,178

    Eine einfache, aber umfangreiche Liste von Lehrmaterialien, alphabetisch sortiert. Hier finden Sie alle gängigen Blogs sowie viele kleine Websites mit nützlichen Informationen (insgesamt sind 251 Ressourcen aufgeführt).

    Data Science-Spezialisierung
    Sterne: 3,114, Gabeln: 27,184

    Der Aufbewahrungsort für den Schulungskurs Data Science an der Johns Hopkins University ist ein sehr beliebter Kurs, der von Roger Pen, Jeff Lick und Brian Kaffo vorbereitet wird. Genauer gesagt umfasst der Coursera Data Science-Lehrplan bei Coursera mehrere miteinander verknüpfte Kurse zu verschiedenen Themen (z. B. R-Programmierung), die sich mit verschiedenen Aspekten der Datenanalyse befassen, und das in der Sammlung dargestellte Repository kombiniert Informationen, die in allen Kursen verwendet werden.

    Spark-Notizbuch
    Sterne: 2 677, Forks: 587

    Spark Notebook ist ein Open-Source-Notebook, das einen interaktiven Web-Editor zur Verfügung stellt, der Scala-Code, SQL-Abfragen, Markup und JavaScript zur gemeinsamen Analyse und Untersuchung von Daten kombiniert.

    Learn Data Science
    Sterne: 2.129, Gabeln:

    1.210 Eine Sammlung von iPython-Notebooks, die sich auf grundlegende Konzepte des maschinellen Lernens für Anfänger konzentrieren.

    Data Science an der Befehlszeile
    Sterne: 2,057, Gabeln: 503

    Das Repository enthält die Texte, Daten, Skripts und benutzerdefinierten Konsolenwerkzeuge, die in Data Science an der Befehlszeile verwendet werden". Diese praktische Anleitung zeigt, wie Sie kleine, aber leistungsstarke Befehlszeilentools kombinieren, um Daten schnell abzurufen, zu bereinigen, zu untersuchen und zu simulieren.

    Data Science Specialization Community Site
    Sterne: 1.395, Gabeln: 2.661

    Mehrere Studenten, die an der Johns Hopkins University einen Kurs belegten, erstellten qualitativ hochwertige Inhalte, die von Universitätsmitarbeitern veröffentlicht wurden und einen Katalog für alle interessanten Inhalte der Community erstellten.

    Datenvisualisierung für das Web


    D3
    Stars: 81,837, Forks: 20,282

    D3 ist eine JavaScript-Datenvisualisierungsbibliothek für HTML und SVG. In D3 liegt der Fokus auf Webstandards, sodass Sie alle Funktionen moderner Browser nutzen können, ohne sich an die proprietäre Struktur zu binden, indem Sie leistungsstarke Visualisierungskomponenten, einen geführten Ansatz und die Interaktion mit dem Document Object Model (DOM) kombinieren. Dies ist das beliebteste Datenvisualisierungsprojekt auf GitHub.

    Chart.js
    Sterne: 41 393, fork: 9 294

    Chart.js ist eine HTML5-Bibliothek, die eine Visualisierung über das <Canvas> -Element erstellt. Chart.js positioniert sich als einfaches und flexibles Werkzeug, das interaktiv ist und sechs verschiedene Arten von Diagrammen unterstützt.

    ECharts-
    Sterne: 32 204, Gabel: 9 369

    ECharts ist eine Browser-Bibliothek zur grafischen Darstellung und Visualisierung. Einfach zu bedienen, intuitiv und einfach zu konfigurieren.

    Leaflet
    Sterne 23 810 Gabeln: 3937

    JavaScript - Bibliothek für auf mobile Anwendungen fokussierten interaktive Karten zu erstellen. Der Bibliothekscode ist unglaublich klein - er ist für eine einfache, schnelle und bequeme Verwendung konzipiert. Die Funktionen des Merkblatts können durch eine Reihe von Plug-Ins erweitert werden.

    Sigma.js
    Sterne: 8 348, Gabel: 1 305

    JS-Bibliothek, die sich auf das Zeichnen von Graphen konzentriert. Mit Sigma können Sie Diagrammansichten auf Webseiten erstellen und in Webanwendungen integrieren.

    Vega
    Stars: 6.559, Gabeln: 702

    Vega ist eine deklarative Sprache zum Erstellen, Speichern und Freigeben interaktiver Visualisierungsprojekte. Damit können Sie das Erscheinungsbild und das interaktive Renderverhalten im JSON-Format beschreiben sowie Webansichten mit Canvas oder SVG erstellen. Vega bietet grundlegende Bausteine ​​für eine Vielzahl von Visualisierungsprojekten: Laden und Transformieren von Daten, Skalieren, Kartenprojektionen, Legenden, Grafikbeschriftungen usw.

    DC.js
    Sterne: 6.458 , Gabeln: 1.734

    DC.js ist ein mehrdimensionales Diagramm, das auf D3.js für das Arbeiten mit einem Kreuzfilter aufgebaut ist . DC.js macht das SVG-Format mit CSS kompatibel. Entwickelt für eine leistungsstarke Datenanalyse sowohl im Browser als auch auf mobilen Geräten.

    Epochensterne
    : 4.949, Gabel: 290

    Universelle Visualisierungsbibliothek in Echtzeit. Es konzentriert sich auf zwei verschiedene Aspekte: grundlegende Diagramme zum Erstellen von historischen Berichten und Echtzeitdiagramme zum Anzeigen häufig aktualisierter Zeitreihendaten.

    Tiefes Lernen


    Keras
    Sterne 37 611 Gabeln: 14.344

    Keras - vertieftes Lernen Bibliothek in Python, die in TensorFlow verwendet wird, und in Theano (ja, können Sie es auf den Bibliotheken laufen TensorFlow , Theano und CNTK ). Keras ist für schnelles Experimentieren konzipiert, da der Schlüssel für eine gute Forschung die Fähigkeit ist, mit der geringsten Verzögerung von der Idee zum Ergebnis zu gelangen. Dank der umfassenden und zugänglichen Dokumentation findet Keras zu Recht in unserer Auswahl statt.

    Caffe
    Stars: 26 892, Gabel: 16 276

    Caffe (Faltungsarchitektur für die Feature-Extraktion) ist eine Bibliothek für tiefgreifendes Lernen, die Python und MATLAB miteinander verbindet. Im Wesentlichen handelt es sich hierbei um eine Universalbibliothek, die für die Bereitstellung von Faltungsnetzwerken und für die Bild-, Sprach- oder Multimediaerkennung konzipiert ist.

    Es gibt auch ein Projekt Caffe2, das neue Funktionen enthält, insbesondere wiederkehrende neuronale Netzwerke. Im Mai 2018 fusionierten die Teams Caffe2 und PyTorch, der Caffe2-Code wurde in das PyTorch-Repository verschoben (Sterne: 24.075 , Gabeln: 5.707 ).

    MXNet
    Stars: 16 157, Gabeln: 5 824

    Leichte, kompakte, flexible verteilte Lernumgebung für Python, R, Julia, Scala, Go, JavaScript usw. Für eine höhere Produktivität können Sie in MXNet zwingende und symbolische Programmiermethoden kombinieren. Das Projekt enthält auch Richtlinien zum Erstellen anderer Tiefenlernsysteme.

    Data Science IPython-Notebooks
    Sterne:

    14,747, Gabeln : 4,410 Eine Sammlung von iPython-Notebooks, darunter Big Data, Hadoop, Scikit-Learn, Bibliotheken für das wissenschaftliche Rechnen und vieles mehr und andere Werkzeuge.

    ConvNetJS
    Sterne: 9 510, Gabel: 1 982

    ConvNetJS ist eine Implementierung von neuronalen Netzwerken und ihren üblichen JavaScript-Modulen. Das Projekt wird derzeit nicht unterstützt, ist aber dennoch bemerkenswert. Ermöglicht das Trainieren des Faltungsnetzes (oder regelmäßigen Netzwerks) direkt im Browser.

    Deeplearning4j
    Sterne: 10,227, Anzahl: 4,570

    Deep Learning Library für Java und Scala. Integriert mit Hadoop und Spark. Deeplearning4j ermöglicht auch Berechnungen auf GPUs mit CUDA-Unterstützung. Darüber hinaus gibt es Werkzeuge zum Arbeiten mit der Bibliothek in Python. Das Repository enthält alle erforderlichen Dokumentationen und Tutorials.

    LISA Lab Deep Learning Tutorials
    Sterne: 3.673, Gabeln: 2.045

    Lehrbuch der Universität von Montreal. Die hier vorgestellten Materialien stellen einige der wichtigsten Algorithmen für das tiefe Lernen vor und zeigen das Prinzip der Arbeit mit Theano. Theano ist eine Python-Bibliothek, die das Aufzeichnen von Deep-Learning-Modellen vereinfacht und deren Ausbildung an der GPU ermöglicht.

    Diese Liste ist nicht auf die Anzahl der interessanten auf Gitkhab beschränkt. Nächstes Mal werden wir über maschinelle Lernprojekte und offene Datensätze sprechen. Wenn Sie eigene Beispiele für interessante Repositories haben, teilen Sie sie in den Kommentaren mit.

    Jetzt auch beliebt: