Bildungsprogramm für die Arbeit mit Lochkarten (oder die Geschichte, wie "Big Data" von 1890 bis 1970 verarbeitet wurde)

    In der Zeit von 1890 bis 1970 wurde die gesamte Verarbeitung von Big Data mit Lochkarten durchgeführt. Die Lochkarten wurden wiederum mit sogenannten Karten verarbeitet. "Recording Equipment", dessen zentrales Element der elektromechanische "Lochkarten-Sorter" war. Lochkarten und zugehörige Ausrüstung wurden verwendet, um eine Vielzahl von Aufgaben zu lösen: Volkszählung, Buchhaltung, Inventar, Gehaltsabrechnung usw.


    Wie haben die Leute mit Lochkarten gearbeitet? Welchem ​​Algorithmus folgte der elektromechanische Kartenstempel? Wie haben Sie nach numerischen Datenfeldern sortiert? Und String? Über all das - unten.



    • Ein auffälliges Merkmal des Zeitaufzeichnungsgeräts vor dem Computer: Es war ursprünglich vollständig elektromechanisch. Es gab sogar keine Röhrenelektronik. Der „Intellekt“ des Aufnahmegeräts bestand aus Drahtbürsten (zur Erkennung von Löchern in Lochkarten), einem elektromechanischen Relais und mechanischen Rädern (zum Aufsummieren von Werten). Trotz seiner technologischen Primitivität revolutionierte das „Aufzeichnungsgerät“ einmal die Verarbeitung von Big Data.

    Wie haben die Leute mit Lochkarten gearbeitet?


    • Jede Lochkarte speichert einen Datensatz (bis zu 80 Ziffern oder Zeichen). Jeder Datensatz bestand aus mehreren Feldern. Der Lochkarten-Sortierer ordnete die Karten in der richtigen Reihenfolge für den Bediener (eines der Datenfelder) an, woraufhin die Maschine, die als "Tabulator" bezeichnet wurde, die sortierten Lochkarten las, die erforderlichen Felder daraus extrahierte (wiederum vom Bediener festgelegt) und einen Bericht druckte.
    • Berücksichtigen Sie beispielsweise, wie Lochkarten bei der Verarbeitung von Rechnungen verwendet wurden. Für Unternehmen wurde für jede zur Zahlung ausgestellte Rechnung eine separate Lochkarte bereitgestellt (siehe Beispiel in der folgenden Abbildung). Auf der Lochkarte sind solche Datenfelder wie Lieferantennummer, Zahlungsdatum, Zahlungsbetrag usw. angegeben.
    • Ein geeigneter Geschäftsprozess für die automatisierte Datenverarbeitung ist wie folgt. Der Lochkarten-Sortierer erhält den Befehl, Lochkarten nach Lieferantennummer zu bestellen. Nachdem die Sortierung abgeschlossen ist, werden die Lochkarten zum Tabulator übertragen, der einen Bericht generiert und die erforderliche Zeile von jeder Lochkarte liest. Ein im Tabulator eingebetteter mechanischer Zähler zeigt automatisch den Gesamtbetrag an.
    • Viele andere Geschäftsprozesse wie Lohnabrechnung, Inventur und Abrechnung wurden auf die gleiche Weise in Zeiten vor dem Computer durchgeführt.

    Das Funktionsprinzip des elektromechanischen Lochkartensortierers


    • Der Sortierer nimmt einen Stapel Lochkarten und sortiert sie nach dem vom Bediener angegebenen Datenfeld. Zum Beispiel die Zugehörigkeit von Mitarbeitern zu einer bestimmten Abteilung. Warum? Als Option können Sie, nachdem Sie die Mitarbeiter zuvor nach Abteilungen gruppiert haben, einen Bericht über die Umsetzung des Verkaufsplans durch die einzelnen Abteilungen des Unternehmens erstellen.
    • Um dieses Problem zu lösen, werden Lochkarten zunächst anhand des Felds "Abteilung" sortiert und dann in den Tabulator übertragen, in dem das Feld "Verkauf" zusammengefasst wird, das die Zwischenergebnisse der einzelnen Abteilungen im Bericht druckt.
    • Der Bediener legt die zu löschende Lochkarte in ein spezielles Fach ein, von dem sie einzeln durch den Sortierer gefahren werden. Der Sorter liest Lochkarten und verteilt sie in 13 Taschen: zehn digitale, zwei "zonale" (für die Verarbeitung von Stringwerten); und eine für ausrangierte Lochkarten (auf denen der Wert, nach dem die Sortierung durchgeführt wurde) nicht angegeben ist.
    • Der Algorithmus, mit dem der Lochkarten-Sortierer arbeitet, unterscheidet sich sehr von den heute allgemein anerkannten Algorithmen. Der entscheidende Unterschied ist, dass Lochkarten nicht miteinander vergleichbar sind.

    Algorithmus der bitweisen Sortierung von Zahlen


    Wie schafft es der Lochkarten-Sorter, mit seiner Arbeit fertig zu werden? Es implementiert einen eleganten "bitweisen Sortieralgorithmus". Essenz: Der Lochkarten-Sortierer verarbeitet jeweils eine Ziffer des Datenfelds. Um nach einem dreistelligen Feld zu sortieren, muss ein Stapel Lochkarten dreimal durch den Sortierer geführt werden. Also der Algorithmus:


    1. Durch das Bestellen von Lochkarten nach einem vom Bediener angegebenen numerischen Datenfeld verarbeitet der Sortierer während des ersten Durchlaufs nur das niederwertige Bit dieses Felds. Entsprechend dem Wert dieser Kategorie entscheidet sie, wo die aktuelle Lochkarte abgelegt werden soll: welche der 10 digitalen Taschen (von null bis neun).
    2. Nachdem der Sortierer die Verteilung der Lochkarten in den Taschen abgeschlossen hat, nimmt der Bediener die Karten heraus und faltet sie zu einem gewöhnlichen Stapel zusammen. In der Reihenfolge: von der Nulltasche bis zur neunten.
    3. Der Bediener legt die zusammengebaute Lochkarte erneut in den Sortierer und wiederholt die Schritte 1 und 2 für jede Ziffer nacheinander.
    4. Alles, jetzt gelochte Karten, werden sortiert.


    Vorteile des bitweisen Sortieralgorithmus


    • Der bitweise Sortieralgorithmus ist elegant und schnell. Seine rechnerische Komplexität beträgt O (n log n). Mit anderen Worten, wenn die Anzahl der Karten zunimmt, nimmt die Dauer des Algorithmus linear und nicht exponentiell zu.
    • Der Algorithmus der bitweisen Sortierung kann technisch in Form eines einfachen elektromechanischen Designs implementiert werden.
    • Trotz der Tatsache, dass nicht mehr als 3600 Karten in das Zufuhrfach des Lochkarten-Sortierers eingelegt werden, kann der Drucker eine wesentlich größere Anzahl von Lochkarten sortieren, wenn der Bediener die beiden folgenden Aktionen rechtzeitig ausführt: (1) Neue Lochkarten rechtzeitig in das Fach einlegen; (2) digitale Taschen rechtzeitig zu leeren (damit sie nicht überlaufen).

    So codieren Sie String-Daten


    • Wie oben erwähnt, werden die numerischen Werte auf der Lochkarte mit Löchern codiert. Ein Loch in der Säule. Ihre Sortierung haben wir bereits geregelt. Nun bleibt zu verstehen, wie die Lochkarten die Zeilen kodieren und wie der Lochkarten-Sortierer sie organisiert.
    • Um mit den Zeilen arbeiten zu können, sind im Lochkartensortierer (11. und 12.) zwei Zonentaschen zusätzlich zu den Zehnertaschen vorhanden. Das Prinzip der Codierung alphabetischer Zeichen lautet wie folgt (siehe Abbildung unten). Jeder Buchstabe wird durch zwei Löcher auf einer Lochkarte codiert: ein Loch in der Nummer (von 1 bis 9) und ein Loch in der "Zone" (0, 11 oder 12).
    • Bitte beachten Sie: Der String mit Nullen ist bei der Verarbeitung numerischer Datenfelder digital und bei der Verarbeitung von String-Datenfeldern "zonal".

    Algorithmus zum Sortieren von Zeichenketten


    Dank dieser Kodierung kann der Sorter die String-Datenfelder alphabetisch sortieren. Dafür braucht er zwei Läufe. Der Algorithmus lautet wie folgt:


    1. Beim ersten Durchlauf sortiert der Lochsortierer die Karten ähnlich wie beim Sortieren numerischer Datenfelder. Der Unterschied ist, dass bei der alphabetischen Sortierung nur neun Taschen betroffen sind: vom 1. bis zum 9. Platz.
    2. Wenn die Sortierung abgeschlossen ist, entnimmt der Bediener Lochkarten aus den digitalen Taschen. Wieder in der Reihenfolge (wie bei der Anordnung durch das numerische Datenfeld): beginnend mit der ersten Tasche und endend mit der neunten. Der Bediener sendet das zusammengestellte Kartenpaket ein zweites Mal zum Sortieren.
    3. Im zweiten Durchlauf liest der Lochkarten-Sortierer nur die Zeilen von „Zonen“ (0, 11 und 12) und ignoriert Zeilen mit Zahlen.
    4. Als Ergebnis werden die bestellten Lochkarten vom Sortierer in drei "zonale" Taschen verteilt: Von A bis I werden sie in die 12. Tasche gelegt; von J bis R - im 11.; von S bis Z - bis 0.
    5. Wenn die Sortierung nicht nach einem ersten Zeichen, sondern beispielsweise nach zwei oder drei zuerst durchgeführt werden muss, wird der oben beschriebene Prozess (Schritte 1 bis 4) für jedes Zeichen nacheinander ausgeführt. Ie Für jedes Zeichen werden zwei Läufe durch einen Lochkarten-Sortierer ausgeführt.


    Wenn es also noch keine Computer gab, verarbeiteten Unternehmen große Daten mithilfe von Lochkarten. Trotz der Tatsache, dass Lochkarten unwiederbringlich veraltet sind, haben wir immer noch Einfluss auf den aktuellen Stand der Computertechnologie - immer dann, wenn wir die Textformatierung mit 80 Zeichen langen Zeichenketten in Kauf nehmen müssen. Etwas Ähnliches wird zum Beispiel bei der Arbeit mit Far Manager beobachtet.


    Jetzt auch beliebt: