Wie man Risiken in der staatlichen Kontrolle erkennt und warum für dieses maschinelle Lernen



    Im vorigen Artikel zum Thema staatliches Risikomanagement haben wir die Grundlagen erläutert: Warum sollten staatliche Behörden Risiken managen, wo sie suchen und wie beurteilt werden? Heute werden wir über den Prozess der Risikoanalyse sprechen: wie man die Ursachen ihres Auftretens identifiziert und Übertreter identifiziert.

    Risikobewertung


    Um das Risiko einzuschätzen, müssen Sie - auch im Rahmen eines statischen, wenn auch dynamischen Ansatzes - die Ursachen und die Bedingungen des Auftretens ermitteln und die wichtigsten Merkmale bestimmen: die Wahrscheinlichkeit und den potenziellen Schaden durch die Umsetzung.

    Nehmen wir zum Beispiel die Zollabfertigung: Bei der Einfuhr eines Produkts in das Land muss mit Ausnahme einer Vielzahl unterschiedlicher Informationen (Kosten, Gewicht, Verpackung, Absender, Empfänger usw.) eine Erklärung in der Erklärung eines speziellen Klassifikators abgegeben werden - der Warennomenklatur der ausländischen Wirtschaftstätigkeit (TN FEA). Nach diesem Code für die Ware wird der Zoll dann nach dem Zolltarif (FEA CN + Sätze) ermittelt.

    Der Zolltarif ist ein komplexer Klassifikator: Auf den ersten Blick können einige Waren unterschiedlichen Codes mit unterschiedlichen Zollsätzen zugeordnet werden. Zum Beispiel können Sie sich mit komplexen Bergbaumaschinen nur befassen, indem Sie sich mit deren Zeichnungen befassen. Daher die Versuchung des Importeurs, den falschen (aber der Wahrheit ähnlichen) Code zu deklarieren, um weniger Geld für das Budget auszugeben.

    Also haben wir das Risiko identifiziert - die Angabe eines unzuverlässigen Produktcodes in der Erklärung, um die Zollzahlungen zu unterschätzen. Der Grund ist das Vorhandensein von Grenzpositionen mit unterschiedlichen Zollsätzen im Klassifikator.

    Es ist schwieriger, die Bedingungen für den Eintritt eines solchen Risikos zu ermitteln - wann und mit welchen Gütern dies in der Praxis geschieht. Führen Sie dazu eine Risikoanalyse durch: Die Beobachtungshistorie von Kontrollobjekten untersuchen, herausfinden, wann und wer den falschen Produktcode angefordert hat, und einige allgemeine Merkmale dieser Fälle hervorheben. Auf diese Weise können Regeln für das künftige Risikomanagement formuliert werden: Welche Objekte werden wir dem Risiko zuordnen und welcher Prüfung wird es unterzogen.

    Der einfachste Weg, diese Regeln zu erhalten, besteht darin, dem Expertenurteil Ihrer Mitarbeiter zu vertrauen.

    Expertenregeln


    Solche Regeln zur Identifizierung von Risiken sind Fachspezialisten. Sie lassen sich von ihrer Arbeitserfahrung leiten oder fassen die Meinungen der Kollegen zusammen, die jeden Tag auf Verstöße stoßen. Das Ergebnis sind einfache Urteile der Form „wenn ... dann ...“.

    Die Eintrittswahrscheinlichkeit des Risikos und der potenzielle Schaden durch die Bedrohung werden in diesem Fall „per Auge“ oder durch grobe Schätzungen bestimmt.

    Der Vorteil von Expertenregeln ist die einfache Erstellung und Interpretation durch den Menschen. Der Nachteil ist, dass unter der Herrschaft der Herrschaft gleichzeitig eine große Anzahl von Personen fallen kann - sowohl Verletzer als auch seriöse Subjekte wirtschaftlicher Tätigkeit. Daher ist die Wirksamkeit der Kontrolle gering. Gleichzeitig werden einige Übertreter vorbeigehen, bei denen der Experte die Muster nicht erkennen und berücksichtigen konnte.

    Eine Expertenregel für die Zollkontrolle besagt beispielsweise, dass alle Partien von Äpfeln mit einem Wert unter einem bestimmten Schwellenwert sich auf Risikolieferungen beziehen:



    Wenn wir eine Kontrolle durchführen, finden wir sowohl Waren mit Unregelmäßigkeiten (rot) als auch ganz normale Lieferungen (grün) niedrig Die Kosten werden durch individuelle Preisnachlässe, den Kampf des Absenders mit Überbeständen oder das Wirtschaftsmodell der Unternehmen erklärt.

    Alles, was über dieser Bedingungsschwelle (rote Linie) liegt, ist außer Kontrolle (graue Kreise). Aber wenn wir sie auch überprüfen, werden wir sowohl wirklich legitime Lieferungen als auch Lieferungen finden, deren tatsächlicher Wert noch höher ist als in der Erklärung angegeben (graue Kreise mit einem roten gestrichelten Umriss) und für die die Zollzahlungen nicht vollständig bezahlt werden.

    Daher führt die Anwendung von Expertenregeln in der Regel zu einer übermäßigen Abdeckung von Kontrollobjekten und zu geringer Leistung (denken Sie daran, unsere Boxen aus dem ersten Artikel?):



    Machen Sie Experten keine Vorwürfe: Das menschliche Bewusstsein ist in den Objekten begrenzt, mit denen es arbeiten kann (ein interessanter Artikel wurde auf Habré veröffentlicht) , deren Autor vorschlug, dass ihre Zahl auf sieben begrenzt ist). Daher die großen Striche statt der genauen Details: Die Brandgefahr wird zum Beispiel nur durch das Baujahr, den Standort und die Kategorie der Bewohner bestimmt. Alle diese Eigenschaften wurden einmal „gespielt“: In einem alten Haus brach ein Feuer aus, in einem gestörten Bereich brannte ein Raum. Experten erwarten daher zukünftige Bedrohungen genau von Objekten dieser Art.

    Aber nicht alle diese „gefährlichen“ Gebäude werden tatsächlich niederbrennen, auch wenn sie unter die Expertenregel fallen: Viele alte Holzhäuser stehen, als wäre nichts passiert. Einige funktionsgestörte Häuser stehen seit Jahren ohne Feuer. Es ist nur so, dass der Experte einige subtile individuelle Merkmale gefährlicher Objekte nicht berücksichtigen konnte.

    Hier kommt maschinelles Lernen ins Spiel, mit dessen Hilfe statistische Risikoprofile erstellt werden können . Sie entstehen, wenn wir Datenanalysetechnologien auf die Geschichte von Verstößen und Informationen über kontrollierte Objekte anwenden.

    Statistische Risikoprofile


    In diesem Fall lösen wir das Problem der binären Klassifikation: Ein spezieller analytischer Algorithmus bestimmt selbst, welche Eigenschaften der Objekte es ermöglichen, sie „schlecht“ oder „gut“ zuzuordnen. Wenn alles richtig gemacht wird, erhalten wir am Ende ziemlich genaue Risikobewertungen: detaillierte Bedingungen und automatisch berechnete Wahrscheinlichkeit plus potenzieller Schaden (die mit einem fachmännischen Ansatz auch irgendwie "fachmännisch" bestimmt werden). Diese Eigenschaften definieren ein „Risikoprofil“ - was, wo, wann und wie unheimlich.

    Statistische Risikoprofile werden auf verschiedene Arten erstellt. Es kann auf einem Entscheidungsbaum oder einer zufälligen Gesamtstruktur basieren. Sie können ein kniffliges neuronales Netzwerk mit einer großen Anzahl ausgeblendeter Ebenen anwenden.

    Wir bei SAS sind jedoch der Meinung, dass es für die Zwecke der staatlichen Kontrolle besser ist, statistische Risikoprofile auf der Grundlage interpretierter Algorithmen zu erstellen, z. B. Regression oder Entscheidungsbaum . Die Praxis hat gezeigt, dass es für eine staatliche Körperschaft schwierig ist, sich zu orientieren, selbst wenn es sich um eine genaue, aber unverständliche Vorhersage einer Maschine handelt, ohne zu erklären, warum diese angesehene Person als Bösewicht eingestuft wird.

    Die staatliche Behörde muss genau wissen, welche Faktoren die Bedrohung anzeigen und welche der Verstöße dieselben Merkmale aufwiesen, da es Verfahren zur Genehmigung von Führungsentscheidungen gibt (in einem bestimmten Fall handelt es sich um Risikoprofile). Der Beamte muss verstehen, was genau er "in die Schlacht" startet, da er für das Ergebnis des Risikoprofils verantwortlich ist.

    Jede Überprüfung sollte begründet werden und diese Begründung sollte in Worten ausgedrückt werden. Andernfalls muss man sich vor der Staatsanwaltschaft erröten und erklären, wie sich herausstellte, dass die staatliche Behörde das Inlandsgeschäft auf der Grundlage der mysteriösen Anweisungen von deus ex machina „kneift“.

    Daher sieht das statistische Risikoprofil auch nach einer Regel aus, die gelesen und verstanden werden kann. Nur die Liste der Merkmale, die mögliche Verstöße beschreiben, ist immer komplizierter als die von Expertenprofilen:


    * Die Werte der Profilparameter werden geändert und entsprechen nicht den tatsächlichen.

    Eine Reihe von Risikoindikatoren(Bedingungen) mag ein wenig bizarr erscheinen. Dies ist jedoch keine „große Zauberei“. Mit Hilfe von Technologien für maschinelles Lernen und den begrenzten verfügbaren Informationen beschreiben wir ein verborgenes Muster menschlichen Verhaltens, das zu Störungen führt.

    Das Gleiche gilt für die Steuerkontrolle - Verstöße können von der Gesamtmasse der Steuerzahler bestimmte Betragsbereiche bestimmter Umsätze, Fristen für die Einreichung von Meldungen, die Anzahl der Mitarbeiter des Unternehmens, die Anzahl der Konten und weitere 30 verschiedene Parameter unterscheiden, die zusammen skrupellose Unternehmer beschreiben, die die Mehrwertsteuer unterschätzen.

    Eine Person wird nicht in der Lage sein, alle diese Eigenschaften zu vergleichen, sie wird mit drei oder fünf auskommen, die leichter zu verstehen sind. Und das Programm kann. So detailliert wie nötig. Beim Erstellen eines Modells durchläuft der Algorithmus automatisch eine Vielzahl von Daten und findet heraus, was die Täter gemeinsam haben - auch wenn es sich um eine Liebe zu roten Bindungen in einem gelben Netz handelt.

    Dies ähnelt der Beschreibung des Verbrechers in seinen individuellen Merkmalen: der Form der Nase, der Ohren, dem Biegen der Augenbrauen, den Farben der Hemden und der Länge des Fußes. Wir kennen sein Gesicht, seine Größe und sein Gewicht nicht, aber wir haben tausend seiner Merkmale, einschließlich der Länge der Haare an der Phalanx des linken kleinen Fingers. Jeder dieser Parameter gibt keine kriminellen Absichten preis - Sie müssen eine Person nicht nur für den Krümmungsradius ihrer Ohrmuscheln mit Handschellen fesseln. Die Gesamtheit dieser Merkmale bildet jedoch ein ziemlich genaues Porträt des Verstoßes:



    Wenn wir von der Anwendung von Expertenregeln zur statistischen Profilerstellung auf der Grundlage einer Analyse von verborgenen Mustern übergehen, werden offensichtlich ineffektive Überprüfungen beseitigt. Das riesige Feld der kontinuierlichen Kontrolle beschränkt sich auf einen Punkt, der sich auf Objekte auswirkt, die unter das identifizierte fallenunfaires Verhaltensmuster .

    Erinnern Sie sich an Äpfel aus dem obigen Zollbeispiel. Indem wir die Historie der Kontrollen dem Eingang des statistischen Modells vorlegen, erhalten wir ein Risikoprofil, das die Verhaltensmerkmale von Importeuren und Rechtsverletzern berücksichtigt, unabhängig davon, zu welchem ​​Preis sie die Waren deklarieren:


    * Der Satz von Risikoprofilparametern wird geändert und entspricht nicht dem tatsächlichen. Auf

    diese Weise wird das statistische Risikoprofil erstellt Verwendung von Algorithmen der Klasse "Entscheidungsbaum" - jede ihrer Ebenen unterteilt die Menge der getesteten Entitäten zunehmend in "gut" und "schlecht" und zeigt, welche Eigenschaften für den Abschnitt gelten Dies stellte sich als das wichtigste heraus (im Screenshot von SAS Visual Statistics):



    Statistische Profile sind besser als Expertenprofile - genauer, selektiver, unparteiischer. Sie tragen zur Erhöhung der Effektivität von Inspektionen bei, indem sie die Anzahl der Leerlauffehler verringern:



    Das Fehlen statistischer Profile beruht darauf, dass sie sich an den Erfahrungen der Vergangenheit bei der Erkennung von Verstößen orientieren. Zu bekannten Schemata.

    Wenn es in der Geschichte der Zollkontrolle beim Import von Waren zu Understatement gekommen ist, findet der Algorithmus Anzeichen von Verstößen und bildet ein statistisches Risikoprofil. Wenn wir nach neuen Verstößen suchen, die der staatlichen Behörde noch nicht aufgefallen sind und deren Merkmale wir nicht kennen, müssen wir „durch Berührung“ vorgehen - durch Versuch und Irrtum.

    Unbekannte Suche


    Sie können das Unbekannte auf verschiedene Arten fühlen.

    Die erste ist die Zufallsstichprobe . Wir nehmen ein beliebiges Objekt (innerhalb seiner Befugnisse) - ein Produkt, ein Unternehmen, ein Gebäude oder einen Bürger - und prüfen es sorgfältig. Der Ansatz ist relativ unparteiisch, aber nicht zu effektiv - ein seriöses Thema kann genauso gut unter „Nachbesprechung“ fallen. Die Stärke der staatlichen Agentur und das Budget werden vergebens ausgegeben.

    Das zweite ist die Identifizierung von Anomalien . In diesem Fall wird ein Objekt zur Überprüfung herangezogen, dessen Parameter sich von den übrigen unterscheiden. Wenn wir anomale Ereignisse analysieren und nicht nur zufällig eine Reihe von Objekten „stupsen“, ist die Wahrscheinlichkeit, eine Verletzung zu finden, höher.

    Beispielsweise stellt sich bei der Durchführung einer Umweltüberwachung heraus, dass die Anlage unerwartet viel Strom verbraucht:



    Vielleicht sollten Sie sie sich genauer ansehen und prüfen, ob die Anlage mehr Wasser ins Wasser oder in die Luft abgibt als zulässig.

    Oder die Waren am Zoll haben ein ungewöhnliches Verhältnis von Gewicht der Waren und Verpackung:



    Nach der Überprüfung kann sich herausstellen, dass der Importeur mit dem Gewicht „gespielt“ hat, um einige Verstöße zu vertuschen: Die Kosten wurden unterschätzt und wollten daher eine der Überprüfungsmengen verschärfen oder einige Waren unter dem Deckmantel anderer ausgeben. Wenn Sie gut graben, unterscheiden sich die „natürlichen“ Gewichtsmerkmale von den fiktiven.

    Dies sind jedoch die einfachsten Beispiele, die eine Person sehen kann. In Wirklichkeit findet die Suche nach Anomalien in einem mehrdimensionalen Raum von Attributen statt - es können Hunderte von Attributen vorhanden sein. Der Algorithmus macht etwas, was eine Person nicht kann - er findet Objekte, die sich gleichzeitig in einer großen Anzahl von Zeichen signifikant von den anderen unterscheiden, und ermittelt die sogenannten mehrdimensionalen Ausreißer (im Screenshot von SAS Visual Statistics):



    Auch außerhalb der menschlichen Wahrnehmung gibt es eine Vielzahl von rechtlichen Beziehungen zwischen verschiedenen Unternehmen, die mit der Grafik (im Screenshot von SAS Social Network Analysis) dargestellt werden:


    * Namen von Organisationen werden erfunden, Zufälle mit realen Unternehmen sind zufällig

    Ungewöhnliche Eigenschaften weisen nicht unbedingt auf ein Problem hin. Die Prüfung zeigt möglicherweise nichts an: Ja, die Anzeigen sind seltsam, aber es liegt keine Verletzung vor.

    Eine Anomalie ist kein Risiko, sondern „etwas Ungewöhnliches“. Anomalieprofile werden benötigt, um neue „Rohstoffe“ für die Erstellung von Experten- oder Statistikprofilen bereitzustellen, da das Ergebnis der Anomalieüberprüfung in die Beobachtungshistorie der kontrollierten Objekte einbezogen wird.

    Hybrider Ansatz


    Die besten Ergebnisse bei den Kontroll- und Überwachungsaktivitäten staatlicher Stellen (und nicht nur in diesen) lassen sich durch die Kombination aller drei Methoden zur Ermittlung von Risiken erzielen: Expertenregeln, statistische Risikoprofile auf der Grundlage maschineller Lerntechnologien und Anomalieprofile. Gleichzeitig ist es besser, die Abdeckung von Objekten mit Expertenregeln zu verringern und sie nur für gezielte administrative Einflüsse zu belassen (z. B. Sanktionen verhängen - Waren aus diesen Ländern blockieren): Auf



    Expertenregeln kann in der Anfangsphase des Aufbaus eines Risikomanagementsystems nicht verzichtet werden, da die Erstellung von Analysemodellen eine Grundlage erfordert Präzedenzfälle. Um es zu erstellen, müssen Sie Prüfungen auf der Grundlage von Expertenrisikoprofilen durchführen und erst dann mit mathematischen Modellen fortfahren.

    Wir bei SAS glauben, dass die Zukunft der staatlichen Kontroll- und Überwachungstätigkeit auf einem hybriden Ansatz beruht, der die Erfahrung staatlicher Stellen und das Fachwissen seiner Mitarbeiter mit modernen Technologien des maschinellen Lernens kombiniert. In diesem Fall fassen wir die Ergebnisse aller drei Module in einer einzigen integrierten Risikobewertung zusammen:



    Und bereits die integrierte Bewertung (z. B. auf der Grundlage einer Experten-Entscheidungsmatrix) bestimmt die Wahl der Kontrollstelle - wen sie prüfen und wem sie vertrauen soll.

    Im nächsten Artikel analysieren wir Methoden zur Minimierung der identifizierten Bedrohungen und überlegen, warum Feedback und dynamische Risikobewertung so wichtig sind.

    Jetzt auch beliebt: