Video: The Connected Vehicle: How Analytics Drives Telematics Value 2024
Die schiere Menge an Transaktionen erschwert die Aufdeckung von Betrug aufgrund des Datenvolumens. Ironischerweise kann diese Herausforderung auch dazu beitragen, bessere Betrugsvorhersagemodelle zu schaffen - ein Bereich, in dem Hadoop glänzt.
In der heutigen vernetzten Welt macht es die schiere Menge und Komplexität der Transaktionen schwieriger als je zuvor, Betrug zu finden. Was früher "Nadel im Heuhaufen" genannt wurde, ist die Aufgabe "eine Nadel in Nadeln zu finden". "
Traditionelle Ansätze zur Betrugsprävention sind nicht besonders effizient. Zum Beispiel wird das Management von unangemessenen Zahlungen häufig von Analysten verwaltet, die eine sehr kleine Stichprobe von Ansprüchen prüfen, die mit der Anforderung von medizinischer Dokumentation von zielgerichteten Einreichern gepaart sind. Die branchenübliche Bezeichnung für dieses Modell lautet: "pay and chase": Reklamationen werden entgegengenommen und ausgezahlt, und Prozesse sehen absichtliche oder unbeabsichtigte Überzahlungen durch Überprüfung dieser Forderungen nach Zahlungseingang vor.
Wie funktioniert die Betrugserkennung jetzt? Aufgrund der Beschränkungen traditioneller Technologien werden Betrugsmodelle erstellt, indem Daten gesammelt und anhand der Stichprobe eine Reihe von Betrugsprädiktions- und -ermittlungsmodellen erstellt werden. Wenn Sie dieses Modell einer Hadoop-verankerten Betrugsabteilung gegenüberstellen, die den vollständigen Datensatz - kein Sampling - verwendet, um die Modelle aufzubauen, können Sie den Unterschied erkennen.
Das häufigste wiederkehrende Thema, das Sie in den meisten Hadoop-Anwendungsfällen sehen, ist, dass es Unternehmen dabei unterstützt, durch die Glasdecke die Menge und Vielfalt der Daten zu durchbrechen, die in die Entscheidungsfindung einbezogen werden können. Je mehr Daten Sie haben (und je mehr Sie speichern), desto besser können Ihre Modelle sein.
Wenn Sie nicht traditionelle Daten mit Ihren historischen Transaktionen kombinieren, können Sie Ihre Betrugsmodelle noch robuster gestalten. Wenn zum Beispiel ein Arbeitnehmer einen Schadensersatzanspruch eines Arbeitnehmers wegen eines schlechten Rückens aufgrund eines Fall-und-Fall-Vorfalls geltend macht, hilft ein Pool von Millionen von Patienten-Ergebnisfällen, die die Behandlung und die Dauer der Wiederherstellung detailliert darstellen.
Als Beispiel dafür, wie dieses Modell funktionieren kann, stellen Sie sich vor, herauszufinden, ob sich Patienten in ländlichen Gebieten langsamer erholen als in städtischen Gebieten. Beginnen Sie mit der Untersuchung der Nähe zu physiotherapeutischen Diensten. Gibt es eine Musterkorrelation zwischen Wiederherstellungszeiten und geografischem Standort?
Wenn Ihre Betrugsabteilung feststellt, dass eine bestimmte Verletzung drei Wochen dauert, aber ein Landwirt mit der gleichen Diagnose eine Stunde von einem Physiotherapeuten entfernt lebt und der Büroangestellte einen Praktizierenden in seinem Büro hat, ist das eine weitere Variable, die zum Betrug hinzugefügt wird. -Detektionsmuster.
Wenn Sie Daten aus sozialen Netzwerken für Antragsteller sammeln und feststellen, dass ein Patient, der behauptet, von einem Schleudertrauma betroffen zu sein, mit dem Abschluss der robusten Serie von Ausdauerereignissen, bekannt als Tough Mudder, prahlt, ist dies ein Beispiel für das Mischen neuer Daten mit traditionellen Datenformen. Betrug zu erkennen.
Wenn Sie Ihre Betrugserkennungsanstrengungen auf einen höheren Level bringen möchten, kann Ihre Organisation sich von der Marktsegmentmodellierung entfernen und sich auf die Modellierung auf Geschäftsbasis oder auf der persönlichen Ebene hin bewegen.
Ganz einfach, eine Prognose basierend auf einem Segment ist hilfreich, aber eine Entscheidung basierend auf bestimmten Informationen über eine einzelne Transaktion ist (offensichtlich) besser. Dazu arbeiten Sie einen größeren Datensatz auf, als dies im traditionellen Ansatz herkömmlich möglich ist. Nur (maximal) 30 Prozent der verfügbaren Informationen, die für die Betrugsmodellierung nützlich sein können, werden verwendet.
Zum Erstellen von Betrugserkennungsmodellen eignet sich Hadoop gut für
-
Handle volume: Das bedeutet, dass der gesamte Datensatz verarbeitet wird - keine Datenabtastung.
-
Verwalten neuer Arten von Daten: Beispiele sind die Einbeziehung von Care-Near-to-Care-Diensten und sozialen Kreisen zur Verzierung des Betrugsmodells.
-
Behalten Sie eine agile Umgebung bei: Aktivieren Sie verschiedene Arten von Analysen und Änderungen an vorhandenen Modellen.
Fraud-Modellierer können neue Variablen zum Modell hinzufügen und testen, ohne dem Datenbankadministratorteam einen Vorschlag unterbreiten zu müssen, und dann ein paar Wochen warten, bis eine Schemaänderung genehmigt und in ihre Umgebung eingefügt wird.
Dieser Prozess ist für die Betrugserkennung von entscheidender Bedeutung, da dynamische Umgebungen häufig zyklische Betrugsmuster aufweisen, die in Stunden, Tagen oder Wochen auftreten und gehen. Wenn die Daten, mit denen neue Betrugserkennungsmodelle identifiziert oder unterstützt werden, nicht sofort verfügbar sind, kann es zu dem Zeitpunkt, zu dem Sie diese neuen Muster entdecken, zu spät sein, um Schäden zu verhindern.
Bewerten Sie den Vorteil für Ihr Unternehmen, dass Sie nicht nur umfassendere Modelle mit mehr Datentypen erstellen, sondern diese Modelle schneller als je zuvor aktualisieren und verbessern können. Das Unternehmen, das Modelle täglich erneuern und verbessern kann, wird besser abschneiden als diejenigen, die es vierteljährlich tun.
Sie können glauben, dass dieses Problem eine einfache Antwort hat - fragen Sie Ihren CIO einfach nach Betriebsausgaben (OPEX) und Investitionsausgaben (CAPEX), um mehr Daten aufzunehmen, um bessere Modelle zu erstellen und die anderen 70 Prozent der Daten in Ihre Entscheidungsmodelle.
Sie glauben sogar, dass sich diese Investition durch eine bessere Betrugserkennung amortisiert. Das Problem bei diesem Ansatz besteht jedoch in den hohen Vorlaufkosten, die in unbekannte Daten versenkt werden müssen, wo Sie nicht wissen, ob sie wirklich wertvolle Einsichten enthalten.
Wenn Sie beispielsweise die Größe Ihres Data Warehouses verdreifachen, erhalten Sie mehr Zugriff auf strukturierte historische Daten, um Ihre Modelle feinabzustimmen, aber Social Media Bursts können nicht berücksichtigt werden. Traditionelle Technologien sind auch nicht so wendig. Hadoop macht es einfach, neue Variablen in das Modell einzuführen. Wenn sich herausstellt, dass keine Verbesserungen am Modell vorgenommen werden, können Sie die Daten einfach verwerfen und weitermachen.