Zuhause Persönliche Finanzen Betrugserkennung mit Hadoop - Dummies

Betrugserkennung mit Hadoop - Dummies

Video: The Connected Vehicle: How Analytics Drives Telematics Value 2025

Video: The Connected Vehicle: How Analytics Drives Telematics Value 2025
Anonim

Die schiere Menge an Transaktionen erschwert die Aufdeckung von Betrug aufgrund des Datenvolumens. Ironischerweise kann diese Herausforderung auch dazu beitragen, bessere Betrugsvorhersagemodelle zu schaffen - ein Bereich, in dem Hadoop glänzt.

In der heutigen vernetzten Welt macht es die schiere Menge und Komplexität der Transaktionen schwieriger als je zuvor, Betrug zu finden. Was früher "Nadel im Heuhaufen" genannt wurde, ist die Aufgabe "eine Nadel in Nadeln zu finden". "

Traditionelle Ansätze zur Betrugsprävention sind nicht besonders effizient. Zum Beispiel wird das Management von unangemessenen Zahlungen häufig von Analysten verwaltet, die eine sehr kleine Stichprobe von Ansprüchen prüfen, die mit der Anforderung von medizinischer Dokumentation von zielgerichteten Einreichern gepaart sind. Die branchenübliche Bezeichnung für dieses Modell lautet: "pay and chase": Reklamationen werden entgegengenommen und ausgezahlt, und Prozesse sehen absichtliche oder unbeabsichtigte Überzahlungen durch Überprüfung dieser Forderungen nach Zahlungseingang vor.

Wie funktioniert die Betrugserkennung jetzt? Aufgrund der Beschränkungen traditioneller Technologien werden Betrugsmodelle erstellt, indem Daten gesammelt und anhand der Stichprobe eine Reihe von Betrugsprädiktions- und -ermittlungsmodellen erstellt werden. Wenn Sie dieses Modell einer Hadoop-verankerten Betrugsabteilung gegenüberstellen, die den vollständigen Datensatz - kein Sampling - verwendet, um die Modelle aufzubauen, können Sie den Unterschied erkennen.

Das häufigste wiederkehrende Thema, das Sie in den meisten Hadoop-Anwendungsfällen sehen, ist, dass es Unternehmen dabei unterstützt, durch die Glasdecke die Menge und Vielfalt der Daten zu durchbrechen, die in die Entscheidungsfindung einbezogen werden können. Je mehr Daten Sie haben (und je mehr Sie speichern), desto besser können Ihre Modelle sein.

Wenn Sie nicht traditionelle Daten mit Ihren historischen Transaktionen kombinieren, können Sie Ihre Betrugsmodelle noch robuster gestalten. Wenn zum Beispiel ein Arbeitnehmer einen Schadensersatzanspruch eines Arbeitnehmers wegen eines schlechten Rückens aufgrund eines Fall-und-Fall-Vorfalls geltend macht, hilft ein Pool von Millionen von Patienten-Ergebnisfällen, die die Behandlung und die Dauer der Wiederherstellung detailliert darstellen.

Als Beispiel dafür, wie dieses Modell funktionieren kann, stellen Sie sich vor, herauszufinden, ob sich Patienten in ländlichen Gebieten langsamer erholen als in städtischen Gebieten. Beginnen Sie mit der Untersuchung der Nähe zu physiotherapeutischen Diensten. Gibt es eine Musterkorrelation zwischen Wiederherstellungszeiten und geografischem Standort?

Wenn Ihre Betrugsabteilung feststellt, dass eine bestimmte Verletzung drei Wochen dauert, aber ein Landwirt mit der gleichen Diagnose eine Stunde von einem Physiotherapeuten entfernt lebt und der Büroangestellte einen Praktizierenden in seinem Büro hat, ist das eine weitere Variable, die zum Betrug hinzugefügt wird. -Detektionsmuster.

Wenn Sie Daten aus sozialen Netzwerken für Antragsteller sammeln und feststellen, dass ein Patient, der behauptet, von einem Schleudertrauma betroffen zu sein, mit dem Abschluss der robusten Serie von Ausdauerereignissen, bekannt als Tough Mudder, prahlt, ist dies ein Beispiel für das Mischen neuer Daten mit traditionellen Datenformen. Betrug zu erkennen.

Wenn Sie Ihre Betrugserkennungsanstrengungen auf einen höheren Level bringen möchten, kann Ihre Organisation sich von der Marktsegmentmodellierung entfernen und sich auf die Modellierung auf Geschäftsbasis oder auf der persönlichen Ebene hin bewegen.

Ganz einfach, eine Prognose basierend auf einem Segment ist hilfreich, aber eine Entscheidung basierend auf bestimmten Informationen über eine einzelne Transaktion ist (offensichtlich) besser. Dazu arbeiten Sie einen größeren Datensatz auf, als dies im traditionellen Ansatz herkömmlich möglich ist. Nur (maximal) 30 Prozent der verfügbaren Informationen, die für die Betrugsmodellierung nützlich sein können, werden verwendet.

Zum Erstellen von Betrugserkennungsmodellen eignet sich Hadoop gut für

  • Handle volume: Das bedeutet, dass der gesamte Datensatz verarbeitet wird - keine Datenabtastung.

  • Verwalten neuer Arten von Daten: Beispiele sind die Einbeziehung von Care-Near-to-Care-Diensten und sozialen Kreisen zur Verzierung des Betrugsmodells.

  • Behalten Sie eine agile Umgebung bei: Aktivieren Sie verschiedene Arten von Analysen und Änderungen an vorhandenen Modellen.

Fraud-Modellierer können neue Variablen zum Modell hinzufügen und testen, ohne dem Datenbankadministratorteam einen Vorschlag unterbreiten zu müssen, und dann ein paar Wochen warten, bis eine Schemaänderung genehmigt und in ihre Umgebung eingefügt wird.

Dieser Prozess ist für die Betrugserkennung von entscheidender Bedeutung, da dynamische Umgebungen häufig zyklische Betrugsmuster aufweisen, die in Stunden, Tagen oder Wochen auftreten und gehen. Wenn die Daten, mit denen neue Betrugserkennungsmodelle identifiziert oder unterstützt werden, nicht sofort verfügbar sind, kann es zu dem Zeitpunkt, zu dem Sie diese neuen Muster entdecken, zu spät sein, um Schäden zu verhindern.

Bewerten Sie den Vorteil für Ihr Unternehmen, dass Sie nicht nur umfassendere Modelle mit mehr Datentypen erstellen, sondern diese Modelle schneller als je zuvor aktualisieren und verbessern können. Das Unternehmen, das Modelle täglich erneuern und verbessern kann, wird besser abschneiden als diejenigen, die es vierteljährlich tun.

Sie können glauben, dass dieses Problem eine einfache Antwort hat - fragen Sie Ihren CIO einfach nach Betriebsausgaben (OPEX) und Investitionsausgaben (CAPEX), um mehr Daten aufzunehmen, um bessere Modelle zu erstellen und die anderen 70 Prozent der Daten in Ihre Entscheidungsmodelle.

Sie glauben sogar, dass sich diese Investition durch eine bessere Betrugserkennung amortisiert. Das Problem bei diesem Ansatz besteht jedoch in den hohen Vorlaufkosten, die in unbekannte Daten versenkt werden müssen, wo Sie nicht wissen, ob sie wirklich wertvolle Einsichten enthalten.

Wenn Sie beispielsweise die Größe Ihres Data Warehouses verdreifachen, erhalten Sie mehr Zugriff auf strukturierte historische Daten, um Ihre Modelle feinabzustimmen, aber Social Media Bursts können nicht berücksichtigt werden. Traditionelle Technologien sind auch nicht so wendig. Hadoop macht es einfach, neue Variablen in das Modell einzuführen. Wenn sich herausstellt, dass keine Verbesserungen am Modell vorgenommen werden, können Sie die Daten einfach verwerfen und weitermachen.

Betrugserkennung mit Hadoop - Dummies

Die Wahl des Herausgebers

Anzeigen von elektrischen Signalen an einem Oszilloskop - Dummies

Anzeigen von elektrischen Signalen an einem Oszilloskop - Dummies

Ein Oszilloskop ermöglicht das Anzeigen eines elektrischen Signals durch Anzeigen einer Spannung. variiert mit der Zeit als eine Spur über eine Anzeige. Die vertikale Achsenspannung zeigt die Größe der Spannung (auch Amplitude genannt) an, und die horizontale Achse repräsentiert die Zeit. (Denken Sie daran, Gleichungen in Mathematik-Klasse zu zeichnen? Nun, die Anzeige auf einem Bereich ist wirklich ...

Eintauchen in DX-ing - Dummies

Eintauchen in DX-ing - Dummies

Drücken Sie Ihre Station, um Kontakte über immer größere Entfernungen herzustellen (DX bedeutet entfernte Stationen ist die zweitälteste Aktivität im gesamten Amateurfunk. Irgendwo im Äther ist eine Station immer nur verlockend außer Reichweite und die Herausforderung, diese Station zu kontaktieren, ist der Zweck von DX-ing. Tausende von Schinken über ...

Steuern Sie Ihre Elektronik über einen Parallelport - Dummies

Steuern Sie Ihre Elektronik über einen Parallelport - Dummies

Werfen Sie nicht weg alter Computer! Wenn es einen Parallelport hat, können Sie damit Ihre elektronischen Gadgets steuern. Bis vor einigen Jahren waren alle Computer mit einem parallelen Anschluss ausgestattet, der hauptsächlich zum Anschluss an einen Drucker verwendet wurde. Heutzutage verbinden sich die meisten Drucker über USB-Ports mit Computern. Der Parallelport ...

Die Wahl des Herausgebers

Neuro-linguistisches Programmieren: Zu Deinem Selbst Selbst Seien Wahr - Attrappen

Neuro-linguistisches Programmieren: Zu Deinem Selbst Selbst Seien Wahr - Attrappen

Fahren nicht durch dein Leben mit einem Fuß auf der Bremse, weil du versuchst, den Erwartungen anderer Menschen gerecht zu werden. Persönliche Verantwortung und echtes Autofahren ist viel einfacher, wenn man versteht, wer man im Mittelpunkt steht und was man im Leben erreichen will. Sie können Maßnahmen ergreifen, wenn Sie ...

Bewegen Jenseits von Typ A: Abheben der Uhr - Dummies

Bewegen Jenseits von Typ A: Abheben der Uhr - Dummies

Typ A sind von der Zeit besessen. "Das nimmt zu viel Zeit in Anspruch" "Verdammt, es wird spät - ich werde nie pünktlich fertig sein." "Ich wünschte, sie würden sich beeilen. "Typ A hat ein beschleunigtes Zeitgefühl. Sie fühlen, wie die Zeit im Laufe des Tages immer mehr "abrutscht". Dies führt zu einem ...

Stimmung Störungen und ihre Behandlung Medikamente - Dummies

Stimmung Störungen und ihre Behandlung Medikamente - Dummies

Stimmungsstörungen, auch als affektive Störungen bekannt, sind eine Gruppe von Krankheiten gekennzeichnet durch eine deutliche Veränderung des emotionalen Zustandes einer Person. Die drei häufigsten Stimmungsstörungen sind bipolare Störung, Dysthymie und Major Depression. Stimmungsstörungen betreffen fast 21 Prozent der Erwachsenen in den Vereinigten Staaten. Die meisten Betroffenen finden jedoch ein gewisses Maß an ...

Die Wahl des Herausgebers

So ​​wählen Sie die von Ihnen benötigten AWS-Dienste aus - Attrappen

So ​​wählen Sie die von Ihnen benötigten AWS-Dienste aus - Attrappen

Denken Sie daran, dass Sie nur 12 Monate frei haben Entscheidungsprozess darüber, welche AWS-Dienste (Amazon Web Services) in Ihrem Unternehmen verwendet werden sollen. Zwölf Monate mögen sehr viel Zeit in Anspruch nehmen, aber Sie werden feststellen, dass es vor Ihren Augen verdunstet, wenn Sie versuchen, Ihre täglichen Aufgaben, Meetings, ... zu bewältigen.

Amazon Web Services für Dummies Cheat Sheet - Dummies

Amazon Web Services für Dummies Cheat Sheet - Dummies

Amazon Web Services (AWS) ist ein Cloud-Dienstanbieter, der bietet einfachen Zugriff auf eine Vielzahl von nützlichen Computerressourcen, die alle auf bedarfsgerechte, kosteneffiziente Weise angeboten werden. Wenn Sie ein IT-Praktiker sind, der bereit ist, Amazon Web Services zu nutzen, brechen Sie Ihre alten Anwendungsmuster-Gewohnheiten und implementieren Sie neue Ansätze, die AWS-Eigenschaften und ...

AWS-Sicherheitsprobleme - Dummies

AWS-Sicherheitsprobleme - Dummies

Für die Verwendung von AWS (Amazon Web Services) müssen Sie die Sicherheit Ihres Computers in einem Weg. Administratoren und Sicherheitsexperten können sich schnell verrückt machen, wenn sie versuchen, diese miteinander verbundenen Computer sicher zu halten, aber das ist Teil der Stellenbeschreibung. Sie müssen Best Practices bei der Sicherung der Computersysteme und der darin enthaltenen Daten befolgen.