Video: Datenübernahme in der SteuerSparErklärung 2018 2024
Daten werden in verschiedenen Systemen auf unterschiedliche Weise gespeichert. Es ist also keine Überraschung, dass beim Sammeln und Konsolidieren von Daten aus verschiedenen Quellen Duplikate auftreten können. Insbesondere was eine individuelle Aufzeichnung einzigartig macht, ist für verschiedene Systeme unterschiedlich.
Eine Kontokorrentzusammenfassung ist an eine Kontonummer angehängt. Eine Portfoliozusammenfassung könnte auf Einzel- oder Haushaltsebene gespeichert werden. Und die Handelsgeschichten all dieser Konten werden auf der individuellen Transaktionsebene gespeichert.
Es ist wichtig, sich darüber im Klaren zu sein, was einzelne Datensätze in Ihrer Datendatei unterscheiden soll. Wenn es sich beispielsweise um eine Transaktionsdateidatei handelt, werden Kontonummern und Haushalts-IDs dupliziert. Solange Sie das verstehen und eine Transaktionsanalyse durchführen, wird es Ihnen gut gehen.
Wenn Sie jedoch daran interessiert sind, diese Daten zu verwenden, um die Anzahl der Konten in jedem Haushalt zu analysieren, werden Sie auf Probleme stoßen. Die Haushalte, die häufiger handeln, haben mehr Rekorde als jene, die nicht viel traden. Sie benötigen eine Datei auf Kontoebene.
Das Entfernen von doppelten Datensätzen ist nicht besonders schwierig. Die meisten Statistikpakete und Datenbanksysteme verfügen über integrierte Befehle, die Datensätze zusammen gruppieren. (In der Datenbanksprache SQL heißt dieser Befehl "Gruppieren nach".)