Inhaltsverzeichnis:
Video: Data Preparation in SAP Analytics Cloud 2024
Tableau kann mit einer Reihe unterschiedlicher Datenquellen arbeiten, abhängig von der Edition von Tableau, die Sie verwenden. lizenziert. Glücklicherweise erzwingen echte Datenbankanwendungen bestimmte Regeln, um sicherzustellen, dass jedes Feld in einem Datensatz den richtigen Datentyp enthält. Benutzer können beispielsweise keinen beliebigen Text in numerischen oder Datumsfeldern eingeben, da dies die ordnungsgemäße Verarbeitung der in der Datenbank enthaltenen Informationen unmöglich macht.
Tableau arbeitet mit Daten, in denen es sich befindet, sei es in einer Datenbank, in Dateien oder sogar in der Cloud. Hier erfahren Sie, wie Sie mit dateibasierten Datenquellen wie Excel-Arbeitsblättern arbeiten. Aufgrund der fehlenden kontrollierten Datenstruktur gibt es Vor- und Nachteile, die Sie kennen sollten.
Mit den Datenvorbereitungsfunktionen
können Excel-Arbeitsblätter irrelevante Informationen enthalten oder Dinge wie leere Spalten in der Mitte der Daten enthalten. Hier ist ein Beispiel für ein Arbeitsblatt mit diesen beiden Problemen.
Beachten Sie, dass Tableau nicht die richtigen Feldnamen anzeigt. Anscheinend werden die Feldnamen als Daten in der ersten Zeile angezeigt (obwohl mehrere Felder null anzeigen, um anzuzeigen, dass der Inhalt aufgrund des Datentyps des Felds ungültig ist). Darüber hinaus scheint das mit F5 gekennzeichnete Feld vollständig mit ungültigen Daten gefüllt zu sein.
Der Grund, warum Tableau Probleme mit den Feldern hat, wird deutlicher, wenn Sie sich das Arbeitsblatt in Excel ansehen. Sie können zusätzliche Zeilen über den Daten und eine leere Spalte innerhalb der Daten sehen. Darüber hinaus enthält das Arbeitsblatt Text in der Zelle A1 über der Datentabelle.
Ein Blick auf das Arbeitsblatt offenbart die Probleme.Tableau möchte, dass Ihre Excel-Tabelle wie eine Datenbanktabelle aussieht. Dies bedeutet, dass erwartet wird, dass die erste Zeile Spaltenüberschriften enthält und jede nachfolgende Zeile Datenwerte für jede Spalte enthält. Es wird erwartet, dass der Datentyp in jeder Spalte konsistent bleibt und keine überflüssigen Leerzeichen oder Text irgendwo in der Kalkulationstabelle eingefügt werden.
Wenn eine dieser Bedingungen erfüllt ist, müssen Sie entweder Ihre Tabelle manuell bereinigen oder den Dateninterpreter von Tableau verwenden.
Zum Glück ist Tableau ziemlich gut darin, ein Problem zu bemerken, und zeigt eine Eingabeaufforderung an, in der Sie gefragt werden, ob das Data Interpreter-Tool versuchen soll, eventuell vorhandene Probleme zu korrigieren. Um zu sehen, ob der Data Interpreter die Probleme beheben kann, klicken Sie einfach auf die Schaltfläche Einschalten der Eingabeaufforderung. Überprüfen Sie die Ergebnisse der Verwendung dieses Tools im Beispielarbeitsblatt.
Der Data Interpreter kann möglicherweise die Probleme beheben.Wenn Sie die verschiedenen Bilder oben vergleichen, sehen Sie, dass Tableau jetzt die richtigen Feldnamen anzeigt, im ersten Datensatz keine Nullwerte mehr hat und die leere Spalte aus den Ergebnissen entfernt hat.
Überprüfen Sie beim Erstellen neuer Verbindungen immer den Datenvorschaubereich, um sicherzustellen, dass die Daten so aussehen, wie Sie es erwarten.
Ausrichtung auf Datenquellen für manuelle Korrekturen
Tableau kann zwar viele häufig auftretende Layout- und Formatierungsprobleme automatisch korrigieren, einige Probleme können jedoch nur manuell korrigiert werden. Im Folgenden finden Sie ein Beispiel für diese Art von Problemen. In diesem Fall wurden die Schiffstermine in den Datensätzen 27 und 28 nicht korrekt eingegeben, sodass sie als Nullwerte und nicht als tatsächliche Daten angezeigt werden. Wenn Sie diese Daten in Tableau verwenden, liefern diese Nullwerte möglicherweise ungültige Ergebnisse.
Die angegebenen Nullen sind auf leere Datensätze in den Quelldaten zurückzuführen.Möglicherweise erkennen Sie nicht, dass Ihre Daten Nullwerte enthalten, bis Sie tatsächlich mit der Analyse beginnen. In diesem Fall meldet Tableau, dass die Tabelle insgesamt 9 994 Datensätze enthält, sodass Sie sich möglicherweise keine Gedanken über zwei Nullwerte machen müssen.
Tableau hilft Ihnen, Nullwerte zu finden, die auch Fehler sein können, die in den Quelldaten korrigiert werden müssen. Obwohl es in den Zeilen 27 und 28 nur zwei NULL-Werte gibt, gibt es noch viel mehr, die Sie ohne Scrollen nicht sehen können.
Nullwerte bedeuten lediglich, dass eine Zeile eine leere Zelle enthält. Dies bedeutet nicht immer, dass ein Fehler in Ihren Daten vorliegt. Tableau ist sich dessen bewusst und bietet Ihnen daher Optionen für den Umgang mit Nullwerten. Ja, Sie können die Informationen verwenden, die Tableau bereitstellt, um Einträge in den Quelldaten zu korrigieren, aber Sie können Tableau auch die Werte mit einer seiner vielen Funktionen adressieren oder Werte mithilfe von Filtern entfernen.