Dokumentation
Erste Schritte¶
Klick | Ansicht |
---|---|
nach dem Einloggen | rechts: die Datensatztypen Ride und Zone |
rechts: Ride | links: die Ansicht des ersten Datensatzes mit den Attributen einer Taxifahrt und dem jeweiligen Wert, der dem Attribut entspricht |
links: Datensatzmenü bei total_amount -> Feldinhaltsliste öffnen | rechts: es öffnet sich die Ansicht von 6079 verschiedenen Beträgen (in $), die im erhobenen Zeitraum gezahlt wurden. Unter Anzahl sieht man, wie häufig ein Betrag kassiert wurde, unter Anzahl*total_amount das Produkt aus Anzahl und total_amount |
rechts: Scrollbalken | ermöglicht das schnelle Scrollen von oben nach unten und umgekehrt und gibt einen schnellen Überblick über die verschiedenen Werte |
rechts: (rote) Pfeiltaste bei total_amount(F11,F,2) | ermöglicht das schnelle Scrollen zum Umsortieren vom höchsten zum niedrigsten Wert und umgekehrt |
rechts: schwarze Balkenleiste | öffnet jeweils ein Auswahlfenster für verschiedene Aktionen |
rechts: Kästchen anwählen (z.B. 1, 13, 14 und 18) -> Auswahlfenster unter Anzahl oder total_amount -> ∑ Summe mark. | es öffnet sich ein Pop-up Fenster mit der entsprechenden Summe |
Ausreißer¶
Klick | Ansicht |
---|---|
nach dem Einloggen | rechts: die Datensatztypen Ride und Zone |
rechts: Ride | links: die Ansicht des ersten Datensatzes mit den Attributen einer Taxifahrt und dem jeweiligen Wert, der dem Attribut entspricht |
links: Datensatzmenü bei trip_distance -> Feldinhaltsliste öffnen | rechts: es öffnet sich die Ansicht von 3962 verschiedenen Meilenangaben, und man erkennt in der Spalte Anzahl, wie häufig eine Distanz vorkommt |
rechts: schwarze Balkenleiste - trip_distance[F12,F,2] | rechts: es öffnet sich ein Auswahlfenster |
rechts: im Auswahlfenster Sortieren absteigend (Scrollbalken nutzen, um ganz hoch zu scrollen) | an Position 1 wird die längste gefahrene Strecke angezeigt: 269.803,73 -> das erscheint auffällig! |
oben rechts: unter Suche im Auswahlfenster -> Analyse Top -> im Nachbarfenster 100 eingeben -> mit Kreispfeil bestätigen | die 100 am häufigsten vorkommende Werte |
oben rechts: unter Suche im Auswahlfenster -> Analyse Top % -> im Nachbarfenster ist 80 % voreingestellt (Pareto-Analyse) -> Kreispfeil | der Anteil eines Wertes am Datenbestand des zuvor gewählten Feldes trip_distance[F12,F,2] |
Diese Analyse verschafft einen Überblick über die häufigsten Werte und hilft beim Abschätzen von normalen Werten. |
Profiler¶
Klick | Ansicht |
---|---|
nach dem Einloggen | rechts: die Datensatztypen Ride und Zone |
rechts: Ride | links: die Ansicht des ersten Datensatzes mit den Attributen einer Taxifahrt und dem jeweiligen Wert, der dem Attribut entspricht |
beliebiges Attribut anwählen und Feldinhaltsliste öffnen | es öffnet sich die Ansicht der Werte für das angewählte Attribut |
im Auswahlfenster unter Suche(Alle) Profiler anwählen und mit blauem Kreispfeil bestätigen | Profiler der Feldinhaltsliste des ausgewählten Attributs: Anzahl der Datensätze, verschiedene Einträge, seltenster, häufigster, kürzester und längster Eintrag, weitere Infos, die ersten und die letzten 5 Einträge sowie bei Zahlenwerten eine Benford-Reihenfolge |