Από το Power Query στο Dashboard: Οδηγός για Data Cleaning και Data Visualization στο Power BI (Formula 1)

Όταν ένας Analyst καλείται να παρουσιάσει δεδομένα σε μια διοίκηση, το τελικό αποτέλεσμα κρίνεται από δύο παράγοντες: την εγκυρότητα των στοιχείων και την ευκολία με την οποία ο αναγνώστης κατανοεί την πληροφορία. Στον κόσμο των επιχειρήσεων, το εργαλείο που συνδυάζει με τον πιο ιδανικό τρόπο αυτούς τους δύο κόσμους είναι το Microsoft Power BI.

Ωστόσο, η δημιουργία ενός report δεν ξεκινάει ποτέ από τα εντυπωσιακά γραφήματα. Ξεκινάει από το παρασκήνιο. Σε αυτόν τον πρακτικό οδηγό, θα χρησιμοποιήσουμε τα ιστορικά δεδομένα των πρωταθλημάτων της Formula 1 (1950-2025) για να δούμε όλη τη διαδρομή: από το Data Cleaning (καθαρισμός δεδομένων) στο Power Query, μέχρι το τελικό Data Visualization στο Power BI.

Φάση 1: Καθαρισμός δεδομένων (Data Cleaning) στο Power Query

Όταν εισάγουμε το ακατέργαστο dataset της Formula 1 στο Power BI, τα δεδομένα είναι «θολά». Για παράδειγμα, τα αποτελέσματα των αγώνων περιέχουν κειμενικά errors σε στήλες που θα έπρεπε να έχουν μόνο αριθμούς (π.χ. όταν ένας οδηγός εγκατέλειψε λόγω μηχανικής βλάβης και η θέση τερματισμού αναγράφεται ως “DNF” αντί για νούμερο).

Αν αφήσεις τα δεδομένα έτσι, το Power BI δεν θα μπορεί να υπολογίσει τον μέσο όρο θέσης τερματισμού της κάθε ομάδας.

Τα 3 απαραίτητα βήματα στο Power Query:

  1. Διαχείριση των Text Errors: Επιλέγουμε τη στήλη των αποτελεσμάτων και χρησιμοποιούμε την εντολή Replace Errors για να μετατρέψουμε τα “DNF” (Did Not Finish) σε Null ή σε μια συγκεκριμένη αριθμητική κωδικοποίηση που δεν αλλοιώνει τις στατιστικές μας.
  2. Split column για Κατασκευαστές και Οδηγούς: Πολλές φορές το όνομα του οδηγού έρχεται ενωμένο με το ID της ομάδας (π.χ. “Lewis Hamilton-MER”). Με την εντολή Split Column by Delimiter χωρίζουμε την πληροφορία σε δύο καθαρές, ανεξάρτητες στήλες.
  3. Κανονικοποίηση Ημερομηνιών (Data Types): Τα formats των ημερομηνιών των Grand Prix αλλάζουν ανάλογα με τη χώρα που έγινε η καταγραφή. Χρησιμοποιούμε το Using Locale για να βεβαιωθούμε ότι το Power BI μετατρέπει σωστά όλες τις στήλες σε τύπο Date.

Φάση 2: Σχεδιάζοντας το Dashboard (Data Visualization)

Μόλις πατήσεις Close & Apply, τα δεδομένα μεταφέρονται καθαρά και δομημένα στο Model View και στο Report View. Τώρα ξεκινάει η επιστήμη του Data Visualization στο Power BI.

Ο σκοπός μας είναι να δημιουργήσουμε ένα interactive dashboard που απαντάει σε κρίσιμα business ερωτήματα, όπως: Πώς εξελίσσεται η κυριαρχία των ομάδων ανά δεκαετία; Πόσο συχνά ο οδηγός που ξεκινάει από το Pole Position κερδίζει τελικά τον αγώνα;

1. Η χρήση των KPI Cards για άμεση πληροφόρηση

Στο πάνω μέρος του report, τοποθετούμε KPI Cards. Αυτά τα visuals δείχνουν με μεγάλα γράμματα τις πιο σημαντικές μετρικές. Στο project της Formula 1, θα βάλουμε:

  • Συνολικός αριθμός Grand Prix
  • Μέσο ποσοστό εγκαταλείψεων (Abandonment Rate) ανά σεζόν
  • Ο οδηγός με τις περισσότερες νίκες

2. Line Charts για την ανάλυση τάσεων (Trends)

Για να δείξουμε πώς άλλαξαν οι ισορροπίες δυνάμεων ανάμεσα στους κορυφαίους κατασκευαστές (Ferrari, Mercedes, Red Bull) από το 1950 έως το 2025, το ιδανικό visual είναι το Line Chart. Κάθε γραμμή αντιπροσωπεύει μια ομάδα, επιτρέποντας στο μάτι του χρήστη να καταλάβει αμέσως τις «χρυσές εποχές» του κάθε κατασκευαστή.

3. Bar Charts για συγκρίσεις

Αν θέλουμε να συγκρίνουμε τους οδηγούς με τα περισσότερα βάθρα (podiums), αποφεύγουμε τα pie charts που κουράζουν. Χρησιμοποιούμε ένα οριζόντιο Clustered Bar Chart, ταξινομημένο σε φθίνουσα σειρά, ώστε ο αναγνώστης να βλέπει καθαρά την κατάταξη χωρίς να χρειάζεται να διαβάζει labels.

Η ειδοποιός διαφορά στην εκπαίδευσή σου

Το να μάθεις να πατάς τα κουμπιά του Power BI είναι εύκολο. Το να μάθεις όμως να παίρνεις ένα χαοτικό dataset, να το καθαρίζεις σωστά και να το οπτικοποιείς με βάση τις βέλτιστες πρακτικές της αγοράς, απαιτεί στρατηγική καθοδήγηση.

Στην Data Tutor, η εκπαίδευση βασίζεται στο project-based learning και στην ανθρώπινη επαφή. Μέσα από το ολοκληρωμένο πρόγραμμα Data Analyst Roadmap, δεν σου δίνουμε απλώς πρόσβαση σε βιντεοσκοπημένο υλικό. Χτίζεις ένα πραγματικό, ισχυρό GitHub Portfolio με 6 μεγάλα projects και λαμβάνεις αναλυτικό, εξατομικευμένο feedback session από μένα για κάθε ένα από αυτά, διασφαλίζοντας ότι η δουλειά σου είναι επαγγελματικού επιπέδου.

👉🏻 Κλείσε ένα online meeting μαζί μου για να συζητήσουμε τον δικό σου επαγγελματικό στόχο.

Περιεχόμενα

Πρόοδος ανάγνωσης

Κύλιση στην κορυφή