Σχετικά με το Μάθημα
Εισαγωγή Στα Δεδομένα
Τα δεδομένα είναι ένα πολύτιμο περιουσιακό στοιχείο που παίζει καθοριστικό ρόλο στη λήψη κρίσιμων επιχειρηματικών αποφάσεων.
Τα δεδομένα είναι μια συλλογή από γεγονότα, όπως αριθμοί, περιγραφές και παρατηρήσεις, που χρησιμοποιούνται στη λήψη αποφάσεων και μπορούν να ταξινομηθούν ως:
- Structured (Δομημένα)
- Semi-structured (Ημι-δομημένα)
- Unstructured (Αδόμητα)
Τα συστήματα ανάλυσης εκτελούν 4 κύριες δραστηριότητας με δεδομένα:
- Data Ingestion
Η διαδικασία σύλληψης των ακατέργαστων (raw) δεδομένων. Για να επεξεργαστείτε και να αναλύσετε αυτά τα δεδομένα, πρέπει πρώτα να τα αποθηκεύσετε σε κάποιο repository (αποθετήριο). Το repository μπορεί να είναι αποθήκευση αρχείων, μια βάση δεδομένων εγγράφων ή ακόμα και μια σχεσιακή βάση δεδομένων. - Data Transformation/Processing
Αφού τα δεδομένα εισαχθούν σε ένα repository δεδομένων, μπορεί να θέλουμε να κάνουμε κάποιες διαδικασίες καθαρισμού και να αφαιρέσουμε αμφιλεγόμενα ή μη έγκυρα δεδομένα ή να εκτελέσουμε κάποιες συγκεντρώσεις, όπως ο υπολογισμός ορισμένων KPIs (Key Performance Indicators). - Data Querying
Μόλις τα δεδομένα εισαχθούν και μετασχηματιστούν, χρειάζονται ανάλυση. Πολλά συστήματα βάσεων δεδομένων παρέχουν εργαλεία για να επιτρέψουν στους χρήστες να εκτελούν ad-hoc queries και να παράγουν τακτικές αναφορές (reports). - Data Visualization
Τα δεδομένα που παρουσιάζονται σε πίνακες δεν είναι πάντα διαισθητικά, οπότε η απεικόνιση των δεδομένων μπορεί συχνά να είναι χρήσιμη ως εργαλείο για την εξέταση των δεδομένων και την κατανόηση ιστορικών τάσεων.