Σενάριο Άσκησης: Απόφαση για τη Δημοσίευση Δεδομένων

Το Σενάριο

Η Διεύθυνση Μεταφορών ενός μεγάλου Δήμου επιθυμεί να συμβάλει στην πολιτική ανοικτών δεδομένων. Έχει συλλέξει πληροφορίες από τις υπηρεσίες της και σκέφτεται να ανεβάσει στο data.gov.gr ένα νέο dataset με τίτλο «Κίνηση οχημάτων και χρήσεις χώρων στάθμευσης στην πόλη».

Το dataset περιλαμβάνει τα εξής πεδία:

· Ημερομηνία και ώρα καταγραφής.

· Γεωγραφικές συντεταγμένες κάθε σημείου μέτρησης.

· Αριθμό κυκλοφορούντων οχημάτων ανά λεπτό.

· Τύπο οχήματος (ΙΧ, λεωφορείο, φορτηγό, δίκυκλο).

· Πινακίδα οχήματος (όπου υπήρχε δυνατότητα αναγνώρισης).

· Στοιχεία αδειοδοτημένων ιδιωτικών χώρων στάθμευσης: επωνυμία εταιρείας, ΑΦΜ, διεύθυνση.

· Στοιχεία για χρήση θέσεων ΑμεΑ (ποσοστό κάλυψης ανά ημέρα).

Η ομάδα σας πρέπει να αποφασίσει αν, και με ποιον τρόπο, μπορεί να δημοσιευθεί αυτό το dataset ως ανοικτό δεδομένο.


Οδηγίες προς τους συμμετέχοντες

1. Εντοπίστε τις κατηγορίες δεδομένων. Ποια από τα πεδία είναι προσωπικά; Ποια ανήκουν σε ευαίσθητες κατηγορίες; Ποια είναι ελεύθερα;

2. Αξιολογήστε τους νομικούς περιορισμούς. Ποια πεδία δεν μπορούν να δημοσιευθούν καθόλου και ποια μπορούν να διατεθούν μόνο μετά από ανωνυμοποίηση ή συσσωμάτωση;

3. Σκεφτείτε πιθανά ρίσκα επαναταυτοποίησης. Αν αφαιρέσετε τις πινακίδες, υπάρχει άλλος τρόπος να αναγνωριστεί ποιος οδηγεί;

4. Προτείνετε λύσεις συμμόρφωσης. Πώς θα προσαρμόζατε το dataset για να μπορέσει να δημοσιευθεί με ασφάλεια;

5. Επιλέξτε άδεια διάθεσης. Μετά τον καθαρισμό, ποια άδεια (π.χ. CC BY ή CC0) θεωρείτε πιο κατάλληλη και γιατί;

6. Συντάξτε μια μικρή περίληψη απόφασης. Σημειώστε ποια πεδία αφαιρέσατε, ποια κρατήσατε και με ποια τεκμηρίωση.


Προτεινόμενη Ανάλυση για τον Εκπαιδευτή

Κατά τον πρώτο έλεγχο, το πεδίο «πινακίδα οχήματος» θεωρείται καθαρά προσωπικό δεδομένο και δεν μπορεί να δημοσιευθεί ούτε με ψευδωνυμοποίηση, διότι μπορεί να οδηγήσει σε αναγνώριση φυσικών προσώπων. Συνεπώς, αφαιρείται πλήρως. Στη συνέχεια, τα στοιχεία των ιδιωτικών χώρων στάθμευσης εξετάζονται ως προς τα δικαιώματα τρίτων. Αν η επωνυμία της εταιρείας είναι ήδη δημόσια διαθέσιμη (π.χ. καταχωρημένη στο ΓΕΜΗ), μπορεί να παραμείνει· ωστόσο, το ΑΦΜ θεωρείται προσωπικό δεδομένο όταν αφορά ατομικές επιχειρήσεις και επομένως πρέπει να διαγραφεί.

Όσον αφορά τις πληροφορίες για τις θέσεις ΑμεΑ, δεν υπάρχει προσωπικό δεδομένο, καθώς δεν αναφέρονται συγκεκριμένα ονόματα ή στοιχεία ταυτότητας. Εντούτοις, για να μειωθεί περαιτέρω ο κίνδυνος, οι καταγραφές χρήσης συγκεντρώνονται σε ημερήσιο ή μηνιαίο επίπεδο, ώστε να μην μπορεί να προκύψει ταυτοποίηση μεμονωμένων χρηστών.

Μετά τον καθαρισμό, το τελικό dataset περιλαμβάνει μόνο τις συντεταγμένες, τον αριθμό οχημάτων ανά κατηγορία, τις ώρες καταγραφής σε ανώνυμη μορφή και την πληρότητα των θέσεων ΑμεΑ σε συγκεντρωμένα ποσοστά. Αυτά τα δεδομένα δεν περιέχουν πλέον προσωπικές πληροφορίες ή εμπιστευτικά στοιχεία. Μπορούν, συνεπώς, να δημοσιευθούν ως Open Data.

Η άδεια που προτείνεται είναι η CC0, ώστε τα δεδομένα να είναι απολύτως ελεύθερα προς χρήση από όλους, ιδίως επειδή πρόκειται για πληροφορίες κινητικότητας που ανήκουν στα «σύνολα υψηλής αξίας» κατά την Οδηγία 2019/1024/ΕΕ. Στην τεκμηρίωση του συνόλου θα πρέπει να αναφέρεται η περιγραφή του, η ημερομηνία ενημέρωσης, ο υπεύθυνος φορέας και το ότι τα δεδομένα έχουν ανωνυμοποιηθεί και διατίθενται χωρίς περιορισμούς, με την υποχρέωση μόνο να αναφέρεται η πηγή.

Last updated