Ιεραρχία (Hierarchy)
Οι ιεραρχίες γενίκευσης είναι ένα σύνολο κανόνων που καθορίζουν πώς συγκεκριμένες τιμές πρέπει να αντικατασταθούν από πιο γενικές κατά την ανωνυμοποίηση των δεδομένων. Η βασική ιδέα είναι ότι τιμές που είναι αρκετά συγκεκριμένες ώστε να ταυτοποιούν κάποιο άτομο (π.χ. ταχυδρομικός κώδικας κατοικίας) αντικαθίστανται από πιο γενικές (π.χ. όνομα πόλης), έτσι ώστε να μην αποκαλύπτεται η ταυτότητα.
Το Amnesia χρησιμοποιεί την ιεραρχία για να αντικαθιστά συγκεκριμένες τιμές με πιο γενικές, μέχρι να επιτευχθεί η εγγύηση ιδιωτικότητας. Χαρακτηριστικό των ιεραρχιών γενίκευσης είναι ότι όλοι οι κόμβοι καταλήγουν σε έναν κοινό κόμβο (root). Αυτό διασφαλίζει ότι, αν χρειαστεί, το Amnesia θα μπορεί να αντικαταστήσει όλες τις τιμές με μία κοινή.
Οι ιεραρχίες γενίκευσης περιέχουν σημασιολογικές πληροφορίες τις οποίες πρέπει να παρέχει ο χρήστης. Σε περιπτώσεις όπου ο χώρος τιμών έχει ταξινόμηση (π.χ. αριθμοί, ημερομηνίες), το Amnesia μπορεί να βοηθήσει τον χρήστη να δημιουργήσει νέες ιεραρχίες.
Το Amnesia επιτρέπει τη δημιουργία προσαρμοσμένων ιεραρχιών με βάση το αρχικό dataset:
Μενού: Hierarchy → Auto Generate, ή
Hierarchy → Manage → Autogenerate Hierarchy.
Η ιεραρχία δημιουργείται ώστε να περιλαμβάνει όλες τις ενεργές τιμές (active domain) ενός γνωρίσματος. Ο χρήστης επιλέγει:
το γνώρισμα (Attribute),
τον τύπο (Hierarchy type) (distinct ή range, masking based),
και τον τύπο τιμών (Attribute type).
Για distinct τιμές, ο χρήστης επιλέγει:
τρόπο ταξινόμησης (numeric, alphabetical, random),
όνομα ιεραρχίας,
fanout (μέσος αριθμός παιδιών ανά κόμβο).

Για range τιμές, επιλέγει:
όνομα ιεραρχίας,
όρια χώρου τιμών (boundaries),
βήμα (step) στο χαμηλότερο επίπεδο,
fanout.

Ημερομηνίες αποτελούν ειδική περίπτωση ιεραρχιών τύπου range. Επειδή οι ημερομηνίες δεν βασίζονται στο δεκαδικό σύστημα, ο χρήστης πρέπει να ορίσει διαφορετικά εύρη τιμών για κάθε επίπεδο λεπτομέρειας της ιεραρχίας.
Συγκεκριμένα, ο χρήστης καθορίζει:
πόσες ημέρες, μήνες και χρόνια θα ομαδοποιούνται σε κάθε κόμβο της ιεραρχίας (δηλαδή, το μέγεθος του χρονικού διαστήματος στο κάθε επίπεδο), και
το fanout, δηλαδή πόσα εύρη ετών θα συνενώνονται σε έναν επάνω κόμβο.
Με τον τρόπο αυτό δημιουργείται μια ιεραρχία γενίκευσης που μπορεί να "ανεβάζει" την ακριβή ημερομηνία σε μήνα, τετράμηνο, έτος, πενταετία κ.λπ. κατά την ανωνυμοποίηση.
Στα αλφαριθμητικά πεδία μπορεί να εφαρμοστεί Ψευδωνυμοποίηση (Pseudo-Anonymization). Η ψευδωνυμοποίηση πραγματοποιείται με τη μέθοδο masking όπου κάποια χαρακτήρες μπορούν να αντικατασταθούν με έναν αστερίσκο ή κάποιον άλλο χαρακτήρα ώστε να αποκρυφτούν
Ο χρήστης επιλέγει τον masking χαρακτήρα που θα χρησιμοποιηθεί (π.χ. *, &, ^).
Επιλέγει πόσους χαρακτήρες της τιμής θέλει να κρύψει/αντικαταστήσει με τον masking χαρακτήρα.

Last updated