Σύνολο δεδομένων (Dataset)
Το πρώτο βήμα χρήσης του εργαλείου είναι η μεταφόρτωση ενός dataset. Το εργαλείο έχει ορισμένους περιορισμούς ως προς το μέγεθος — επιτρέπεται μόνο dataset έως 4 MB.
Τα datasets που μπορεί να επεξεργαστεί το Amnesia αποθηκεύονται ως αρχεία κειμένου με διαχωριστικά (delimited text files). Κάθε γραμμή του αρχείου είναι μια εγγραφή (record) και κάθε διακριτή τιμή της εγγραφής διαχωρίζεται από την επόμενη με ένα delimiter. Ο χρήστης πρέπει να δηλώσει στο εργαλείο ποιο διαχωριστικό χρησιμοποιείται στο αρχικό αρχείο κατά την εισαγωγή. Τα ανωνυμοποιημένα αρχεία αποθηκεύονται στην ίδια μορφή με τα αρχικά. Τα μοντέλα δεδομένων που υποστηρίζει το Amnesia είναι: relational tables, set collections και object-relational tables (όλα αποθηκευμένα ως αρχεία κειμένου με διαχωριστικά).
Relational tables: έχουν σταθερό αριθμό στηλών, άρα κάθε εγγραφή έχει τον ίδιο αριθμό τιμών. Κάθε στήλη μπορεί να έχει διαφορετικό τύπο δεδομένων.
Set collections: datasets των οποίων οι εγγραφές έχουν αυθαίρετο αριθμό τιμών του ίδιου τύπου (προς το παρόν υποστηρίζεται string).
Object-relational tables: συνδυασμός των παραπάνω. Έχουν σταθερό αριθμό στηλών, αλλά μία στήλη είναι σύνολο — δηλαδή περιέχει αυθαίρετο αριθμό τιμών του ίδιου τύπου. Για σωστή ανάγνωση ενός τέτοιου αρχείου απαιτούνται δύο διαχωριστικά: ένα για τις στήλες και ένα για τις τιμές της set-στήλης.
Η εισαγωγή δεδομένων στο Amnesia μπορεί να ξεκινήσει με έναν από τους εξής τρόπους:
Από το αριστερό μενού: Source → Load From Local.
Σύρσιμο αρχείου στο πλαίσιο “Drop files to upload” και στη συνέχεια πάτημα του “Upload”.
Μέσα από την οθόνη του dataset: Source → Manage → Load New Dataset.

Ο οδηγός που εμφανίζεται ζητά πρώτα τη μορφή του dataset:
Simple Table: απλός πίνακας.
Sets of values: συλλογή εγγραφών με μεταβλητό αριθμό τιμών.
Table with a set-valued attribute: πίνακας όπου μία στήλη είναι set.
Disk-based simple table: για πολύ μεγάλα datasets, απευθείας από δίσκο.

Το εργαλείο εμφανίζει προεπισκόπηση, προτείνει data types (που ο χρήστης επιβεβαιώνει ή αλλάζει) και επιτρέπει επιλογή των στηλών που θα εμφανιστούν στο output.
Το Amnesia υποστηρίζει τέσσερις τύπους δεδομένων: string, integer, double (floating point) και date. Κατά τη φόρτωση dataset, γίνεται προσπάθεια αυτόματης ανίχνευσης τύπων με βάση τις πρώτες γραμμές — ο χρήστης πρέπει να ελέγξει και να διορθώσει αν χρειάζεται.

Last updated