Δημιουργία Project - Εισαγωγή Δεδομένων

Δημιουργείτε ένα νέο project επιλέγοντας από το μενού “File” > “New project”. Στο αναδυόμενο παράθυρο καλείστε να ορίσετε το όνομα, μια προαιρετική περιγραφή και το γλωσσικό πλαίσιο (locale) που επιθυμείτε για τα δεδομένα σας.

Στη συνέχεια εισάγετε τα δεδομένα επιλέγοντας από το μενού “File” > “Import data”. Τα δεδομένα πρέπει να είναι σε μορφή πίνακα (rows & columns) όπου η πρώτη γραμμή συνήθως περιλαμβάνει ονόματα στηλών. Κάθε στήλη θα πρέπει να αντιστοιχεί σε ένα πεδίο/χαρακτηριστικό και δεν υποστηρίζονται complex nested/JSON δεδομένα — πρέπει να επιπεδοποιηθούν πρώτα. Ο πιο συνηθισμένος τύπος που υποστηρίζει άμεσα το ARX είναι το CSV (Comma-Separated Values)

Στα παράθυρα που θα εμφανιστούν, βεβαιωθείτε ότι οι ρυθμίσεις είναι σωστές (π.χ. delimiter: ,, κωδικοποίηση: UTF-8).

Υποστηριζόμενοι τύποι δεδομένων:

  • String: γενική ακολουθία χαρακτήρων (αλφαριθμητικό). Είναι ο προεπιλεγμένος τύπος δεδομένων.

  • Integer: αριθμητικός τύπος για τιμές χωρίς δεκαδικό μέρος (ακέραιοι).

  • Decimal: αριθμητικός τύπος για τιμές με δεκαδικό μέρος (δεκαδικοί).

  • Date/time: τύπος δεδομένων για ημερομηνίες (με ή χωρίς ώρα).

Το περιβάλλον εργασίας χωρίζεται σε πέντε κύριες περιοχές.

Περιοχή 1: εμφανίζει το τρέχον αρχείο εισόδου δεδομένων. Ο πίνακας εμφανίζει πρόσθετες πληροφορίες σχετικά με τα μεταδεδομένα χαρακτηριστικών.

Περιοχή 2: παρέχει έναν τρόπο καθορισμού μεταδεδομένων χαρακτηριστικών και προβολής ιεραρχιών γενίκευσης: Μπορούν να καθοριστούν τύποι χαρακτηριστικών και τύποι δεδομένων. Οι ιεραρχίες γενίκευσης μπορούν να τροποποιηθούν.

Περιοχή 3: υποστηρίζει τη διαμόρφωση μοντέλων απορρήτου. Μπορούν να επιλεγούν και να ρυθμιστούν πολλαπλά μοντέλα απορρήτου.

Περιοχή 4: υποστηρίζει τη διαμόρφωση μέτρων χρησιμότητας: Ένα μόνο μέτρο χρησιμότητας μπορεί να ρυθμιστεί και να επιλεγεί ως αντικειμενική συνάρτηση.

Περιοχή 5: προσφέρει μεθόδους εξαγωγής δείγματος έρευνας. Με αυτή την έννοια το ARX υποστηρίζει τον καθορισμό πινάκων πληθυσμού, ορίζοντας το σύνολο δεδομένων που θα ανωνυμοποιηθεί ως δείγμα του συνόλου δεδομένων που έχει φορτωθεί. Κάθε εγγραφή συσχετίζεται επιπλέον με ένα checkbox που υποδεικνύει ποιες εγγραφές περιλαμβάνονται στο καθορισμένο ερευνητικό δείγμα. Τα checkbox στην προβολή του συνόλου εισόδου αντιπροσωπεύουν το τρέχον ερευνητικό δείγμα και είναι επεξεργάσιμα.

Κάθε πίνακας παρέχει ορισμένες επιλογές, οι οποίες είναι προσβάσιμες μέσω κουμπιών στην επάνω δεξιά γωνία:

  • Το πρώτο και δεύτερο κουμπί ταξινομεί τα δεδομένα σύμφωνα με τη στήλη που είναι επιλεγμένη τη δεδομένη στιγμή.

  • Το τρίτο κουμπί ταξινομεί το σύνολο δεδομένων εξόδου σύμφωνα με όλους τους ημικαθοριστικούς προσδιοριστές (quasi-identifiers)

  • Το τέταρτο κουμπί ελέγχει το αν θα εμφανίζονται όλες οι εγγραφές ή μόνο οι εγγραφές που περιλαμβάνονται στο ερευνητικό δείγμα.

Last updated