Ορισμός Σχήματος Δεδομένων σε NSIP Dataset

Ορισμός Σχήματος Δεδομένων σε NSIP Dataset

Στα NSIP datasets υπάρχει η δυνατότητα να οριστεί το σχήμα των δεδομένων (data schema) χωρίς να δημοσιοποιούνται τα ίδια τα δεδομένα.

Με τον τρόπο αυτό, οι καταναλωτές αποκτούν εικόνα της δομής και του περιεχομένου ενός dataset, π.χ. ποιες στήλες υπάρχουν, τι τύπο δεδομένων περιέχουν και ποιες τιμές είναι αποδεκτές, χωρίς να αποκαλύπτονται προσωπικές ή ευαίσθητες πληροφορίες.

Παράδειγμα 1: Τομέας Υγείας

Όνομα Πεδίου
Τύπος Δεδομένων
Περιγραφή
Επιτρεπτές Τιμές

patient_id

Αλφαριθμητικό

Κωδικός ασθενούς (ψευδωνυμοποιημένος)

-

diagnosis_code

Αριθμητικό

Κωδικός διάγνωσης ICD-10

ICD-10 έγκυροι κωδικοί

visit_date

Ημερομηνία

Ημερομηνία επίσκεψης

Μορφή YYYY-MM-DD

hospital_department

Κείμενο

Τμήμα νοσοκομείου

Καρδιολογία, Παθολογία…

gender

Κείμενο

Φύλο ασθενούς

Άνδρας, Γυναίκα, Άλλο


Παράδειγμα 2: Τομέας Μεταφορών

Όνομα Πεδίου
Τύπος Δεδομένων
Περιγραφή
Επιτρεπτές Τιμές

route_id

Αλφαριθμητικό

Κωδικός γραμμής

-

stop_name

Κείμενο

Όνομα στάσης

Ελεύθερο κείμενο

stop_lat

Δεκαδικός

Γεωγραφικό πλάτος

-90 έως 90

stop_lon

Δεκαδικός

Γεωγραφικό μήκος

-180 έως 180

vehicle_type

Κείμενο

Τύπος οχήματος

Λεωφορείο, Τραμ, Μετρό

service_hours

Κείμενο

Ώρες λειτουργίας

06:00-23:00, 24/7 κ.λπ.


Με αυτόν τον τρόπο, το dataset παραμένει προστατευμένο, αλλά υπάρχει σαφής και τυποποιημένη πληροφόρηση για το περιεχόμενο και τη δομή του.

Η λειτουργικότητα αυτή αντιστοιχεί σε όσα περιγράφονται στην ενότητα οδηγών για τη Διαμόρφωση Δεδομένων, αλλά στην περίπτωση των NSIP datasets χρησιμοποιείται μόνο για τον ορισμό του λεξιλογίου (schema), χωρίς καταχώρηση πραγματικών δεδομένων.

Last updated