Ορισμός Σχήματος Δεδομένων σε NSIP Dataset
Ορισμός Σχήματος Δεδομένων σε NSIP Dataset
Στα NSIP datasets υπάρχει η δυνατότητα να οριστεί το σχήμα των δεδομένων (data schema) χωρίς να δημοσιοποιούνται τα ίδια τα δεδομένα.
Με τον τρόπο αυτό, οι καταναλωτές αποκτούν εικόνα της δομής και του περιεχομένου ενός dataset, π.χ. ποιες στήλες υπάρχουν, τι τύπο δεδομένων περιέχουν και ποιες τιμές είναι αποδεκτές, χωρίς να αποκαλύπτονται προσωπικές ή ευαίσθητες πληροφορίες.
Παράδειγμα 1: Τομέας Υγείας
patient_id
Αλφαριθμητικό
Κωδικός ασθενούς (ψευδωνυμοποιημένος)
-
diagnosis_code
Αριθμητικό
Κωδικός διάγνωσης ICD-10
ICD-10 έγκυροι κωδικοί
visit_date
Ημερομηνία
Ημερομηνία επίσκεψης
Μορφή YYYY-MM-DD
hospital_department
Κείμενο
Τμήμα νοσοκομείου
Καρδιολογία, Παθολογία…
gender
Κείμενο
Φύλο ασθενούς
Άνδρας, Γυναίκα, Άλλο
Παράδειγμα 2: Τομέας Μεταφορών
route_id
Αλφαριθμητικό
Κωδικός γραμμής
-
stop_name
Κείμενο
Όνομα στάσης
Ελεύθερο κείμενο
stop_lat
Δεκαδικός
Γεωγραφικό πλάτος
-90 έως 90
stop_lon
Δεκαδικός
Γεωγραφικό μήκος
-180 έως 180
vehicle_type
Κείμενο
Τύπος οχήματος
Λεωφορείο, Τραμ, Μετρό
service_hours
Κείμενο
Ώρες λειτουργίας
06:00-23:00, 24/7 κ.λπ.
Με αυτόν τον τρόπο, το dataset παραμένει προστατευμένο, αλλά υπάρχει σαφής και τυποποιημένη πληροφόρηση για το περιεχόμενο και τη δομή του.
Η λειτουργικότητα αυτή αντιστοιχεί σε όσα περιγράφονται στην ενότητα οδηγών για τη Διαμόρφωση Δεδομένων, αλλά στην περίπτωση των NSIP datasets χρησιμοποιείται μόνο για τον ορισμό του λεξιλογίου (schema), χωρίς καταχώρηση πραγματικών δεδομένων.
Last updated