# Ορισμός Σχήματος Δεδομένων σε NSIP Dataset

### Ορισμός Σχήματος Δεδομένων σε NSIP Dataset

Στα NSIP datasets υπάρχει η δυνατότητα να οριστεί το **σχήμα των δεδομένων** (data schema) χωρίς να δημοσιοποιούνται τα ίδια τα δεδομένα.

Με τον τρόπο αυτό, οι καταναλωτές αποκτούν εικόνα της δομής και του περιεχομένου ενός dataset, π.χ. ποιες στήλες υπάρχουν, τι τύπο δεδομένων περιέχουν και ποιες τιμές είναι αποδεκτές, χωρίς να αποκαλύπτονται προσωπικές ή ευαίσθητες πληροφορίες.

#### Παράδειγμα 1: Τομέας Υγείας

| Όνομα Πεδίου         | Τύπος Δεδομένων | Περιγραφή                             | Επιτρεπτές Τιμές        |
| -------------------- | --------------- | ------------------------------------- | ----------------------- |
| patient\_id          | Αλφαριθμητικό   | Κωδικός ασθενούς (ψευδωνυμοποιημένος) | -                       |
| diagnosis\_code      | Αριθμητικό      | Κωδικός διάγνωσης ICD-10              | ICD-10 έγκυροι κωδικοί  |
| visit\_date          | Ημερομηνία      | Ημερομηνία επίσκεψης                  | Μορφή YYYY-MM-DD        |
| hospital\_department | Κείμενο         | Τμήμα νοσοκομείου                     | Καρδιολογία, Παθολογία… |
| gender               | Κείμενο         | Φύλο ασθενούς                         | Άνδρας, Γυναίκα, Άλλο   |

***

#### Παράδειγμα 2: Τομέας Μεταφορών

| Όνομα Πεδίου   | Τύπος Δεδομένων | Περιγραφή         | Επιτρεπτές Τιμές        |
| -------------- | --------------- | ----------------- | ----------------------- |
| route\_id      | Αλφαριθμητικό   | Κωδικός γραμμής   | -                       |
| stop\_name     | Κείμενο         | Όνομα στάσης      | Ελεύθερο κείμενο        |
| stop\_lat      | Δεκαδικός       | Γεωγραφικό πλάτος | -90 έως 90              |
| stop\_lon      | Δεκαδικός       | Γεωγραφικό μήκος  | -180 έως 180            |
| vehicle\_type  | Κείμενο         | Τύπος οχήματος    | Λεωφορείο, Τραμ, Μετρό  |
| service\_hours | Κείμενο         | Ώρες λειτουργίας  | 06:00-23:00, 24/7 κ.λπ. |

***

Με αυτόν τον τρόπο, το dataset παραμένει **προστατευμένο**, αλλά υπάρχει σαφής και τυποποιημένη πληροφόρηση για το **περιεχόμενο και τη δομή** του.

Η λειτουργικότητα αυτή αντιστοιχεί σε όσα περιγράφονται στην ενότητα οδηγών για τη [Διαμόρφωση Δεδομένων](https://data-gov-gr.gitbook.io/guides/diaxeirisi-dedomenon/synola-dedomenon/anartisi-dedomenon/diamorfosi-dedomenon), αλλά στην περίπτωση των NSIP datasets χρησιμοποιείται **μόνο για τον ορισμό του λεξιλογίου** (schema), **χωρίς καταχώρηση πραγματικών δεδομένων**.
