Κατανόηση των περιορισμών της συγκομιδής
Κατανόηση των περιορισμών της συγκομιδής
Η συγκομιδή δεν έχει γνώση του τρόπου με τον οποίο χρησιμοποιείτε το μοντέλο δεδομένων σας. Βασίζεται αποκλειστικά στις προδιαγραφές κάθε πρωτοκόλλου ή πλατφόρμας για την ανάκτηση των μεταδεδομένων. Αυτό σημαίνει ότι υπάρχουν ορισμένοι τεχνικοί περιορισμοί που σχετίζονται με τις ιδιαιτερότητες κάθε πλατφόρμας. Παρακάτω παρουσιάζονται οι πιο συνηθισμένοι.
Αντιστοιχίσεις μεταδεδομένων
Κατά τη διαδικασία συγκομιδής, τα πεδία μεταδεδομένων που χρησιμοποιεί το data.gov.gr πρέπει να “αντιστοιχηθούν” με τα πεδία που υπάρχουν στην πλατφόρμα-πηγή (π.χ. CKAN, DCAT). Ωστόσο, η αντιστοίχιση δεν είναι πάντα πλήρης ή ξεκάθαρη:
Υπο-προσδιορισμένα πεδία Σε ορισμένα πρωτόκολλα, ένα πεδίο μπορεί να είναι πολύ γενικό ή να λείπει εντελώς. Παράδειγμα: Σε κάποιες πλατφόρμες δεν υπάρχει καθόλου πεδίο για το σημείο επαφής (contact point). Έτσι, όταν συγκομίζονται τα μεταδεδομένα στο data.gov.gr, η σχετική πληροφορία παραμένει κενή, παρότι είναι σημαντική για τους χρήστες που θέλουν να επικοινωνήσουν με τον υπεύθυνο του dataset.
Διαφορετική περιγραφή του ίδιου πεδίου Η ίδια πληροφορία μπορεί να περιγράφεται διαφορετικά από πλατφόρμα σε πλατφόρμα. Παράδειγμα: Η θεματική κατηγορία σε μία πλατφόρμα μπορεί να δίνεται ως ελεύθερο κείμενο (“υγεία”), ενώ στο data.gov.gr απαιτείται επιλογή από ελεγχόμενο λεξιλόγιο (DCAT-AP data themes).
Αντιστοίχιση σε πολλαπλά πεδία Κάποιες φορές η πληροφορία που βρίσκεται σε ένα πεδίο σε μια πλατφόρμα, σε άλλη μπορεί να είναι κατανεμημένη σε περισσότερα. Παράδειγμα: Η άδεια χρήσης (licence) μπορεί σε μια πλατφόρμα να δηλώνεται με ένα URL, ενώ σε άλλη με ξεχωριστά πεδία για “όνομα άδειας” και “σύνδεσμο”.
Σε τέτοιες περιπτώσεις, το data.gov.gr εφαρμόζει λογική “best effort”, δηλαδή προσπαθεί να αποδώσει σωστά την πληροφορία με βάση τα διαθέσιμα στοιχεία. Ωστόσο, ενδέχεται να υπάρχουν απώλειες ή αβεβαιότητες· γεγονός αναμενόμενο και αποδεκτό σε μια διαδικασία συγκομιδής. Γι’ αυτό και σε κάθε περίπτωση θα πρέπει να εξετάζεται η χρήση του API, το οποίο παρέχει πλήρη ελευθερία στη διαχείριση των μεταδεδομένων και επιτρέπει ακριβέστερη αντιστοίχιση μεταξύ ετερογενών συστημάτων.
Last updated