Κριτήρια Αξιολόγησης (MQA)
Κριτήρια Αξιολόγησης Ποιότητας (MQA)
Η αξιολόγηση ποιότητας μεταδεδομένων στο data.gov.gr βασίζεται στη μεθοδολογία Metadata Quality Assessment (MQA) του data.europa.eu. Η μεθοδολογία αυτή αναλύει τη συμμόρφωση των μεταδεδομένων ενός συνόλου δεδομένων με βάση πέντε βασικές διαστάσεις ποιότητας:
Ευρεσιμότητα (Findability)
Προσβασιμότητα (Accessibility)
Διαλειτουργικότητα (Interoperability)
Δυνατότητα Επαναχρησιμοποίησης (Reusability)
Συγκειμενικότητα (Contextuality)
Κάθε διάσταση αξιολογείται με συγκεκριμένα κριτήρια και βαθμολογείται σε μονάδες, με τη συνολική βαθμολογία να δείχνει το επίπεδο ποιότητας του dataset.
1. Ευρεσιμότητα (Findability)
Αξιολογεί την ικανότητα εντοπισμού του συνόλου δεδομένων μέσω λέξεων-κλειδιών, θεμάτων και χωρικών/χρονικών πληροφοριών.
Κριτήριο
Περιγραφή
Μονάδες
Λέξεις-κλειδιά (dcat:keyword)
Αν έχουν οριστεί λέξεις-κλειδιά που διευκολύνουν την αναζήτηση.
30
Κατηγορίες (dcat:theme)
Αν έχει αντιστοιχιστεί θεματική κατηγορία.
30
Γεωγραφική πληροφορία (dct:spatial)
Αν υπάρχει γεωγραφική πληροφορία για αναζήτηση με χωρικά κριτήρια.
20
Χρονική πληροφορία (dct:temporal)
Αν υπάρχει χρονική πληροφορία για αναζήτηση με χρονικά κριτήρια.
20
Μέγιστη βαθμολογία: 100 μονάδες
2. Προσβασιμότητα (Accessibility)
Εξετάζει αν τα δεδομένα είναι τεχνικά προσβάσιμα και διαθέσιμα για λήψη από τον χρήστη.
Κριτήριο
Περιγραφή
Μονάδες
Προσβασιμότητα accessURL
Έλεγχος αν η διεύθυνση URL πρόσβασης ανταποκρίνεται (HTTP 200 ή 300).
50
Υπάρχει downloadURL
Αν έχει οριστεί διεύθυνση για άμεση λήψη των δεδομένων.
20
Προσβασιμότητα downloadURL
Αν η διεύθυνση λήψης είναι προσβάσιμη (HTTP 200 ή 300).
30
Μέγιστη βαθμολογία: 100 μονάδες
3. Διαλειτουργικότητα (Interoperability)
Εξετάζει κατά πόσο τα δεδομένα είναι συμβατά, κατανοητά και επαναχρησιμοποιήσιμα από άλλα συστήματα.
Κριτήριο
Περιγραφή
Μονάδες
Μορφότυπος (dct:format)
Αν έχει καθοριστεί ο τύπος αρχείου.
20
Τύπος μέσων (dcat:mediaType)
Αν έχει καθοριστεί ο τύπος μέσων.
10
Χρήση ελεγχόμενου λεξιλογίου
Αν ο μορφότυπος/τύπος μέσων ανήκει σε λεξιλόγιο (π.χ. IANA).
10
Ανοικτός μορφότυπος
Αν ο τύπος αρχείου είναι μη ιδιόκτητος (open format).
20
Μηχαναγνώσιμος μορφότυπος
Αν το αρχείο είναι μηχαναγνώσιμο.
20
Συμμόρφωση με DCAT-AP
Αν τα μεταδεδομένα ακολουθούν το πρότυπο DCAT-AP.
30
Μέγιστη βαθμολογία: 110 μονάδες
4. Δυνατότητα Επαναχρησιμοποίησης (Reusability)
Αξιολογεί αν τα δεδομένα μπορούν να επαναχρησιμοποιηθούν με σαφείς όρους και σωστή τεκμηρίωση.
Κριτήριο
Περιγραφή
Μονάδες
Άδεια χρήσης (dct:license)
Αν έχει καθοριστεί άδεια χρήσης.
20
Χρήση λεξιλογίου αδειών
Αν η άδεια προέρχεται από ελεγχόμενο λεξιλόγιο.
10
Δικαιώματα πρόσβασης (dct:accessRights)
Αν έχει καθοριστεί επίπεδο πρόσβασης (public/restricted).
10
Λεξιλόγιο πρόσβασης
Αν χρησιμοποιείται ελεγχόμενο λεξιλόγιο για τα access rights.
5
Σημείο επαφής (dcat:contactPoint)
Αν υπάρχει υπεύθυνος επικοινωνίας.
20
Εκδότης (dct:publisher)
Αν έχει οριστεί ο εκδότης του dataset.
10
Μέγιστη βαθμολογία: 75 μονάδες
5. Συγκειμενικότητα (Contextuality)
Εξετάζει αν παρέχεται πρόσθετο πλαίσιο και πληροφορία για την κατανόηση του dataset.
Κριτήριο
Περιγραφή
Μονάδες
Δικαιώματα (dct:rights)
Αν έχουν καθοριστεί δικαιώματα χρήσης.
5
Μέγεθος αρχείου (dcat:byteSize)
Αν αναφέρεται το μέγεθος του αρχείου.
5
Ημερομηνία έκδοσης (dct:issued)
Αν έχει καθοριστεί ημερομηνία δημοσίευσης.
5
Ημερομηνία τροποποίησης (dct:modified)
Αν υπάρχει ημερομηνία τελευταίας ενημέρωσης.
5
Μέγιστη βαθμολογία: 20 μονάδες
Εύρος Συνολικής Αξιολόγησης
Βαθμολογία
Επίπεδο Ποιότητας
351 – 405
Εξαιρετική
221 – 350
Καλή
121 – 220
Ικανοποιητική
0 – 120
Κακή
Αυτά τα κριτήρια χρησιμοποιούνται αυτόματα από το MQA του data.gov.gr και του data.europa.eu για την εκτίμηση της ποιότητας μεταδεδομένων, παρέχοντας σαφή εικόνα στους εκδότες και διαχειριστές σχετικά με τα σημεία βελτίωσης κάθε συνόλου δεδομένων.
Πώς εφαρμόζονται τα κριτήρια MQA στην πράξη στο data.gov.gr
Παρακάτω εξηγούμε πώς ακριβώς τα υλοποιεί το data.gov.gr, ώστε να γνωρίζετε τι ελέγχει το σύστημα στο παρασκήνιο.
Συμμόρφωση με DCAT-AP
Η καταχώριση μεταδεδομένων στο data.gov.gr γίνεται εξ ορισμού με βάση το σχήμα DCAT-AP και τα αντίστοιχα λεξιλόγια που προτείνονται (π.χ. για μορφότυπους, άδειες, δικαιώματα πρόσβασης – βλ. και [Λεξιλόγια πεδίων]. Αυτό σημαίνει ότι η φόρμα και τα λεξιλόγια του συστήματος ήδη «καθοδηγούν» τον εκδότη ώστε τα μεταδεδομένα να είναι σύνομα με το DCAT-AP.
Στο πλαίσιο του MQA, το κριτήριο «Συμμόρφωση με DCAT-AP» δεν προσπαθεί να ξαναελέγξει όλο το σχήμα, αλλά επικεντρώνεται στο αν έχουν συμπληρωθεί σωστά τα βασικά υποχρεωτικά πεδία:
υπάρχει τίτλος (
title) στο dataset,υπάρχει περιγραφή (
descriptionήnotes),και, εφόσον υπάρχουν πόροι, να εχούν
accessURL(url).
Με άλλα λόγια, θεωρούμε ότι η υπόλοιπη δομή DCAT-AP εξασφαλίζεται από το ίδιο το σύστημα (φόρμες + λεξιλόγια), και εδώ ελέγχουμε ότι τα κρίσιμα υποχρεωτικά πεδία δεν έχουν μείνει κενά για το συγκεκριμένο dataset.
Προσβασιμότητα accessURL και downloadURL
Για τα κριτήρια «Προσβασιμότητα accessURL» και «Προσβασιμότητα downloadURL» το MQA δεν ελέγχει μόνο αν υπάρχει κάποιο URL, αλλά και αν είναι πραγματικά προσβάσιμο:
Για κάθε πόρο που έχει
accessURL(url) ήdownloadURL:Αν υπάρχουν διαθέσιμα αποτελέσματα από τον μηχανισμό archiver, χρησιμοποιούνται αυτά (τελευταία γνωστή κατάσταση).
Αλλιώς, γίνεται ένα HTTP
HEADαίτημα στο URL, με μικρό timeout, ώστε η αξιολόγηση να μην καθυστερεί.
Ένα URL θεωρείται προσβάσιμο όταν:
ο HTTP κωδικός απάντησης είναι 2xx (π.χ.
200 OK) ή3xx (redirect που καταλήγει επιτυχώς).
Ένα URL θεωρείται μη προσβάσιμο όταν:
επιστρέφει κωδικό σφάλματος 4xx ή 5xx (π.χ.
404 Not Found,500 Internal Server Error), ήδεν μπορεί να γίνει σύνδεση (timeout, DNS πρόβλημα κ.λπ.).
Τα αποτελέσματα αποθηκεύονται προσωρινά (cache), ώστε αν το ίδιο URL εμφανίζεται σε πολλαπλούς πόρους, να μην επαναλαμβάνεται ο ίδιος έλεγχος.
Χρήσιμο για εκδότες: Αν βλέπετε χαμηλή βαθμολογία στην Προσβασιμότητα, ελέγξτε ότι τα URLs:
ανοίγουν κανονικά χωρίς να απαιτείται σύνδεση σε VPN ή login,
δεν «κρύβονται» πίσω από σελίδες με captcha ή μόνο-JavaScript redirects,
δεν έχουν αλλάξει χωρίς να ενημερωθούν στα μεταδεδομένα.
Ημερομηνία έκδοσης και τροποποίησης
Για τη διάσταση Πλαίσιο Διάθεσης (Contextuality)» τα κριτήρια:
«Ημερομηνία έκδοσης (dct:issued)»
«Ημερομηνία τροποποίησης (dct:modified)»
στο data.gov.gr καλύπτονται πρακτικά από το ίδιο το σύστημα:
Σε επίπεδο πόρου:
το CKAN ενημερώνει αυτόματα την ημερομηνία δημιουργίας (
created),και την ημερομηνία τελευταίας τροποποίησης (
metadata_modified) κάθε φορά που αλλάζει κάτι στον πόρο.
Το MQA χρησιμοποιεί αυτές τις τιμές για να αξιολογήσει τα κριτήρια ημερομηνίας έκδοσης/τροποποίησης.
Συνεπώς, για «κανονικά» datasets που διαχειρίζονται μέσα από το data.gov.gr, αυτά τα δύο κριτήρια σχεδόν πάντα προσμετρώνται θετικά, χωρίς να απαιτείται ξεχωριστή ενέργεια από τον εκδότη. Ειδική προσοχή χρειάζεται μόνο σε σενάρια συγκομιδής (harvesting) από εξωτερικές πύλες, όπου οι ημερομηνίες μπορεί να προέρχονται από το απομακρυσμένο σύστημα.
Εκδότης (dct:publisher)
Το κριτήριο «Εκδότης (dct:publisher)» ελέγχει αν υπάρχει δηλωμένος εκδότης του dataset. Στο data.gov.gr αυτό γίνεται με δύο τρόπους:
Αν το dataset έχει τιμή στο πεδίο
publisher, αυτή χρησιμοποιείται ως εκδότης.Αν δεν έχει τιμή στο
publisher, τότε το MQA θεωρεί ως εκδότη τον οργανισμό στο οποίο ανήκει το dataset (τον φορέα που το διαχειρίζεται στην πύλη).
Άρα:
Για datasets που ανήκουν σε έναν οργανισμό του data.gov.gr, το κριτήριο «Εκδότης» θα υπολογιστεί θετικά ακόμη κι αν δεν έχει συμπληρωθεί ρητά το πεδίο
publisher.Μόνο datasets χωρίς συνδεδεμένο οργανισμό και χωρίς καθόλου τιμή
publisherβαθμολογούνται αρνητικά σε αυτό το κριτήριο.
Λεξιλόγια μορφότυπων, αδειών και δικαιωμάτων πρόσβασης
Πολλά κριτήρια του MQA βασίζονται όχι μόνο στην ύπαρξη μιας τιμής, αλλά και στο αν η τιμή αυτή προέρχεται από ελεγχόμενο λεξιλόγιο. Ενδεικτικά:
Μορφότυπος αρχείου / Τύπος μέσων:
Ένας μορφότυπος θεωρείται «ανοικτός» ή «μηχαναγνώσιμος» όταν η τιμή του πεδίου
formatτου πόρου ανήκει στα αντίστοιχα λεξιλόγια (όπως «Machine Readable File Format», «File Type – Non Proprietary Format») που έχουν ρυθμιστεί στο portal.Αν χρησιμοποιείται «αυθαίρετη» τιμή (π.χ. ελεύθερο κείμενο που δεν υπάρχει στο λεξιλόγιο), το MQA δεν μπορεί να το αναγνωρίσει ως σωστό open/machine‑readable format.
Άδειες χρήσης:
Το MQA ελέγχει τόσο αν υπάρχει κάποια άδεια (
license,license_url,license_id,license_title), όσο και αν η άδεια προέρχεται από το λεξιλόγιο αδειών («Licence»).Η χρήση του πεδίου
license(συνδεδεμένου με λεξιλόγιο) βοηθά να αναγνωριστεί η άδεια ως «σωστή» και να δοθεί η μέγιστη βαθμολογία στα σχετικά κριτήρια.
Δικαιώματα πρόσβασης (accessRights):
Αντίστοιχα, το πεδίο
access_rightsελέγχεται τόσο για την ύπαρξή του, όσο και για το αν η τιμή του ανήκει στο λεξιλόγιο «Access right» (π.χ.PUBLIC,RESTRICTEDκ.λπ.).
Για περισσότερες πληροφορίες σχετικά με τα λεξιλόγια που χρησιμοποιούνται στο data.gov.gr (π.χ. μορφότυποι, άδειες, δικαιώματα πρόσβασης), δείτε τον ξεχωριστό οδηγό:
Εκεί περιγράφεται αναλυτικά πώς ορίζονται και πώς χρησιμοποιούνται τα λεξιλόγια.
Last updated