CSW Harvester (Catalog Service for the Web)

Διαδικασία Συγκομιδής μέσω CSW

Πρόκειται για τη διαδικασία συλλογής δεδομένων με γεωχωρική πληροφορία, από πηγές τύπου ISO19139. Έτσι, επιτυγχάνεται η αυτόματη εισαγωγή και ενημέρωση μεταδεδομένων από αποθετήρια που υποστηρίζουν το πρότυπο OGC CSW (Catalogue Service for the Web).

Προσθήκη Νέας Πηγής CSW

Η διαδικασία δημιουργίας μιας νέας πηγής συγκομιδής CSW μπορεί να γίνει είτε μέσω της Διεπαφής Χρήστη του data.gov.gr, είτε μέσω του API.

Τα Διαθέσιμα πεδία είναι:

Πεδίο
Περιγραφή

URL

Το endpoint της υπηρεσίας CSW (π.χ. https://geo.example.org/csw)

Τίτλος

Όνομα της πηγής (π.χ. “Geoportal CSW Source”)

Περιγραφή

Περιγραφή της πηγής

Τύπος πηγής

csw

Συχνότητα ενημέρωσης

Η επιλογή γίνεται μέσα από ποικίλες προεπιλεγμένες χρονικές περιόδους, καθώς και χειροκίνητη

Διαμόρφωση

JSON αντικείμενο με προαιρετικές επιλογές

Οργανισμός

Ο Οργανισμός που έχει την "πατρότητα" των αντληθέντων δεδομένων

Εκ των ανωτέρω πεδίων, τα απαιτούμενα, είναι: URL, Τίτλος, Τύπος πηγής, και Διαμόρφωση.

Στάδια Συγκομιδής

Ο μηχανισμός συγκομιδής λειτουργεί σε τρία στάδια:

  1. Gather Stage

    • Ανακτά όλα τα απομακρυσμένα αναγνωριστικά από τον CSW server.

    • Παράγει μια λίστα από αντικείμενα που αντιστοιχούν σε κάθε εγγραφή.

  2. Fetch Stage

    • Κατεβάζει τα μεταδεδομένα ISO19139 για κάθε αντικείμενο που εντοπίστηκε στο προηγούμενο στάδιο.

    • Τα αποθηκεύει προσωρινά στη βάση δεδομένων της πλατφόρμας ανοιχτών δεδομένων.

  3. Import Stage

    • Ελέγχει τα μεταδεδομένα.

    • Μετατρέπει τα μεταδεδομένα σε Σύνολα Δεδομένων, σύμφωνα με το πρότυπο DCAT-AP που τηρείται στο data.gov.gr.

    • Ενημερώνει ή δημιουργεί εγγραφές στη βάση δεδομένων του συστήματος.

Επικύρωση

Η επικύρωση γίνεται με χρήση προφίλ (validator profiles), όπως το iso19139eden ή άλλα κατάλληλα σχήματα.

Επιλογές Παραμετροποίησης (Configuration JSON)

Κατά τη δημιουργία μιας πηγής CSW, μπορεί να δοθεί JSON διαμόρφωση στο πεδίο Διαμόρφωση.

Παράδειγμα:

Παράμετρος
Τύπος
Περιγραφή

default_tags

Λίστα

Ετικέτες που θα προστεθούν σε όλα τα datasets

default_extras

Λεξικό

Ζεύγη key-value που θα προστεθούν στα extras

override_extras

Boolean

Αντικαθιστά υπάρχουσες τιμές extras

clean_tags

Boolean

Κανονικοποιεί τις ετικέτες (π.χ. χωρίς τόνους, πεζά, χωρίς κενά)

validator_profiles

Λίστα

Καθορίζει ποια προφίλ επικύρωσης θα χρησιμοποιηθούν

Παράδειγμα Χρήσης μέσω Διεπαφής χρήστη

Επιλέγουμε τις Ρυθμίσεις Διαχειριστή Συστήματος και από τις διαθέσιμες επιλογές, τη Συγκομιδή και βρισκόμαστε μπροστά στις πηγές Συγκομιδής που υπάρχουν ήδη καταχωρημένες.

Υπάρχει φυσικά η δυνατότητα προσθήκης νέας πηγής, μέσω της Προσθήκης Πηγής Συγκομιδής

Επιλέγοντας μία από τις διαθέσιμες πηγές, έστω του Δήμου Αθηναίων, μεταφερόμαστε στην οθόνη των Συνόλων Δεδομένων που έχουν ήδη αντληθεί μέσω της συγκεκριμένης Πηγής Συγκομιδής.

Στην καρτέλα Σχετικά, έχουμε κάποιες από τις βασικές πληροφορίες για τη συγκεκριμένη πηγή.

Επιλέγοντας το κουμπί Διαχειριστής

εμφανίζεται αρχικά η τελευταία εργασία συλλογής. Επιλέγοντας την Προβολή πλήρους αναφοράς εργασίας αναπτύσεται η Αναφορά Σφαλμάτων και τα έγγραφα στα οποία αυτά αναφέρονται.

Επιλέγοντας την καρτέλα Εργασίες

οδηγούμαστε στην προβολή του πλήθους των συγκομιδών που έχουν προηγηθεί και κάποια στοιχεία που περιλαμβάνονται στην καθεμιά διαδικασία.

Η τελευταία καρτέλα Επεξεργασία μας επιτρέπει να τροποποιήσουμε τις τιμές των πεδίων της συγκεκριμένης πηγής συγκομιδής.

Η διαδικασία της Συγκομιδής ξεκινά άμεσα με την επιλογή του κουμπιού Επανασυγκομιδή . Μετά την έναρξη της διαδικασίας, μπορούμε οποιαδήποτε στιγμή να την διακόψουμε πριν ολοκληρωθεί, επιλέγοντας το κουμπί STOP και θα αποθηκευτούν όσα Σύνολα Δεδομένων και Υπηρεσίες έχουν μέχρι τη στιγμή εκείνη αντληθεί.

Πλάι στην Επανασυγκομιδή, υπάρχει το κουμπί Εκκαθάριση με την επιλογή του οποίου, διαγράφονται όλες οι εργασίες Συγκομιδής και υπαρχόντων Συνόλων Δεδομένων και Υπηρεσιών από αυτή την πηγή.

Τέλος, με την επιλογή Προβολή πηγής συγκομιδής επανερχόμαστε στην σελίδα που αρχικά είχαμε βρεθεί και παρουσιάζει τα αντληθέντα Σύνολα Δεδομένων, μέσω της επιλεγμένης πηγής Συγκομιδής.

Παράδειγμα Χρήσης μέσω API

Δημιουργία πηγής συγκομιδής CSW:

Εφόσον λοιπόν έχει καταχωρηθεί η συγκεκριμένη πηγή, η διαδικασία της Συγκομιδής μπορεί να ολοκληρωθεί μέσω της Διεπαφής χρήστη, όπως παρουσιάστηκε προηγουμένως.

Αντιστοιχίσεις πεδίων από τα δεδομένα της πηγής, στα τελικά Σύνολα Δεδομένων και Υπηρεσίες στην πύλη

  • Άμεσες Αντιστοιχίσεις (Χωρίς Σημαντική Επεξεργασία)

Πηγή

Προορισμός

Σχόλια

title

title

Τίτλος του dataset

abstract

notes

Περιγραφή του dataset

tags

tags

Λίστα ετικετών

  • Πεδία που Απαιτούν Επεξεργασία

Λογική ταυτοποίησης τύπου οντότητας (Package Type)

Όπου συναντάται ετούτη η περίπτωση, είναι ξεκάθαρο ότι αναφερόμαστε σε Υπηρεσία Δεδομένων (data-service)

Λογική ενίσχυσης χωρικής κάλυψης

Η ροή της διαδικασίας που ακολουθήθηκε προκειμένου να ταυτοποιηθούν και να αντιστοιχηθούν σωστά οι τιμές, είναι η εξής:

1

Ανάγνωση Bounding Box Coordinates

2

Υπολογισμός Centroid από BBOX

Υπολογισμός κέντρου από τις γωνίες του ορθογωνίου

3

Δημιουργία GeoJSON Structures

Για BBOX (Πολύγωνο):

Για Centroid (Σημείο):

4

Δημιουργία Ανθρωπόληπτης Περιγραφής

Υπολογίζεται αφενός το εμβαδό του δοθέντος παραλληλογράμου και αφετέρου η γεωγραφική τοποθέτησή του στον χάρτη και βάσει συγκρίσεων, τελικά στην ετικέτα καταχωρείται η αντίστοιχη περιγραφή όπως για παράδειγμα:

ή σε επίπεδο έκτασης:

Λογική εξαγωγής σημείων επικοινωνίας:

Ας υποθέσουμε ότι στον κατάλογο της πηγής, συναντούμε την πληροφορία του ακόλουθου παραδείγματος:

Αντιστοιχίες Πεδίων

1. Ονόματα Οργανισμών

2. Διευθύνσεις Email

3. Ιστοσελίδες

4. URIs

Λογική για το landing page URL:

Δύναται να συναντήσουμε την εν λόγω πληροφορία, με αρκετά διαφορετικά patterns. Ως εκ τούτου, τα ενδεχόμενα μπορεί να είναι τα εξής:

Αντιστοιχίες Πεδίων

1. Από Identifier

2. Επιβεβαιωμένα Landing Page Patterns

Α. Πρωτόκολλα:

Β. GeoNetwork Catalog URLs:

Γ. GeoNode Layers URLs:

Δ. YPEKA GeoNetwork URLs:

Λογική για τη μορφή πόρων:

Αντιστοιχίες Πεδίων

1. Από Πρωτόκολλα OGC

2. Από URL Patterns

3. Από File Extensions

4. Από MIME Types

Λογική Endpoint URLs για Data Services:

Αντιστοιχίες Πεδίων

Για Data-Services:

Για Datasets (Κανονική Συμπεριφορά):

Λογική αυτόματου access_rights setting:

Σημασιολογία της Τρέχουσας Τιμής

Last updated