CSW Harvester (Catalog Service for the Web)
Διαδικασία Συγκομιδής μέσω CSW
Πρόκειται για τη διαδικασία συλλογής δεδομένων με γεωχωρική πληροφορία, από πηγές τύπου ISO19139. Έτσι, επιτυγχάνεται η αυτόματη εισαγωγή και ενημέρωση μεταδεδομένων από αποθετήρια που υποστηρίζουν το πρότυπο OGC CSW (Catalogue Service for the Web).
Προσθήκη Νέας Πηγής CSW
Η διαδικασία δημιουργίας μιας νέας πηγής συγκομιδής CSW μπορεί να γίνει είτε μέσω της Διεπαφής Χρήστη του data.gov.gr, είτε μέσω του API.
Τα Διαθέσιμα πεδία είναι:
URL
Το endpoint της υπηρεσίας CSW (π.χ. https://geo.example.org/csw)
Τίτλος
Όνομα της πηγής (π.χ. “Geoportal CSW Source”)
Περιγραφή
Περιγραφή της πηγής
Τύπος πηγής
csw
Συχνότητα ενημέρωσης
Η επιλογή γίνεται μέσα από ποικίλες προεπιλεγμένες χρονικές περιόδους, καθώς και χειροκίνητη
Διαμόρφωση
JSON αντικείμενο με προαιρετικές επιλογές
Οργανισμός
Ο Οργανισμός που έχει την "πατρότητα" των αντληθέντων δεδομένων
Εκ των ανωτέρω πεδίων, τα απαιτούμενα, είναι: URL, Τίτλος, Τύπος πηγής, και Διαμόρφωση.
Στάδια Συγκομιδής
Ο μηχανισμός συγκομιδής λειτουργεί σε τρία στάδια:
Gather Stage
Ανακτά όλα τα απομακρυσμένα αναγνωριστικά από τον CSW server.
Παράγει μια λίστα από αντικείμενα που αντιστοιχούν σε κάθε εγγραφή.
Fetch Stage
Κατεβάζει τα μεταδεδομένα ISO19139 για κάθε αντικείμενο που εντοπίστηκε στο προηγούμενο στάδιο.
Τα αποθηκεύει προσωρινά στη βάση δεδομένων της πλατφόρμας ανοιχτών δεδομένων.
Import Stage
Ελέγχει τα μεταδεδομένα.
Μετατρέπει τα μεταδεδομένα σε Σύνολα Δεδομένων, σύμφωνα με το πρότυπο DCAT-AP που τηρείται στο data.gov.gr.
Ενημερώνει ή δημιουργεί εγγραφές στη βάση δεδομένων του συστήματος.
Επικύρωση
Η επικύρωση γίνεται με χρήση προφίλ (validator profiles), όπως το iso19139eden ή άλλα κατάλληλα σχήματα.
Επιλογές Παραμετροποίησης (Configuration JSON)
Κατά τη δημιουργία μιας πηγής CSW, μπορεί να δοθεί JSON διαμόρφωση στο πεδίο Διαμόρφωση.
Παράδειγμα:
default_tags
Λίστα
Ετικέτες που θα προστεθούν σε όλα τα datasets
default_extras
Λεξικό
Ζεύγη key-value που θα προστεθούν στα extras
override_extras
Boolean
Αντικαθιστά υπάρχουσες τιμές extras
clean_tags
Boolean
Κανονικοποιεί τις ετικέτες (π.χ. χωρίς τόνους, πεζά, χωρίς κενά)
validator_profiles
Λίστα
Καθορίζει ποια προφίλ επικύρωσης θα χρησιμοποιηθούν
Παράδειγμα Χρήσης μέσω Διεπαφής χρήστη
Επιλέγουμε τις Ρυθμίσεις Διαχειριστή Συστήματος
και από τις διαθέσιμες επιλογές, τη Συγκομιδή
και βρισκόμαστε μπροστά στις πηγές Συγκομιδής που υπάρχουν ήδη καταχωρημένες.

Υπάρχει φυσικά η δυνατότητα προσθήκης νέας πηγής, μέσω της Προσθήκης Πηγής Συγκομιδής ![]()
Επιλέγοντας μία από τις διαθέσιμες πηγές, έστω του Δήμου Αθηναίων, μεταφερόμαστε στην οθόνη των Συνόλων Δεδομένων που έχουν ήδη αντληθεί μέσω της συγκεκριμένης Πηγής Συγκομιδής.

Στην καρτέλα Σχετικά, έχουμε κάποιες από τις βασικές πληροφορίες για τη συγκεκριμένη πηγή.

Επιλέγοντας το κουμπί Διαχειριστής

εμφανίζεται αρχικά η τελευταία εργασία συλλογής. Επιλέγοντας την Προβολή πλήρους αναφοράς εργασίας
αναπτύσεται η Αναφορά Σφαλμάτων και τα έγγραφα στα οποία αυτά αναφέρονται.
Επιλέγοντας την καρτέλα Εργασίες

οδηγούμαστε στην προβολή του πλήθους των συγκομιδών που έχουν προηγηθεί και κάποια στοιχεία που περιλαμβάνονται στην καθεμιά διαδικασία.
Η τελευταία καρτέλα Επεξεργασία
μας επιτρέπει να τροποποιήσουμε τις τιμές των πεδίων της συγκεκριμένης πηγής συγκομιδής.
Η διαδικασία της Συγκομιδής ξεκινά άμεσα με την επιλογή του κουμπιού Επανασυγκομιδή
. Μετά την έναρξη της διαδικασίας, μπορούμε οποιαδήποτε στιγμή να την διακόψουμε πριν ολοκληρωθεί, επιλέγοντας το κουμπί STOP και θα αποθηκευτούν όσα Σύνολα Δεδομένων και Υπηρεσίες έχουν μέχρι τη στιγμή εκείνη αντληθεί.
Πλάι στην Επανασυγκομιδή, υπάρχει το κουμπί Εκκαθάριση
με την επιλογή του οποίου, διαγράφονται όλες οι εργασίες Συγκομιδής και υπαρχόντων Συνόλων Δεδομένων και Υπηρεσιών από αυτή την πηγή.
Τέλος, με την επιλογή Προβολή πηγής συγκομιδής
επανερχόμαστε στην σελίδα που αρχικά είχαμε βρεθεί και παρουσιάζει τα αντληθέντα Σύνολα Δεδομένων, μέσω της επιλεγμένης πηγής Συγκομιδής.
Παράδειγμα Χρήσης μέσω API
Δημιουργία πηγής συγκομιδής CSW:
Εφόσον λοιπόν έχει καταχωρηθεί η συγκεκριμένη πηγή, η διαδικασία της Συγκομιδής μπορεί να ολοκληρωθεί μέσω της Διεπαφής χρήστη, όπως παρουσιάστηκε προηγουμένως.
Αντιστοιχίσεις πεδίων από τα δεδομένα της πηγής, στα τελικά Σύνολα Δεδομένων και Υπηρεσίες στην πύλη
Άμεσες Αντιστοιχίσεις (Χωρίς Σημαντική Επεξεργασία)
Πηγή
Προορισμός
Σχόλια
title
title
Τίτλος του dataset
abstract
notes
Περιγραφή του dataset
tags
tags
Λίστα ετικετών
Πεδία που Απαιτούν Επεξεργασία
Λογική ταυτοποίησης τύπου οντότητας (Package Type)
Όπου συναντάται ετούτη η περίπτωση, είναι ξεκάθαρο ότι αναφερόμαστε σε Υπηρεσία Δεδομένων (data-service)
Η ύπαρξη του συγκεκριμένου πεδίου στο πρότυπο μεταδεδομένων της πηγής, δηλώνει ευθέως αντιστοίχιση σε Υπηρεσία Δεδομένων (data-service)
Σε αυτή την περίπτωση η δήλωση του πεδίου με αναφορά σε Υπηρεσία Δεδομένων, μπορεί να γίνεται με ελεύθερο κείμενο,
που με την ανάλογη κανονικοποίηση,
αναζητούμε τιμές που υποδηλώνουν service:
Λογική ενίσχυσης χωρικής κάλυψης
Η ροή της διαδικασίας που ακολουθήθηκε προκειμένου να ταυτοποιηθούν και να αντιστοιχηθούν σωστά οι τιμές, είναι η εξής:
Ανάγνωση Bounding Box Coordinates
Υπολογισμός Centroid από BBOX
Υπολογισμός κέντρου από τις γωνίες του ορθογωνίου
Δημιουργία GeoJSON Structures
Για BBOX (Πολύγωνο):
Για Centroid (Σημείο):
Δημιουργία Ανθρωπόληπτης Περιγραφής
Υπολογίζεται αφενός το εμβαδό του δοθέντος παραλληλογράμου και αφετέρου η γεωγραφική τοποθέτησή του στον χάρτη και βάσει συγκρίσεων, τελικά στην ετικέτα καταχωρείται η αντίστοιχη περιγραφή όπως για παράδειγμα:
ή σε επίπεδο έκτασης:
Λογική εξαγωγής σημείων επικοινωνίας:
Ας υποθέσουμε ότι στον κατάλογο της πηγής, συναντούμε την πληροφορία του ακόλουθου παραδείγματος:
Αντιστοιχίες Πεδίων
1. Ονόματα Οργανισμών
2. Διευθύνσεις Email
3. Ιστοσελίδες
4. URIs
Λογική για το landing page URL:
Δύναται να συναντήσουμε την εν λόγω πληροφορία, με αρκετά διαφορετικά patterns. Ως εκ τούτου, τα ενδεχόμενα μπορεί να είναι τα εξής:
Αντιστοιχίες Πεδίων
1. Από Identifier
2. Επιβεβαιωμένα Landing Page Patterns
Α. Πρωτόκολλα:
Β. GeoNetwork Catalog URLs:
Γ. GeoNode Layers URLs:
Δ. YPEKA GeoNetwork URLs:
Λογική για τη μορφή πόρων:
Αντιστοιχίες Πεδίων
1. Από Πρωτόκολλα OGC
2. Από URL Patterns
3. Από File Extensions
4. Από MIME Types
Λογική Endpoint URLs για Data Services:
Αντιστοιχίες Πεδίων
Για Data-Services:
Για Datasets (Κανονική Συμπεριφορά):
Λογική αυτόματου access_rights setting:
Σημασιολογία της Τρέχουσας Τιμής
Last updated