Τράπεζα Δεδομένων OLEUM

Σε περιόδους αυξανόμενου ανταγωνισμού εξαιτίας της παγκοσμιοποίησης και της αυξανόμενης σήμερα ευαισθητοποίησης των πελατών σχετικά με την ποιότητα των τροφίμων, οι οργανισμοί ελέγχου τροφίμων αντιμετωπίζουν παγκοσμίως τη μεγάλη πρόκληση για την εγγύηση της ασφάλειας, της αυθεντικότητας και της ποιότητας των τροφίμων. Στο πλαίσιο του ερευνητικό έργο OLEUM, που είναι μέρος του ΕΕ Η2020, εξετάζεται, και όχι μόνο, ένας μεγάλος αριθμός καθιερωμένων και νέων αναλυτικών τεχνικών ώστε να παραδοθούν εναρμονισμένα πρωτόκολλα ανάλυσης. Υλοποιείται, επίσης, μια βάση δεδομένων, η Τράπεζα Δεδομένων OLEUM, για την παροχή στους ευρωπαϊκούς φορείς ελέγχου μιας κοινής πλατφόρμας εφοδιασμένης με αναλυτικά δεδομένα, ταυτόχρονα με σχετικές πρόσθετες πληροφορίες (μεταδεδομένα), από την εξέταση των ελαίων αναφοράς στο πλαίσιο του ερευνητικού έργου. Η διαθεσιμότητα αυτών των δεδομένων θα επιτρέψει μια περισσότερο αποτελεσματική συνεργασία και επάρκεια των εγκεκριμένων εργαστηρίων ελέγχου ποιότητας στην Ευρώπη και μια καλύτερη παγκόσμια εναρμόνιση. Η τράπεζα δεδομένων OLEUM θα επιτρέψει τη διευκόλυνση της σύγκρισης των επιμέρους δοκιμών, μέσω της καταχώρισης των αποτελεσμάτων, των καμπυλών βαθμονόμησης ή, ακόμη, των φασμάτων ή των χρωματογραφημάτων. Μια σημαντική πρόκληση, εκτός από τις ερωτήσεις σχετικά με την αρχιτεκτονική της τράπεζας δεδομένων, είναι και η αντιμετώπιση των ετερογενών αναλυτικών δεδομένων. Η τράπεζα δεδομένων επιτρέπει όχι μόνο τη μεταφόρτωση των αναλυτικών μετρήσεων, αλλά και την επανεξέτασή τους, ακόμη και όταν δεν είναι διαθέσιμο, στο άτομο που θα προβαίνει στην επανεξέταση των μετρήσεων αυτών, το ιδιόκτητο λογισμικό αυτού που το έχει πωλήσει σ’ αυτόν που απόκτησε τα δεδομένα. Περισσότερες από 20 διαφορετικές τεχνικές θα έχουν ως αποτέλεσμα μετρήσεις που θα είναι αποθηκευμένες σε περισσότερες από 20 διαφορετικές μορφές δεδομένων, που ο αριθμός τους θα μπορεί να αυξηθεί λόγω του γεγονότος ότι στις περισσότερες περιπτώσεις διαφορετικοί πωλητές προσφέρουν συσκευές μέτρησης που η αρχή της λειτουργίας τους βασίζεται στην ίδια αναλυτική τεχνική.

 

Εικόνα 1. Ετερογενή αναλυτικά δεδομένα μπορεί να φορτώνονται στην τράπεζα δεδομένων OLEUM και να διαμοιράζονται στα ενδιαφερόμενα μέρη.

 

Το αρχικό έργο που επιτεύχθηκε στο πλαίσιο του πακέτου εργασίας 5.3 ήταν να συγκεντρωθούν, από τους εταίρους του έργου που εμπλέκονται σε πακέτα εργασίας με αναλυτικό έργο, παραδείγματα αρχείων με ακατέργαστα δεδομένα από μετρήσεις. Τα πιο πολλά από τα αρχεία αυτά δεν είναι σε κάποια ανοικτή μορφή, αλλά μάλλον σε μια ιδιόκτητη μορφή που έχει σχέση με τον πωλητή του οργάνου με το οποίο έχει γίνει η απόκτηση των δεδομένων. Ορισμένα από τα αρχεία αυτά μπορούσαν ήδη να διαβαστούν από το λογισμικό OpenChrom, αλλά ένα σημαντικό μέρος αυτών έπρεπε να αποκωδικοποιηθεί ώστε αυτά να καταστούν προσβάσιμα. Σε 70% περίπου των αρχείων που παρέχονται είναι δυνατή η πρόσβαση μέχρι τώρα και 80% τουλάχιστον αυτών μπορεί να διαβαστεί σε κάποιο βαθμό. Η αποκωδικοποίηση των μορφών για σκοπούς διαλειτουργικότητας αποτελεί μια συνεχή εργασία. Από το Σεπτέμβριο του 2018 η δεύτερη εκδοχή της τράπεζας δεδομένων OLEUM είναι άμεσα προσβάσιμη και αξιολογείται εσωτερικά από λίγους εταίρους. Σχεδιάζεται να δοθεί πρόσβαση στη βάση δεδομένων σε όλους τους εταίρους του έργου για μια ευρεία αξιολόγηση.

 

Όλα τα στοιχεία λογισμικού που υλοποιήθηκαν στη βάση δεδομένων επιλέχθηκαν με βάση την ύπαρξη ανοιχτού κώδικα και την καλύτερη επιλογή για να ταιριάζει στο σκοπό αυτό. Το επίκεντρο της διεπαφής χρήστη που εφαρμόστηκε επί του παρόντος στη δεύτερη εκδοχή της βάσης δεδομένων είναι η διαδικασία της δημιουργίας και της διαχείρισης των δεδομένων που είναι διαθέσιμα έτσι ώστε οι εταίροι του έργου να έχουν την υψηλότερη δυνατή ευελιξία για είσοδο στα ετερογενή μεταδεδομένα που σχετίζονται με τα δείγματα αναφοράς και σε κάθε μια από τις διάφορες αναλυτικές διαδικασίες. Λαμβάνοντας υπόψη ότι η βάση δεδομένων θα είναι χρήσιμη μόνο εάν παρέχονται όλες οι απαραίτητες πληροφορίες μαζί με τα οποιαδήποτε αναλυτικά αποτελέσματα, υπάρχουν προς το παρόν τρία τμήματα για τη διαχείριση δεδομένων:

 

  • Διαχείριση δειγμάτων: Οι χρήστες προσθέτουν εδώ τα μεταδεδομένα από αυθεντικά και άλλα δείγματα αναφοράς που έχουν αναλυθεί με οποιαδήποτε τεχνική και των οποίων τα αποτελέσματα / ακατέργαστα δεδομένα πρόκειται να παρασχεθούν. Τα πεδία εισαγωγής είναι προκαθορισμένα, με ορισμένα να είναι υποχρεωτικά και άλλα προαιρετικά.
  • Διαχείριση Τεχνικών: Αυτή η ενότητα έχει σκοπό να δημιουργήσει όλα τα απαραίτητα πεδία μεταδεδομένων που απαιτούνται για κάθε σχετική αναλυτική τεχνική. Δεδομένου ότι τα μεταδεδομένα των διαφόρων τεχνικών είναι εξαιρετικά διαφορετικά, τα πεδία δεν έχουν προκαθοριστεί ακόμη. Αυτό επιτρέπει τη δημιουργία κειμένων ερωτήσεων τα οποία είναι προσαρμοσμένα για να συλλέγουν τα απαραίτητα μεταδεδομένα από κάθε δεδομένα μέτρησης που παρέχονται.
  • Διαχείριση ανάλυσης: Αυτή η ενότητα είναι για την πραγματική μεταφόρτωση ανεπεξέργαστων δεδομένων, αποτελεσμάτων κ.τ.λ. Επιπρόσθετα, ο πάροχος δεδομένων πρέπει να παράσχει τα μεταδεδομένα στην ανάλυση. Αυτό είναι όμως εφικτό μόνο εάν η αντίστοιχη μορφή ερωτήματος της εφαρμοσμένης αναλυτικής τεχνικής έχει διατεθεί στο τμήμα "Διαχείριση Τεχνικών".

 

Εικόνα 2. Διαχείριση Ανάλυσης – Παράδειγμα διεπαφής για την εισαγωγή μεταδεδομένων από SPME-GC-FID μέτρηση.

 

Επιπρόσθετα, έχει δοθεί ιδιαίτερη προσοχή στη διαχείριση των δικαιωμάτων των χρηστών. Αυτή επιτρέπει μια λεπτή προσαρμογή των δικαιωμάτων πρόσβασης που παρέχονται σε κάθε χρήστη από το διαχειριστή. Με την πρώτη ματιά φαίνεται ότι αρκεί να υπάρχουν μόνο τρία διαφορετικά επίπεδα χρηστών με σταθερά δικαιώματα χρήστη, "διαχειριστές" – που έχουν πλήρη πρόσβαση σε όλα τα επίπεδα, "πάροχοι δεδομένων" – που έχουν πρόσβαση σε όλα τα χαρακτηριστικά τα οποία επιτρέπουν την αποστολή δεδομένων και "εγγεγραμμένους χρήστες" – που έχουν τη δυνατότητα να ελέγχουν μόνο τα δεδομένα που διατηρούνται στη βάση δεδομένων. Ωστόσο, στο τρέχον στάδιο του έργου δεν είναι ακόμη πλήρως σαφές ποια δικαιώματα θα πρέπει να δίνονται σε «πάροχο δεδομένων» και σε βασικό «εγγεγραμμένο χρήστη» ή εάν θα πρέπει επίσης να δίνεται περιορισμένη πρόσβαση σε μη εγγεγραμμένους χρήστες.

 

Η μεγαλύτερη τρέχουσα πρόκληση στην ανάπτυξη μιας βάσης δεδομένων είναι να λειτουργήσει ομαλά η λειτουργία μεταφόρτωσης δεδομένων με φακέλους δεδομένων τόσο μεγάλους όσο αυτοί των 2 έως 4 GB, όπως συμβαίνει με τα δεδομένα τα οποία παράγονται, π.χ., από ένα σύστημα GC-QTOF-MS. Παρόλα αυτά, αυτό θα συνεχίσει να εξαρτάται σε μεγάλο βαθμό από την ποιότητα και την ταχύτητα της σύνδεσης στο διαδίκτυο και του υπολογιστή μεταφόρτωσης.

 

Η διεπαφή για την αναζήτηση της βάσης δεδομένων η οποία εφαρμόζεται στο στάδιο αυτό εξακολουθεί να είναι βασική. Με βάση την επανεξέταση της δεύτερης εκδοχής της βάσης αυτής από όλους τους εταίρους του ερευνητικού έργου, η εφαρμογή των δυνατοτήτων αναζήτησης και ανασκόπησής της θα είναι η κύρια προσπάθεια κατά τους προσεχείς μήνες.