Τα γενικά σύνολα δεδομένων που αποκαλύπτουν τη λειτουργία των γονιδιωματικών παραλλαγών στην υγεία και την ασθένεια έχουν καταστεί ευκολότερα με την έναρξη μιας νέας βάσης δεδομένων ανοιχτού κώδικα που αναπτύχθηκε από ερευνητές της Αυστραλίας και της Βόρειας Αμερικής. Η βάση δεδομένων MaveDB είναι ένα αποθετήριο δεδομένων από πειράματα που ονομάζονται πολλαπλές δοκιμασίες παραλλαγής αποτελέσματος (MAVEs) – που μετρούν συστηματικά την επίδραση χιλιάδων επιμέρους παραλλαγών αλληλουχίας στη λειτουργία ενός γονιδίου. Αυτά τα πειράματα μπορούν να παρέχουν πολύτιμες πληροφορίες σχετικά με τον τρόπο με τον οποίο οι πρωτεΐνες που παράγονται από αυτή τη γονιδιακή λειτουργία, τον τρόπο με τον οποίο οι παραλλαγές αυτού του γονιδίου μπορούν να συμβάλλουν στην ασθένεια και τον τρόπο δημιουργίας συνθετικών εκδόσεων πρωτεϊνών που είναι πιο αποτελεσματικές από την αρχική πρωτεΐνη. Το MaveDB είναι η πρώτη δημόσια προσβάσιμη βάση δεδομένων για αυτά τα στοιχεία. Η ανάπτυξή του καθοδηγείται από τον Δρ. Alan Rubin από το Ινστιτούτο Walter και Eliza Hall της Αυστραλίας, τον Αναπληρωτή Καθηγητή Douglas Fowler από το Πανεπιστήμιο της Ουάσινγκτον των ΗΠΑ και τον καθηγητή Frederick Roth από το Πανεπιστήμιο του Τορόντο του Καναδά. Το MaveDB περιγράφηκε στο περιοδικό Genome Biology.
Ενίσχυση της έρευνας για τη γονιδιωματική
Τα MAVE έχουν φέρει επανάσταση στην ικανότητα των ερευνητών να κατανοήσουν τη λειτουργία των γονιδίων και τους ρόλους τους στην ασθένεια, δήλωσε ο Δρ Rubin. «Στο παρελθόν, οι ερευνητές έπρεπε να επικεντρωθούν σε μια χούφτα αλλαγές σε ένα γονίδιο για να καταλάβουν τη λειτουργία του», είπε. “Ήταν πολύ περίπλοκο να παράγει τα δεδομένα από μια εξαντλητική σάρωση των παραλλαγών ενός γονιδίου που μπορεί να είναι εκατοντάδες ή χιλιάδες βάσεις σε μήκος.
“Η ανάπτυξη των MAVE παρείχε στους ερευνητές τη δυνατότητα να μετρήσουν πειραματικά κάθε μεμονωμένη γενετική αλλαγή ενός γονιδίου με τις λειτουργικές τους συνέπειες. Αυτές οι δοκιμασίες μπορούν να χειριστούν δεκάδες χιλιάδες γενετικές παραλλαγές, επιτρέποντας στους ερευνητές να οικειοποιήσουν τις σχετικές αλλαγές και να τις τοποθετήσουν στο πλαίσιο”. Μέχρι τώρα, τα στοιχεία από τα πειράματα της MAVE υπήρχαν μεμονωμένα, με δεδομένα από μεμονωμένες μελέτες που μεταφορτώθηκαν σε ιστότοπους περιοδικών όταν δημοσιεύθηκαν ερευνητικά έγγραφα ή παρασχέθηκαν κατόπιν αιτήματος σε άλλους ερευνητές.
«Αυτό δυσκολεύει τους ερευνητές να έχουν πρόσβαση στα δεδομένα άλλων ομάδων ή ακόμα και να γνωρίζουν ότι έχει πραγματοποιηθεί ένα συγκεκριμένο πείραμα MAVE, γεγονός που παρεμποδίζει δυνητικά τις συνεργασίες και την πρόοδο της έρευνας στον τομέα της γονιδιωματικής», δήλωσε ο Δρ Ρούμπιν.
“Το MaveDB διευκολύνει τους επιστήμονες να μοιράζονται τα σύνολα δεδομένων τους σε μια ενιαία τοποθεσία χρησιμοποιώντας έναν ευέλικτο μορφότυπο που εφαρμόζεται σε πολλούς ερευνητικούς τομείς και επιτρέπει σε άλλους επιστήμονες να έχουν εύκολη πρόσβαση σε αυτά τα δεδομένα για να ενισχύσουν την έρευνά τους. να μιλήσει σε άλλες βάσεις δεδομένων για να προσθέσει ένα επιπλέον επίπεδο συνεργατικής ικανότητας.Για τον αναπτυσσόμενο τομέα της έρευνας MAVE, αυτή η βάση δεδομένων είναι ένα σημαντικό βήμα προς την ανοιχτή επιστήμη και την αναπαραγωγικότητα με την εξασφάλιση της διάθεσης δεδομένων ». Τα δεδομένα που λαμβάνονται από τα MAVEs έχουν πολλές εφαρμογές, συμπεριλαμβανομένης της κατανόησης του τρόπου λειτουργίας ενός γονιδίου ή πρωτεΐνης, μέτρησης της συμμετοχής γενετικών παραλλαγών σε μια ασθένεια ή κατανόησης του τρόπου με τον οποίο μια συνθετική πρωτεΐνη – όπως αυτές που χρησιμοποιούνται στη βιοτεχνολογία – μπορεί να γίνει πιο αποτελεσματική.
Οπτικοποίηση δεδομένων
Εκτός από την ίδρυση του MaveDB, η ομάδα ανέπτυξε επίσης λογισμικό απεικόνισης δεδομένων, που ονομάζεται MaveVis, το οποίο διευκολύνει τους ερευνητές να κατανοούν και να ερμηνεύουν τα αποτελέσματα των πειραμάτων MAVE. “Το MaveVis παρέχει μια άμεση και σταθερή απεικόνιση δεδομένων MAVE, συμπεριλαμβανομένων πολύτιμων σχολιασμών, όπως είναι οι πληροφορίες για τη δομή πρωτεϊνών, που θα επιταχύνουν τη συνεργατική έρευνα”, δήλωσε ο Dr. Rubin. «Θεωρούμε ότι καθώς το MaveDB χρησιμοποιείται ευρύτερα στην κοινότητα της βιοπληροφορικής, θα προστεθούν και άλλες εφαρμογές που παρέχουν νέους τρόπους για την απεικόνιση και την ερμηνεία σύνθετων δεδομένων γονιδιωματικής, οδηγώντας σε νέες ανακαλύψεις που ενισχύουν τη βιοϊατρική έρευνα. ή την κατανόηση του πώς οι γονιδιωματικές παραλλαγές ενός ασθενούς συμβάλλουν σε μια ασθένεια. “