Δευτέρα, 4 Δεκεμβρίου 2017

Δομή, λειτουργία, και εξέλιξη.


Ο διάσημος αρχιτέκτονας Luis Sullivan διατύπωσε στις αρχές του προηγούμενου αιώνα την πρόταση “η δομή ακολουθεί την λειτουργία”. Το αξίωμα αυτό αποτέλεσε μια από τις αρχές του κινήματος της μοντέρνας αρχιτεκτονικής, αλλά είναι και μια βασική αρχή των ζωντανών οργανισμών. Η δομή, από το σχήμα τους σώματος ζώντων οργανισμών μέχρι και την διάταξη των ατόμων στα μόρια που αποτελούν τα κύτταρα τους, υπηρετεί την λειτουργία τους. Για αυτό τον λόγο οι δομές των μακρομορίων (πρωτεϊνών, νουκλεϊκών οξέων, κτλ) που "χτίζουν” τον ανθρώπινο οργανισμό, είναι απαραίτητες για την κατανόηση της χημικής βάσης της ζωής, αλλά και για την ανάπτυξη καινοτόμων φαρμάκων. Οι περισσότερες μοριακές δομές (πάνω από το 90% το συνόλου, πάνω από 100 χιλιάδες) ιστορικά έχουν προσδιοριστεί με την μέθοδο της κρυσταλλογραφίας ακτίνων Χ. 

Η Τράπεζα Δεδομένων Πρωτεϊνικών Δομών (Protein Data Bank, PDB), είναι η παλαιότερη δημόσια ηλεκτρονική αρχειοθήκη βιολογικών δεδομένων. Αποτελεί έναν ιδιαίτερα δημοφιλή ιστότοπο για ερευνητές, καθώς και φοιτητές από το λύκειο έως το μεταπτυχιακό επίπεδο: 1.5 εκατομμύρια αρχεία με μοριακές δομές από το PDB “κατεβάζονται” κατά μέσο όρο καθημερινά απο διάφρους χρήστες. Το PDB όμως είναι ένα ιστορικό αρχείο. Διατηρεί το δομικό μοντέλο και τα πειραματικά δεδομένα που υποστηρίζουν το μοντέλο, αλλά δεν τα ενημερώνει. Το 2009, το λογιστικό μας PDB-REDO αμφισβήτησε αυτή την έννοια, προωθώντας ενεργά την ιδέα ότι τα μοντέλα των υπαρχόντων δομών, οφείλουν να επανεξετάζονται σε τακτική βάση με βάση τις νέες υπολογιστικές μεθόδους που αναπτύσσονται συνεχώς, χρησιμοποιώντας τα πειραματικά δεδομένα περίθλασης που είναι επίσης αποθηκευμένα στην PDB. 

Παραδείγματα δομών δικτύων εξελικτικών σχέσεων πρωτεϊνικών δομών 
Τα μακρομόρια όμως έχουν μεταξύ τους εξελικτικές σχέσεις. Η ανθρώπινη αιμοσφαιρίνη είναι ομόλογη της αιμοσφαιρίνης από το άλογο ή την φάλαινα. Πολλά ένζυμα, έχουν σαφή σχέση από τα βακτήρια μέχρι τον άνθρωπο. Εφόσον η λειτουργία είναι παρόμοια, και η δομή είναι παρόμοια. Αυτή η πληροφορία, είναι ιδιαίτερα σημαντική για την μοντελοποίηση δομών μακρομορίων χωρίς πειραματικά δεδομένα, με αποκλειστικά υπολογιστικές μεθόδους. Παρόλο όμως που στην μοντελοποίηση των δομών η ομολογία αποτελεί το βασικό κριτήριο για την πρόβλεψη της δομής, στις πειραματικά προσδιορισμένες δομές δεν χρησιμοποιείται. Όλες οι μοριακές δομές του PDB, δεν λαμβάνουν υπόψιν τους αυτές τις εξελικτικές σχέσεις.

Στην πρόσφατη δημοσίευση μας, αρχικά σε δημόσια ελεύθερη πρόσβαση στο BioRχiv και πλεόν στο Protein Science, περιγράφουμε νέους αλγορίθμους κρυσταλλογραφίας που επιτρέπουν τη μεταφορά πληροφοριών σχετικά με μοτίβα δεσμών υδρογόνου, από κάθε δομή του PDB σε κάθε άλλη δομή του PDB, με βάση την ομολογία. Αυτές οι διαδικασίες βελτιώνουν σημαντικά την ποιότητα των νέων δομικών μοντέλων που παράγουμε, σε σύγκριση με το PDB και τις παλαιότερες εκδόσεις του PDB-REDO, ιδιαίτερα όταν έχουμε λιγότερα πειραματικά δεδομένα, στις δομές που για πειραματικούς λόγους είναι "χαμηλής διακριτικότητας". Με τη χρήση δικτύων υπολογιστικού πλέγματος στο San Diego Supercomputing Center, αναδιοργανώσαμε το σύνολο του PDB για το οποίο υπάρχουν πειραματικά δεδομένα (περισσότερες από 100,000 δομές). Αυτή η νέα βάση είναι διαθέσιμη χωρίς περιορισμούς σε όλη την επιστημονική κοινότητα (https://pdb-redo.eu) και για πρώτη φορά λαμβάνει υπόψη την ομολογία μεταξύ δομών με συστηματικό τρόπο, διοχετεύοντας τις πληροφορίες και από τις νεότερες χρονολογικά δομές πίσω στις παλαιότερες καταχωρίσεις του PDB. 

H εργασία μας θα έχει άμεσο ενδιαφέρον για τους επιστήμονες στους τομείς της δομικής βιολογίας αλλά και τους επιστήμονες βιοπληροφορικής που ασχολούνται με την μοντελοποίηση δομών, αλλά κυρίως για τα εκατομμύρια των χρηστών δομών PDB σε όλο τον κόσμο. Είναι τέλος σημαντικό, ότι η ομάδας μας στο Ινστιτούτο για τον Καρκίνο της Ολλανδίας, η φαρμακευτική εταιρία Janssen (της ομάδας  Johnson and Johnson) και το κέντρο υπερυπολογιστών του San Diego των ΗΠΑ, συνεργάστηκαν για αυτή την εργασία. Είναι επίσης σημαντικό, ότι και τα τρία συνεργαζόμενα Ινστιτούτα, συμφώνησα να είναι προσβάσιμα στο κοινό άμεσα και χωρίς περιορισμούς όχι μόνον τα αποτελέσματα (η βάση δεδομένων PDB-REDO) αλλά και η επιστημονική δημοσίευση αρχικά στην καινοτόμο ακαδημαϊκή πλατφόρμα του BioRχiv και με ελεύθερη πρόσβαση στο Protein Science.

ΥΓ Δεν διαφεύγει της προσοχής μου ότι η λειτουργία και των πολιτικών οργανισμών εξαρτάται απο την δομή τους, αλλά και απο τις εξελικτικές σχέσεις που οδήγησαν στην δημιουργία τους.