DeepMind/Τι είναι το σύστημα τεχνητής νοημοσύνης επανάσταση στη βιολογία – Σε 18 μήνες προέβλεψε τη δομή κάθε γνωστής πρωτεΐνης
Επανάσταση στην επιστήμη της βιολογίας και ελπίδες για άλματα στη φαρμακευτική πυροδοτεί το επίτευγμα της DeepMind, της Alphabet (Google), που πέτυχε μέσα σε 18 μήνες να προβλέψει τη δομή σχεδόν κάθε γνωστής πρωτεΐνης. Αυτό έχει ήδη φέρει θετικά αποτελέσματα στη μάχη κατά της ελονοσίας και των «υπερβακτηριδίων», που αντιστέκονται στα αντιβιοτικά, ενώ αναμένεται να επιταχύνει την ανάπτυξη νέων, εξειδικευμένων φαρμάκων για διάφορες ασθένειες.
Επιμέλεια κειμένου: Ρούλα Σκουρογιάννη
Το σύστημα Τεχνητής Νοημοσύνης –ΑΙ– γνωστό ως AlphaFold
Κάθε πρωτεΐνη –αν μπορούσαμε να την ανοίξουμε– θα βλέπαμε ότι είναι σαν μια σειρά από σφαιρίδια φτιαγμένα από μια αλληλουχία διαφορετικών χημικών ουσιών, τα γνωστά μας αμινοξέα. Ο προσδιορισμός των αναδιπλούμενων σχημάτων των πρωτεϊνών με βάση τις αλληλουχίες των συστατικών αμινοξέων τους ήταν ένα επίμονο πρόβλημα για δεκαετίες στη βιολογία. Μερικά από αυτά τα αμινοξέα έλκονται από άλλα, μερικά απωθούνται από το νερό και οι αλυσίδες σχηματίζουν περίπλοκα σχήματα που είναι δύσκολο να προσδιοριστούν με ακρίβεια.
Αυτές οι αλληλουχίες ‘συναρμολογούνται’ σύμφωνα με τις γενετικές οδηγίες του DNA ενός οργανισμού και κάθε μια πρωτεΐνη έχει ένα μοναδικό τρισδιάστατο σχήμα που καθορίζει πώς λειτουργεί και τι κάνει. Το σχήμα δηλαδή κάθε πρωτεΐνης είναι αυτό που καθορίζει τον τρόπο που δρα, είτε πρόκειται για δομικές πρωτεΐνες, είτε για ενζυματικές πρωτεΐνες που ρυθμίζουν τον μεταβολισμό.
Για να δώσουμε ένα παράδειγμα, θα μπορούσαμε να φανταστούμε τις πρωτεΐνες σαν βιολογικές μηχανές. Με τον ίδιο τρόπο που η δομή μιας μηχανής μας αποκαλύπτει τι κάνει, έτσι και η δομή μιας πρωτεΐνης μας βοηθά να κατανοήσουμε τη λειτουργία της. Για αυτό και η δυνατότητα πρόβλεψης της δομής των πρωτεϊνών παίζει τόσο σημαντικό ρόλο στη βιολογία και τη βιοχημεία και τελικά στην ανάπτυξη φαρμάκων και θεραπειών.
Η εταιρεία τεχνητής νοημοσύνης DeepMind, με έδρα το Ηνωμένο Βασίλειο, ανακοίνωσε για πρώτη φορά ότι είχε αναπτύξει μια μέθοδο για την ακριβή πρόβλεψη της δομής των αναδιπλούμενων πρωτεϊνών στα τέλη του 2020 και στα μέσα του 2021 είχε αποκαλύψει ότι είχε χαρτογραφήσει το 98,5 % των πρωτεϊνών που χρησιμοποιούνται στο ανθρώπινο σώμα.
Πρόσφατα, η εταιρεία ανακοίνωσε ότι δημοσιεύει τις δομές περισσότερων από 200 εκατομμυρίων πρωτεϊνών – σχεδόν όλες εκείνες που καταγράφονται στο παγκοσμίως αναγνωρισμένο αποθετήριο έρευνας πρωτεϊνών, UniProt.
Η DeepMind έχει συνεργαστεί με το Ευρωπαϊκό Ινστιτούτο Βιοπληροφορικής του Ευρωπαϊκού Εργαστηρίου Μοριακής Βιολογίας (EMBL-EBI) για να δημιουργήσει μία βάση δεδομένων με δυνατότητα αναζήτησης όλων αυτών των πληροφοριών, στην οποία μπορούν να έχουν εύκολη και ελεύθερη πρόσβαση ερευνητές σε όλο τον κόσμο, «ένα δώρο στην ανθρωπότητα», όπως αποκαλούν πολλοί τη βάση δεδομένων AlphaFold Protein Structure.
Το σύστημα AlphaFold μπορεί να προσδιορίσει τη δομή μιας πρωτεΐνης μέσα σε ελάχιστο χρόνο συγκριτικά με τις μέχρι τώρα πειραματικές τεχνικές που χρειάζονταν χρόνια και ήταν πολυδάπανες.
Ήδη διαθέσιμα τα πρώτα σημαντικά αποτελέσματα
Ο Demis Hassabis, Διευθύνων Σύμβουλος της DeepMind, λέει ότι η βάση δεδομένων καθιστά την εύρεση μιας δομής πρωτεΐνης –η οποία στο παρελθόν απαιτούσε συχνά χρόνια– «σχεδόν τόσο εύκολη όσο η αναζήτηση στο Google». Η DeepMind Technologies ιδρύθηκε τον Σεπτέμβριο του 2010 και το 2014 εξαγοράστηκε από την Google. Πλέον, είναι η θυγατρική τεχνητής νοημοσύνης της Alphabet, εδρεύει στο Λονδίνο και έχει ερευνητικά κέντρα στον Καναδά, τη Γαλλία και τις Ηνωμένες Πολιτείες.
Το αρχείο έχει ήδη χρησιμοποιηθεί από επιστήμονες για την προώθηση της έρευνας σε διάφορους τομείς.
Ο Matt Higgins, στο Πανεπιστήμιο της Οξφόρδης και οι συνεργάτες του ερεύνησαν μια πρωτεΐνη που πίστευαν ότι ήταν το κλειδί για τη διακοπή του κύκλου ζωής του παρασίτου της ελονοσίας, αλλά προσπαθούσαν να χαρτογραφήσουν τη δομή του.
«Μία από τις πειραματικές μεθόδους που χρησιμοποιούμε είναι η κρυσταλλογραφία ακτίνων Χ», λέει ο Higgins. Αξίζει εδώ να πούμε ότι πρόκειται για μία ερευνητική διαδικασία δαπανηρή και χρονοβόρα «Προκαλούμε τις πρωτεΐνες να σχηματιστούν σε πλέγματα, πυροδοτούμε ακτίνες Χ σε αυτές και παίρνουμε πληροφορίες από αυτά τα μοτίβα περίθλασης ακτίνων Χ για να δούμε πώς μοιάζει το μόριο. Αλλά δεν μπορέσαμε ποτέ, παρά τα πολλά χρόνια δουλειάς, να δούμε με αρκετή λεπτομέρεια πώς μοιάζει αυτό το μόριο».
Όταν λειτούργησε το AlphaFold, έδωσε μια σαφή πρόβλεψη της δομής της πρωτεΐνης που ταίριαζε με τις πληροφορίες που μπόρεσαν να συλλέξουν οι ερευνητές, μέχρι τότε. Έτσι, κατάφεραν να σχεδιάσουν νέες πρωτεΐνες που ελπίζουν ότι θα μπορούσαν να χρησιμεύσουν ως αποτελεσματικό εμβόλιο κατά της ελονοσίας.
Ο συνιδρυτής της DeepMind λέει ότι η τεχνητή νοημοσύνη πρόκειται να λύσει πολλά από τα πιο δύσκολα προβλήματα στην επιστήμη, από τη φύση της ζωής μέχρι την πυρηνική σύντηξη.
Το AlphaFold σε porject για τη διάσπαση των πλαστικών απορριμμάτων και για τα ανθεκτικά στα αντιβιοτικά βακτήρια
· Το Κέντρο Ενζυμικής Καινοτομίας στο Πανεπιστήμιο του Πόρτσμουθ (CEI) χρησιμοποιεί το AlphaFold για προβλέψεις που θα βοηθήσουν στη δημιουργία ταχύτερων ενζύμων για την ανακύκλωση ορισμένων από τα πιο ρυπογόνα πλαστικά μιας χρήσης.
· Μια ομάδα στο Πανεπιστήμιο Boulder του Κολοράντο χρησιμοποιεί το AlphaFold για τη μελέτη της αντοχής στα αντιβιοτικά.
· Ερευνητική ομάδα στο Πανεπιστήμιο της Καλιφόρνια το χρησιμοποίησε για την κατανόησή της βιολογίας του SARS-CoV-2.
Και ενώ η έρευνα πάνω στο AlphaFold συνεχίζεται, οι προβλέψεις του ξεκλειδώνουν ολοένα και περισσότερες νέες δυνατότητες στη βιολογική έρευνα.
Ο Keith Willison στο Imperial College του Λονδίνου λέει ότι το AlphaFold έχει αναμφισβήτητα «αλλάξει τον κόσμο» της βιολογικής έρευνας, αλλά ότι υπάρχουν ακόμα προβλήματα που πρέπει να λυθούν στην αναδίπλωση των πρωτεϊνών.
«Όταν λειτούργησε το AlphaFold ήταν εξαιρετική εξέλιξη. Τώρα, απλώς αναζητάμε τις προς διερεύνηση πρωτεΐνες αντί να χρειάζεται να κάνουμε κρυστάλλους», εξηγεί. «Μου πήρε περίπου οκτώ χρόνια για να κάνω την κρυσταλλογραφική δομή ενός συμπλέγματος πρωτεΐνης… Ο κόσμος αστειεύεται ότι οι κρυσταλλογράφοι θα μείνουν άνεργοι».
Ωστόσο, ο Willison επισημαίνει ότι το AlphaFold δεν είναι σε θέση να λάβει αυθαίρετα μία σειρά αμινοξέων και να μοντελοποιήσει ακριβώς πώς αναδιπλώνουν. Αντίθετα, είναι σε θέση να χρησιμοποιήσει μόνο μέρη πρωτεϊνών και τις δομές τους που έχουν προσδιοριστεί πειραματικά για να προβλέψουν πώς θα αναδιπλωθεί μια νέα πρωτεΐνη.
Ενώ το εργαλείο είναι εξαιρετικά ακριβές, οι δομές του είναι πάντα προβλέψεις και όχι ρητά υπολογισμένα αποτελέσματα. Ούτε το AlphaFold έχει λύσει ακόμη τις πολύπλοκες αλληλεπιδράσεις μεταξύ των πρωτεϊνών ή τις γνωστές ως εγγενώς διαταραγμένες πρωτεΐνες, που φαίνεται να έχουν ασταθή και απρόβλεπτα μοτίβα αναδίπλωσης.
«Μόλις ανακαλύψεις ένα πράγμα, τότε δημιουργούνται περισσότερα προβλήματα», λέει ο Willison. «Είναι πραγματικά τρομακτικό, πόσο περίπλοκη είναι η βιολογία».
Είναι, πάντως, γεγονός ότι οι νέες γνώσεις για τη δομή των πρωτεϊνών αναμένεται να οδηγήσουν την έρευνα για την επίλυση πολλών προβλημάτων (όπως αυτά που αναφέρθηκαν παραπάνω) σε νέα μονοπάτια επιστημονικών ανακαλύψεων και για αυτόν ακριβώς τον λόγο τα σύνολα των δεδομένων του AlphaFold θεωρούνται εξίσου σημαντικής βαρύτητας με εκείνα του ανθρώπινου γονιδιώματος.