Μία από τις “υποσχέσεις” των νέων μεθόδων εξατομικευμένης ιατρικής είναι ότι οι ατομικοί κίνδυνοι για ασθένειες μπορούν να αξιολογηθούν χρησιμοποιώντας μεγάλα σύνολα δεδομένων DNA. Αλλά πολλές ασθένειες είναι εξαιρετικά πολυπαραγοντικές, πράγμα που σημαίνει ότι οι γενετικοί παράγοντες κινδύνου διαδίδονται σε όλο το DNA. Η εύρεση αυτών των αόριστων συνδέσεων και η κατασκευή ενός αξιόπιστου και ανιχνεύσιμου στατιστικού μοντέλου από αυτές είναι ο στόχος των ερευνητών από το Ινστιτούτο Επιστήμης και Τεχνολογίας της Αυστρίας (IST).
Μια μυριάδα γενετικών παραγόντων μπορεί να επηρεάσει την εμφάνιση ασθενειών όπως η υψηλή αρτηριακή πίεση, οι καρδιακές παθήσεις και ο διαβήτης τύπου 2. Αν θέλαμε να μάθουμε πώς το DNA επηρεάζει τον κίνδυνο εμφάνισης τέτοιων ασθενειών, θα έπρεπε να γίνει ένα βήμα από την αντιδραστική στην πιο προληπτική φροντίδα, όχι μόνο βελτιώνοντας την ποιότητα ζωής των ασθενών αλλά και εξοικονομώντας χρήματα στο σύστημα υγείας. Ωστόσο, η ανίχνευση των συνδέσεων μεταξύ του DNA και της έναρξης της νόσου απαιτεί σταθερά στατιστικά μοντέλα που λειτουργούν αξιόπιστα σε πολύ μεγάλα σύνολα δεδομένων αρκετών εκατοντάδων χιλιάδων ασθενών.
Ο Μάθιου Ρόμπινσον, Επίκουρος Καθηγητής στο Ινστιτούτο Επιστήμης και Τεχνολογίας (IST) Αυστρίας, μαζί με μια διεθνή ομάδα ερευνητών, έχει πλέον αναπτύξει ένα νέο μαθηματικό μοντέλο που βελτιώνει την προγνωστική ποιότητα που αποκτήθηκε από μεγάλα σύνολα γονιδιωματικών δεδομένων ασθενών. Αυτή η μέθοδος θα μπορούσε να βοηθήσει στην ανάπτυξη εξατομικευμένων προβλέψεων σχετικά με τους κινδύνους για την υγεία, παρόμοια με αυτό που κάνει ένας γιατρός όταν συζητά το ιατρικό ιστορικό μιας οικογένειας.
Δείγματα από δισεκατομμύρια
Το ανθρώπινο DNA αποτελείται από αρκετά δισεκατομμύρια ζεύγη βάσεων που κωδικοποιούν τη βιολογική δομή και λειτουργίες. Στη μελέτη τους, οι επιστήμονες επέλεξαν αρκετές εκατοντάδες γενετικούς δείκτες για τις έρευνές τους. Χρησιμοποιώντας το στατιστικό τους μοντέλο, στη συνέχεια σύνδεσαν τη σύνθεση αυτών των δεικτών με την έναρξη της υψηλής αρτηριακής πίεσης, των καρδιακών παθήσεων ή του διαβήτη τύπου 2 στους ασθενείς στη βάση δεδομένων. Οι ερευνητές ενδιαφέρθηκαν συγκεκριμένα για την ηλικία των ασθενών κατά την έναρξη της νόσου. Με αυτές τις πληροφορίες, μπορούν στη συνέχεια να χρησιμοποιήσουν το μοντέλο τους για να προβλέψουν πιθανότητες για το πότε μπορεί να εμφανιστεί μια ασθένεια.
Ωστόσο, αυτό το στατιστικό μοντέλο δεν μπορεί να δημιουργήσει άμεσες σχέσεις μεταξύ ορισμένων γονιδίων και της έναρξης της νόσου, αλλά παρέχει μόνο μια βελτιωμένη πρόβλεψη πιθανότητας εμφάνισης της νόσου. Υπάρχει επίσης μια σημαντική διαφορά μεταξύ των μοντέλων μαύρου κουτιού που χρησιμοποιούνται συνήθως για μελέτες μεγάλων δεδομένων και αυτής της μεθόδου από τον Robinson και τους συναδέλφους του: Τα μοντέλα μαύρου κουτιού παράγουν προβλέψεις, αλλά η εσωτερική τους λειτουργία δεν μπορεί εύκολα να γίνει κατανοητή από τον άνθρωπο λόγω των πολλών στρωμάτων αφαίρεσης χρησιμοποιούν. Αντίθετα, το μοντέλο του Robinson και των συναδέλφων του παρέχει ανιχνεύσιμα στατιστικά στοιχεία.
Χρήση δεδομένων ασθενών
Η αξιοποίηση του πλήρους δυναμικού τέτοιων μεθόδων πρόβλεψης απαιτεί τόσο αποτελεσματικά μοντέλα όσο και συλλογή μεγάλων συνόλων γονιδιωματικών δεδομένων.
Πρέπει να τηρούνται αυστηρά μέτρα ασφάλειας δεδομένων κατά τη χρήση δεδομένων ασθενούς. Μόνο με την άδεια των αντίστοιχων συμβουλίων δεοντολογίας, οι ερευνητές μπόρεσαν να αποκτήσουν πρόσβαση σε ανώνυμα δεδομένα ασθενών από κρατικές χρηματοδοτούμενες τράπεζες – μεγάλες συλλογές γενετικών δεδομένων ασθενών – τόσο στο ΗΒ όσο και στην Εσθονία. Χρησιμοποίησαν τα δεδομένα από το Ηνωμένο Βασίλειο για να φτιάξουν το μοντέλο τους και τα δεδομένα από την Εσθονία για να δοκιμάσουν την προγνωστική ισχύ του. Αυτά στη συνέχεια θα μεταφερθούν μέσω του εσθονικού συστήματος υγειονομικής περίθαλψης στους ασθενείς, δίνοντάς τους το κίνητρο να λάβουν προληπτικά μέτρα.
Το νέο στατιστικό μοντέλο από τον Robinson και τους συναδέλφους του είναι ένα μόνο βήμα προς τη χρήση μεγάλων γονιδιωματικών συνόλων δεδομένων για την προληπτική υγειονομική περίθαλψη. Τόσο τα μοντέλα όσο και η υποδομή δεδομένων των biobanks, μαζί με ένα ισχυρό και ασφαλές σύστημα προστασίας δεδομένων, είναι απαραίτητα για την εκπλήρωση των υποσχέσεων εξατομικευμένης προγνωστικής ιατρικής. Η μελέτη δημοσιεύεται στο Nature Communications.
Με πληροφορίες από Medical Xpress