Η τεχνητή νοημοσύνη και οι παλιές αναφορές συνδυάζονται στην υπηρεσία της ιατρικής. Οι νέες ιατρικές απεικονίσεις πλέον ερμηνεύονται διεξοδικά. Γι’ αυτό τον σκοπό, οι επιστήμονες χρησιμοποιούν έναν ανεκμετάλλευτο πόρο μαζί με την ΑΙ. Χρησιμοποιούν εκθέσεις ακτινολογίας που συνοδεύουν τις ιατρικές απεικονίσεις. Με κάθε ακτινογραφία βελτιώνονται οι ερμηνευτικές ικανότητες των αλγορίθμων μηχανικής μάθησης. Η γρήγορη και ακριβής ανάγνωση ακτινογραφιών ή άλλων ιατρικών απεικονίσεων μπορεί να είναι ζωτικής σημασίας για την υγεία του ασθενούς. Ενδεχομένως αυτή η γνώση να σώσει μια ζωή. Η απόκτηση μιας τέτοιας αξιολόγησης εξαρτάται από τη διαθεσιμότητα ενός ειδικευμένου ακτινολόγου. Κατά συνέπεια, μια ταχεία αντίδραση δεν είναι πάντα δυνατή.
Ο Ruizhi “Ray” Liao είναι μεταδιδακτορικός και πρόσφατος απόφοιτος διδακτορικού στο Εργαστήριο Πληροφορικής και Τεχνητής Νοημοσύνης του MIT (CSAIL). Είναι ο πρώτος συγγραφέας στην συγκεκριμένη εργασία που παρουσιάζεται αυτό το φθινόπωρο στο MICCAI 2021, ένα διεθνές συνέδριο για την υπολογιστική ιατρικής εικόνας. Παρόλο που η ιδέα της χρήσης υπολογιστών για την ερμηνεία εικόνων δεν είναι καινούργια, η ομάδα υπό την ηγεσία του MIT βασίζεται σε έναν ανεκμετάλλευτο πόρο. Βασίζεται στον τεράστιο όγκο ακτινολογικών αναφορών που συνοδεύουν ιατρικές εικόνες, γραμμένες από ακτινολόγους σε συνήθη κλινική πρακτική. Με αυτό τον τρόπο βελτιώνει τις ερμηνευτικές ικανότητες αλγόριθμων μηχανικής μάθησης. Η ομάδα χρησιμοποιεί επίσης μια έννοια από τη θεωρία πληροφοριών που ονομάζεται αμοιβαία πληροφόρηση. Πρόκειται για ένα στατιστικό μέτρο της αλληλεξάρτησης δύο διαφορετικών μεταβλητών. Την αμοιβαία πληροφόρηση τη χρησιμοποιεί προκειμένου να ενισχυθεί η αποτελεσματικότητα της προσέγγισής τους.
Πώς λειτουργεί το σύστημα
Αρχικά, ένα νευρικό δίκτυο εκπαιδεύεται για να καθορίσει την έκταση μιας ασθένειας. Ας πάρουμε για παράδειγμα το πνευμονικό οίδημα. Παρουσιάζονται πολυάριθμες εικόνες ακτίνων Χ των πνευμόνων των ασθενών, μαζί με την αξιολόγηση του γιατρού για τη σοβαρότητα της κάθε περίπτωσης. Αυτές οι πληροφορίες περικλείονται σε μια συλλογή αριθμών. Ένα ξεχωριστό νευρωνικό δίκτυο κάνει το ίδιο για το κείμενο, αντιπροσωπεύοντας τις πληροφορίες του σε διαφορετική συλλογή αριθμών. Ένα τρίτο νευρωνικό δίκτυο στη συνέχεια ενσωματώνει τις πληροφορίες μεταξύ εικόνων και κειμένου. Αυτό συμβαίνει με συντονισμένο τρόπο που μεγιστοποιεί τις αμοιβαίες πληροφορίες μεταξύ των δύο συνόλων δεδομένων. “Όταν οι αμοιβαίες πληροφορίες μεταξύ εικόνων και κειμένου είναι υψηλές, αυτό σημαίνει ότι οι εικόνες είναι πολύ προγνωστικές για το κείμενο και το κείμενο είναι πολύ προγνωστικό για τις εικόνες”, εξηγεί η καθηγήτρια του MIT, Polina Golland, κύρια ερευνήτρια στο CSAIL.
Η ομάδα ερευνητών εισήγαγε και μια άλλη καινοτομία που προσφέρει πολλά πλεονεκτήματα. Πιο αναλυτικά, αντί να δουλεύουν από ολόκληρες εικόνες και ακτινολογικές αναφορές, χωρίζουν τις αναφορές σε μεμονωμένες προτάσεις και τα τμήματα αυτών των εικόνων που αφορούν οι προτάσεις. Το μοντέλο θα μπορούσε να έχει πολύ ευρεία εφαρμογή. Θα μπορούσε να χρησιμοποιηθεί για κάθε είδους εικόνες και σχετικό κείμενο. Δεν περιορίζεται λοιπόν στον ιατρικό χώρο.