Ένα νέο πρόγραμμα υπολογιστή τεχνητής νοημοσύνης που δημιουργήθηκε από ερευνητές του Πανεπιστημίου της Φλόριντα και της NVIDIA μπορεί να δημιουργήσει τις σημειώσεις των γιατρών τόσο καλά που δύο γιατροί δεν μπορούσαν να διακρίνουν τη διαφορά, σύμφωνα με μια πρώιμη μελέτη και από τις δύο ομάδες. Σε αυτή τη μελέτη απόδειξης της ιδέας, οι γιατροί εξέτασαν τις σημειώσεις των ασθενών —ορισμένες γράφτηκαν από πραγματικούς γιατρούς ενώ άλλες δημιουργήθηκαν από το νέο πρόγραμμα AI— και οι γιατροί εντόπισαν τον σωστό συγγραφέα μόνο στο 49% των περιπτώσεων.
Μια ομάδα 19 ερευνητών από την NVIDIA και το Πανεπιστήμιο της Φλόριντα είπε ότι τα ευρήματά τους, που δημοσιεύθηκαν στις 16 Νοεμβρίου στο περιοδικό npj Digital Medicine, ανοίγουν την πόρτα για την τεχνητή νοημοσύνη για να υποστηρίξει τους εργαζόμενους στον τομέα της υγείας με πρωτοποριακή αποτελεσματικότητα. Οι ερευνητές εκπαίδευσαν υπερυπολογιστές για τη δημιουργία ιατρικών αρχείων με βάση ένα νέο μοντέλο, το GatorTronGPT, που λειτουργεί παρόμοια με το ChatGPT.
Οι δωρεάν εκδόσεις των μοντέλων GatorTron έχουν περισσότερες από 430.000 λήψεις από το Hugging Face, έναν ιστότοπο τεχνητής νοημοσύνης ανοιχτού κώδικα. Τα μοντέλα GatorTron είναι τα μόνα μοντέλα του ιστότοπου που είναι διαθέσιμα για κλινική έρευνα, σύμφωνα με τον επικεφαλής συγγραφέα του άρθρου Yonghui Wu, Ph.D., από το τμήμα αποτελεσμάτων υγείας και βιοϊατρικής πληροφορικής του Κολεγίου Ιατρικής UF.
“Στην υγειονομική περίθαλψη, όλοι μιλούν για αυτά τα μοντέλα. Το GatorTron και το GatorTronGPT είναι μοναδικά μοντέλα τεχνητής νοημοσύνης που μπορούν να τροφοδοτήσουν πολλές πτυχές της ιατρικής έρευνας και της υγειονομικής περίθαλψης. Ωστόσο, απαιτούν τεράστια δεδομένα και εκτεταμένη υπολογιστική ισχύ για την κατασκευή τους. Είμαστε ευγνώμονες που έχουμε αυτό υπερυπολογιστής, HiPerGator, από την NVIDIA για να εξερευνήσει τις δυνατότητες της τεχνητής νοημοσύνης στην υγειονομική περίθαλψη», είπε ο Wu.
Για αυτήν την έρευνα, ο Wu και οι συνεργάτες του ανέπτυξαν ένα μεγάλο γλωσσικό μοντέλο που επιτρέπει στους υπολογιστές να μιμούνται τη φυσική ανθρώπινη γλώσσα. Αυτά τα μοντέλα λειτουργούν καλά με τυπική γραφή ή συνομιλίες, αλλά τα ιατρικά αρχεία φέρνουν πρόσθετα εμπόδια, όπως η ανάγκη προστασίας του απορρήτου των ασθενών και η υψηλή τεχνική. Τα ψηφιακά ιατρικά αρχεία δεν μπορούν να αναζητηθούν στο Google ή να κοινοποιηθούν στη Wikipedia.
Για να ξεπεράσουν αυτά τα εμπόδια, οι ερευνητές αφαίρεσαν τα ιατρικά αρχεία του UF Health από την ταυτοποίηση πληροφοριών από 2 εκατομμύρια ασθενείς, ενώ διατήρησαν 82 δισεκατομμύρια χρήσιμες ιατρικές λέξεις. Συνδυάζοντας αυτό το σύνολο με ένα άλλο σύνολο δεδομένων 195 δισεκατομμυρίων λέξεων, εκπαίδευσαν το μοντέλο GatorTronGPT να αναλύει τα ιατρικά δεδομένα με αρχιτεκτονική GPT-3 ή Generative Pre-trained Transformer, μια μορφή αρχιτεκτονικής νευρωνικών δικτύων. Αυτό επέτρεψε στο GatorTronGPT να γράψει κλινικό κείμενο παρόμοιο με τις σημειώσεις των γιατρών.
Ακολουθούν δύο παράγραφοι που αναφέρονται σε δύο περιπτώσεις ασθενών, μία γραμμένη από άνθρωπο και μία που δημιουργήθηκε από το GatorTronGPT—μπορείτε να πείτε εάν ο συγγραφέας ήταν μηχανή ή άνθρωπος;
“Αυτό το μοντέλο GatorTronGPT είναι ένα από τα πρώτα σημαντικά προϊόντα από την πρωτοβουλία της UF για την ενσωμάτωση της τεχνητής νοημοσύνης σε όλο το πανεπιστήμιο. Είμαστε τόσο ικανοποιημένοι με το πώς η συνεργασία με τη NVIDIA ήδη αποδίδει καρπούς και θέτει τις βάσεις για το μέλλον της ιατρικής”, δήλωσε η Elizabeth Shenkman. Ph.D., συν-συγγραφέας και πρόεδρος του τμήματος αποτελεσμάτων υγείας και βιοϊατρικής πληροφορικής του UF.
Από τις πολλές πιθανές χρήσεις για ένα ιατρικό GPT, μια ιδέα περιλαμβάνει την αντικατάσταση της βαρύτητας της τεκμηρίωσης με σημειώσεις που έχουν καταγραφεί και μεταγραφεί από AI. Ο Wu λέει ότι η UF διαθέτει ένα κέντρο καινοτομίας που επιδιώκει μια εμπορική έκδοση του λογισμικού.
Προκειμένου ένα εργαλείο τεχνητής νοημοσύνης να φτάσει σε τέτοια ισοτιμία με την ανθρώπινη γραφή, οι προγραμματιστές ξοδεύουν εβδομάδες προγραμματίζοντας υπερυπολογιστές με κλινικό λεξιλόγιο και χρήση γλώσσας που βασίζεται σε δισεκατομμύρια δισεκατομμύρια λέξεις. Ένας πόρος που παρέχει τα απαραίτητα κλινικά δεδομένα είναι το OneFlorida+ Clinical Research Network, που συντονίζεται στο UF και αντιπροσωπεύει πολλά συστήματα υγειονομικής περίθαλψης.
“Είναι κρίσιμο να έχουμε τόσο τεράστιες ποσότητες κλινικών δεδομένων UF Health όχι μόνο διαθέσιμα αλλά και έτοιμα για τεχνητή νοημοσύνη. Μόνο ένας υπερυπολογιστής θα μπορούσε να χειριστεί ένα τόσο μεγάλο σύνολο δεδομένων 277 δισεκατομμυρίων λέξεων. Είμαστε ενθουσιασμένοι που θα εφαρμόσουμε μοντέλα GatorTron και GatorTronGPT στην υγειονομική περίθαλψη του πραγματικού κόσμου στο UF Health”, δήλωσε ο Jiang Bian, Ph.D., συν-συγγραφέας και επικεφαλής επιστήμονας δεδομένων του UF Health και υπεύθυνος πληροφοριών έρευνας.