Τεχνολογία

Meta AI: Πώς αποκωδικοποιεί την ομιλία από την εγκεφαλική δραστηριότητα;

Meta AI: Πώς αποκωδικοποιεί την ομιλία από την εγκεφαλική δραστηριότητα;
Meta AI: Ερευνητές στο Meta AI ανέπτυξαν πρόσφατα μια πολλά υποσχόμενη και μη επεμβατική μέθοδο για την αποκωδικοποίηση της ομιλίας από την εγκεφαλική δραστηριότητα ενός ατόμου.

Οι πρόσφατες τεχνολογικές εξελίξεις έχουν ανοίξει ανεκτίμητες ευκαιρίες για βοήθεια σε άτομα που αντιμετωπίζουν αναπηρίες. Για παράδειγμα, επέτρεψαν τη δημιουργία εργαλείων για την υποστήριξη της φυσικής αποκατάστασης, την άσκηση κοινωνικών δεξιοτήτων και την παροχή καθημερινής βοήθειας σε συγκεκριμένες εργασίες.

Ερευνητές στο Meta AI ανέπτυξαν πρόσφατα μια πολλά υποσχόμενη και μη επεμβατική μέθοδο για την αποκωδικοποίηση της ομιλίας από την εγκεφαλική δραστηριότητα ενός ατόμου, η οποία θα μπορούσε να επιτρέψει σε άτομα που δεν μπορούν να μιλήσουν να μεταδώσουν τις σκέψεις τους μέσω μιας διεπαφής υπολογιστή. Η προτεινόμενη μέθοδος τους, που παρουσιάζεται στο Nature Machine Intelligence, συνδυάζει τη χρήση μιας τεχνικής απεικόνισης και τη μηχανική μάθηση.

«Μετά από ένα εγκεφαλικό επεισόδιο ή μια εγκεφαλική νόσο, πολλοί ασθενείς χάνουν την ικανότητά τους να μιλούν», δήλωσε ο Jean Remi King, ερευνητής στο Meta. “Τα τελευταία δύο χρόνια, έχει επιτευχθεί σημαντική πρόοδος στην ανάπτυξη μιας νευρικής πρόθεσης: μιας συσκευής, που συνήθως εμφυτεύεται στον κινητικό φλοιό των ασθενών, η οποία μπορεί να χρησιμοποιηθεί, μέσω τεχνητής νοημοσύνης, για τον έλεγχο μιας διεπαφής υπολογιστή. Αυτή η δυνατότητα, ωστόσο , εξακολουθεί να απαιτεί χειρουργική επέμβαση στον εγκέφαλο, και επομένως δεν είναι χωρίς κινδύνους».

Εκτός από την απαίτηση χειρουργικών επεμβάσεων, οι περισσότερες προτεινόμενες προσεγγίσεις για την αποκωδικοποίηση της ομιλίας βασίζονται σε εμφυτευμένα ηλεκτρόδια και η διασφάλιση της σωστής λειτουργίας αυτών των ηλεκτροδίων για περισσότερους από μερικούς μήνες είναι πρόκληση. Ο βασικός στόχος της πρόσφατης μελέτης του King και των συνεργατών του ήταν να εξερευνήσουν μια εναλλακτική μη επεμβατική οδό για την αποκωδικοποίηση των αναπαραστάσεων ομιλίας.

«Αντί να χρησιμοποιούμε ενδοκρανιακά ηλεκτρόδια, χρησιμοποιούμε μαγνητοεγκεφαλογραφία», εξήγησε ο King. “Πρόκειται για μια τεχνική απεικόνισης που βασίζεται σε μια μη επεμβατική συσκευή που μπορεί να τραβήξει περισσότερα από χίλια στιγμιότυπα εγκεφαλικής δραστηριότητας ανά δευτερόλεπτο. Καθώς αυτά τα εγκεφαλικά σήματα είναι πολύ δύσκολο να ερμηνευτούν, εκπαιδεύουμε ένα σύστημα AI να τα αποκωδικοποιεί σε τμήματα ομιλίας.”

Ουσιαστικά, ο King και οι συνεργάτες του ανέπτυξαν ένα σύστημα AI και το εκπαίδευσαν να αναλύει εικόνες μαγνητοεγκεφαλογραφίας, προβλέποντας την ομιλία από την εγκεφαλική δραστηριότητα που καταγράφεται σε αυτές. Το σύστημά τους AI αποτελείται από δύο βασικές ενότητες, που ονομάζονται «μονάδα εγκεφάλου» και «μονάδα ομιλίας». Η μονάδα εγκεφάλου εκπαιδεύτηκε να εξάγει πληροφορίες από τη δραστηριότητα του ανθρώπινου εγκεφάλου που καταγράφηκε χρησιμοποιώντας μαγνητοεγκεφαλογραφία. Η ενότητα ομιλίας, από την άλλη πλευρά, προσδιορίζει τις αναπαραστάσεις ομιλίας που πρόκειται να αποκωδικοποιηθούν.

“Οι δύο μονάδες είναι παραμετροποιημένες έτσι ώστε να μπορούμε να συμπεράνουμε, σε κάθε στιγμή, τι ακούγεται από τον συμμετέχοντα”, είπε ο King. Οι ερευνητές αξιολόγησαν την προτεινόμενη προσέγγισή τους σε μια αρχική μελέτη στην οποία συμμετείχαν 175 άνθρωποι. Αυτοί οι συμμετέχοντες κλήθηκαν να ακούσουν αφηγημένες μικρές ιστορίες και μεμονωμένες προφορικές προτάσεις, ενώ η εγκεφαλική τους δραστηριότητα καταγράφηκε χρησιμοποιώντας μαγνητοεγκεφαλογραφία ή μια εναλλακτική τεχνική γνωστή ως ηλεκτροεγκεφαλογραφία.