Τεχνολογία

Διαταραχή Συναισθήματα: Χρήση βαθιάς μάθησης για την ανίχνευση της κατάθλιψης από την ομιλία

Διαταραχή Συναισθήματα: Χρήση βαθιάς μάθησης για την ανίχνευση της κατάθλιψης από την ομιλία
Στο μέλλον, ο αλγόριθμος βαθιάς μάθησης που ανέπτυξε αυτή η ομάδα ερευνητών θα μπορούσε να αποτελέσει ένα πρόσθετο βοηθητικό εργαλείο για τους ψυχιάτρους και τους γιατρούς, μαζί με άλλα καθιερωμένα διαγνωστικά εργαλεία. Επιπλέον, η μελέτη αυτή θα μπορούσε να εμπνεύσει την ανάπτυξη παρόμοιων εργαλείων τεχνητής νοημοσύνης για την ανίχνευση σημείων ψυχιατρικών διαταραχών από την ομιλία.

Your browser does not support the video tag. https://grx-obj.adman.gr/grx/creatives/sanofi/20876/better-understanding-insulin.mp4

Διαταραχή Συναισθήματα: Τα εργαλεία τεχνητής νοημοσύνης (ΤΝ) έχουν επιτύχει πολλά υποσχόμενα αποτελέσματα σε πολυάριθμες εργασίες και θα μπορούσαν σύντομα να βοηθήσουν τους επαγγελματίες σε διάφορα περιβάλλοντα. Τα τελευταία χρόνια, οι επιστήμονες πληροφορικής διερευνούν τις δυνατότητες αυτών των εργαλείων για την ανίχνευση ενδείξεων διαφόρων σωματικών και ψυχιατρικών καταστάσεων. Η κατάθλιψη είναι μια από τις πιο διαδεδομένες ψυχιατρικές διαταραχές, η οποία επηρεάζει κάθε χρόνο περίπου το 9,5% των Αμερικανών ενηλίκων. Εργαλεία που μπορούν να ανιχνεύουν αυτόματα τα σημάδια της κατάθλιψης θα μπορούσαν να συμβάλουν στη μείωση των ποσοστών αυτοκτονιών, καθώς θα επέτρεπαν στους γιατρούς να εντοπίζουν αμέσως τα άτομα που χρειάζονται ψυχολογική υποστήριξη. Ερευνητές του Ινστιτούτου Προηγμένης Έρευνας Jinhua και του Πανεπιστημίου Επιστήμης και Τεχνολογίας Harbin ανέπτυξαν πρόσφατα έναν αλγόριθμο βαθιάς μάθησης που θα μπορούσε να ανιχνεύσει την κατάθλιψη από την ομιλία ενός ατόμου. Το μοντέλο αυτό, το οποίο παρουσιάστηκε σε μια εργασία που δημοσιεύθηκε στα ‘Κινητά δίκτυα και εφαρμογές’ (Mobile Networks and Applications) εκπαιδεύτηκε για να αναγνωρίζει συναισθήματα στην ανθρώπινη ομιλία αναλύοντας διάφορα σχετικά χαρακτηριστικά.


“Δημιουργείται ένα μοντέλο αλγορίθμου κοινής απόφασης πολλαπλών πληροφοριών μέσω της αναγνώρισης συναισθημάτων” έγραψαν οι Han Tian, Zhang Zhu και Xu Jing στο έγγραφό τους. “Το μοντέλο χρησιμοποιείται για την ανάλυση των αντιπροσωπευτικών δεδομένων των υποκειμένων και για να βοηθήσει στη διάγνωση του κατά πόσον τα υποκείμενα έχουν κατάθλιψη”. Ο Tian και οι συνάδελφοί του εκπαίδευσαν το μοντέλο τους στο σύνολο δεδομένων DAIC-WOZ, μια συλλογή από ηχητικές και τρισδιάστατες εκφράσεις προσώπων ασθενών που έχουν διαγνωστεί με καταθλιπτική διαταραχή και ανθρώπων χωρίς κατάθλιψη. Αυτές οι ηχογραφήσεις και οι εκφράσεις του προσώπου συλλέχθηκαν κατά τη διάρκεια συνεντεύξεων υπό την καθοδήγηση ενός εικονικού πράκτορα, ο οποίος έκανε διάφορες ερωτήσεις σχετικά με τη διάθεση και τη ζωή του συνεντευξιαζόμενου. “Με βάση τη διερεύνηση των χαρακτηριστικών ομιλίας των ατόμων με καταθλιπτική διαταραχή, η παρούσα εργασία διεξάγει μια εις βάθος μελέτη της διάγνωσης της κατάθλιψης με τη βοήθεια ομιλίας με βάση τα δεδομένα ομιλίας στο σύνολο δεδομένων DAIC-WOZ”, έγραψαν οι Tian, Zhu και Jian στην εργασία τους. “Πρώτον, οι πληροφορίες ομιλίας υποβάλλονται σε προεπεξεργασία, συμπεριλαμβανομένης της προέμφασης του σήματος ομιλίας, της πλαισίωσης παραθύρων, της ανίχνευσης τελικού σημείου, της μείωσης θορύβου κ.λπ. Δεύτερον, χρησιμοποιείται το OpenSmile για την εξαγωγή των χαρακτηριστικών των σημάτων ομιλίας και μελετώνται και αναλύονται σε βάθος τα χαρακτηριστικά ομιλίας που μπορούν να αντανακλούν τα χαρακτηριστικά”.

Για την εξαγωγή σχετικών χαρακτηριστικών από ηχογραφήσεις φωνής, το μοντέλο της ομάδας χρησιμοποιεί το OpenSmile (ανοιχτού κώδικα ερμηνεία ομιλίας και μουσικής με εξαγωγή μεγάλου χώρου). Πρόκειται για μια εργαλειοθήκη που χρησιμοποιείται συχνά από επιστήμονες πληροφορικής για την εξαγωγή χαρακτηριστικών από κλιπ ήχου και την ταξινόμηση αυτών των κλιπ. Οι ερευνητές χρησιμοποίησαν αυτό το εργαλείο για να εξάγουν μεμονωμένα χαρακτηριστικά ομιλίας και συνδυασμούς χαρακτηριστικών που συναντώνται συνήθως στην ομιλία ασθενών που έχουν διαγνωστεί με κατάθλιψη. Στη συνέχεια, χρησιμοποίησαν μια τεχνική γνωστή ως ανάλυση κύριων συνιστωσών για να μειώσουν το σύνολο των χαρακτηριστικών που εξήγαγαν. Οι Tian, Zhu και Jian αξιολόγησαν το μοντέλο τους σε μια σειρά δοκιμών, όπου αξιολόγησαν την ικανότητά του να ανιχνεύει καταθλιπτικά και μη καταθλιπτικά άτομα από ηχογραφήσεις της φωνής τους. Το πλαίσιό τους πέτυχε αξιοσημείωτα αποτελέσματα, ανιχνεύοντας την κατάθλιψη με ακρίβεια 87% στους άνδρες ασθενείς και 87,5% στις γυναίκες ασθενείς. Στο μέλλον, ο αλγόριθμος βαθιάς μάθησης που ανέπτυξε αυτή η ομάδα ερευνητών θα μπορούσε να αποτελέσει ένα πρόσθετο βοηθητικό εργαλείο για τους ψυχιάτρους και τους γιατρούς, μαζί με άλλα καθιερωμένα διαγνωστικά εργαλεία. Επιπλέον, η μελέτη αυτή θα μπορούσε να εμπνεύσει την ανάπτυξη παρόμοιων εργαλείων τεχνητής νοημοσύνης για την ανίχνευση σημείων ψυχιατρικών διαταραχών από την ομιλία.