Ιατρική Ορολογία: Σε πρόσφατη μελέτη περιγράφεται μια αποτελεσματική στρατηγική για την αντιστοίχιση των κινεζικών ιατρικών οντοτήτων στο Ενιαίο Σύστημα Ιατρικής Γλώσσας (UMLS). Επιπλέον, η μελέτη δημιούργησε ένα σύνολο δεδομένων αξιολόγησης με βάση δεδομένα πραγματικού κόσμου για τη σύνδεση κινεζικών ιατρικών οντοτήτων με συστήματα σε άλλες γλώσσες. Τα αποτελέσματα δημοσιεύθηκαν στο Health Data Science.
Το Ενιαίο Σύστημα Ιατρικής Γλώσσας UMLS είναι ένα από τα καλά αναπτυγμένα συστήματα ιατρικής ορολογίας που αποτελούν τον ακρογωνιαίο λίθο της έρευνας και των τεχνολογιών πληροφορικής της υγείας. Ωστόσο, η έλλειψη μιας υψηλής ποιότητας κινεζικής ιατρικής οντολογίας καθιστά δύσκολη την επεξεργασία ιατρικών κειμένων και εγγράφων για υπολογισμό. “Για να ξεπεράσουμε αυτή την πρόκληση, επιδιώξαμε να προσδιορίσουμε τη βέλτιστη προσέγγιση για την αντιστοίχιση κινεζικών ιατρικών οντοτήτων σε έννοιες του Ενιαίου Συστήματος Ιατρικής Γλώσσας UMLS στο παρόν στάδιο”, δήλωσε ο Taijiao Jiang, συγγραφέας και καθηγητής στο Εργαστήριο Guangzhou (GL), Ιατρικό Πανεπιστήμιο Guangzhou, Κίνα. “Με την εφαρμογή αυτής της στρατηγικής, είναι πλέον εφικτή η ομαλοποίηση των ιατρικών οντοτήτων σε διάφορες γλώσσες”. “Η μελέτη διερεύνησε τρεις μεθόδους αντιστοίχισης, δηλαδή, μια στρατηγική βασισμένη στη συμβολοσειρά, μια στρατηγική βασισμένη στη σημασιολογία και μια στρατηγική συνδυασμένη με τη συμβολοσειρά και τη σημασιολογική ομοιότητα”, μοιράστηκε η Lizong Deng, συν-συγγραφέας και αναπληρώτρια καθηγήτρια στο Ινστιτούτο Συστημικής Ιατρικής (ISM), Κινεζική Ακαδημία Ιατρικών Επιστημών & Ιατρικό Κολέγιο της Ένωσης του Πεκίνου, Κίνα. “Επιπλέον, εφαρμόστηκαν διαγλωσσικά προ-εκπαιδευμένα γλωσσικά μοντέλα”. “Αξιοποιήσαμε την ομοιότητα σε επίπεδο χαρακτήρων και σε σημασιολογικό επίπεδο χρησιμοποιώντας μια μέθοδο γραμμικού συνδυασμού, με τη βοήθεια της μετάφρασης πολλαπλών πηγών και ενός προ-εκπαιδευμένου γλωσσικού μοντέλου για να αντιστοιχίσουμε τις κινεζικές ιατρικές οντότητες στο Ενιαίο Σύστημα Ιατρικής Γλώσσας UMLS, μια σημαντική βάση για ένα καλά οργανωμένο σύστημα ορολογίας”, εξήγησε ο Luming Chen, συν-συγγραφέας στο GL. “Αυτή η στρατηγική γραμμικού συνδυασμού επέδειξε τις καλύτερες επιδόσεις στο διαγλωσσικό έργο σύνδεσης ιατρικών οντοτήτων παρά τα ανεπαρκώς ανεπτυγμένα κινεζικά συστήματα ιατρικής ορολογίας”.
Περαιτέρω, η αναφερόμενη μέθοδος μπορεί να εφαρμοστεί σε επόμενες εργασίες για την αυτόματη αντιστοίχιση κινεζικών ιατρικών όρων σε τυποποιημένες έννοιες του Ενιαίου Συστήματος Ιατρικής Γλώσσας UMLS, διευκολύνοντας έτσι την αναπαράσταση ιατρικής γνώσης λεπτού βαθμού και άλλες προηγμένες ευφυείς ιατρικές εφαρμογές. Επιπλέον, αξιοποιώντας μηχανές μετάφρασης που βασίζονται στον ιστό, η περιγραφόμενη προσέγγιση μπορεί να χρησιμοποιηθεί για την αντιστοίχιση μη αγγλικών οντοτήτων στο Ενιαίο Σύστημα Ιατρικής Γλώσσας UMLS, επεκτείνοντας έτσι την κάλυψη του Ενιαίου Συστήματος Ιατρικής Γλώσσας UMLS. Σε αντάλλαγμα, το Ενιαίο Σύστημα Ιατρικής Γλώσσας UMLS με πολύγλωσσα στοιχεία επιταχύνει τη χρήση εργαλείων ιατρικής πληροφορικής σε άλλες γλώσσες. “Για να επικυρώσουμε περαιτέρω τα αποτελέσματα των στρατηγικών αντιστοίχισης σε ένα μεγαλύτερο και πιο ποικιλόμορφο σύνολο δεδομένων, θα δημιουργήσουμε ένα νέο διαγλωσσικό σύνολο δεδομένων που καλύπτει ένα ευρύτερο φάσμα σημασιολογικών τύπων στην ιατρική ορολογία”, δήλωσε ο Yifan Qi, συν-συγγραφέας στο ISM. “Θα διερευνήσουμε τους περιορισμούς των στρατηγικών αντιστοίχισης, συμπεριλαμβανομένων των περιπτώσεων όπου οι μεταφράσεις είναι ανακριβείς ή όταν υπάρχει έλλειψη αγγλικών αντιστοίχων στο Ενιαίο Σύστημα Ιατρικής Γλώσσας UMLS”. Ο κύριος στόχος της μελλοντικής έρευνας είναι η ανάπτυξη ενός επιθυμητού γλωσσικού μοντέλου που θα ενσωματώνει πλήρως τις ιατρικές έννοιες σε επίπεδο συμβολοσειράς και σημασιολογικού επιπέδου. Τέλος, ο απώτερος στόχος είναι η τελειοποίηση της διαγλωσσικής σύνδεσης ιατρικών οντοτήτων και η ενσωμάτωση της στρατηγικής αντιστοίχισης στην ανάπτυξη της κινεζικής ιατρικής οντολογίας.