Τεχνολογία

Διαβήτης μηχανική μάθηση: Διαβήτης ή φυσιολογική γλυκόζη νηστείας;

Διαβήτης μηχανική μάθηση: Διαβήτης ή φυσιολογική γλυκόζη νηστείας;
Διαβήτης μηχανική μάθηση: Η Διεθνής Ομοσπονδία Διαβήτη προέβλεψε αύξηση από 537 εκατομμύρια διαβητικούς το 2021 σε 643 εκατομμύρια έως το 2030. 

Your browser does not support the video tag. https://grx-obj.adman.gr/grx/creatives/sanofi/20876/better-understanding-insulin.mp4

Ο σακχαρώδης διαβήτης (ΣΔ) είναι μια αυξανόμενη πρόκληση για τη δημόσια υγεία, με πολλές ασυμπτωματικές περιπτώσεις να παραμένουν απαρατήρητες, οδηγώντας σε επιπλοκές. Η Διεθνής Ομοσπονδία Διαβήτη προέβλεψε αύξηση από 537 εκατομμύρια διαβητικούς το 2021 σε 643 εκατομμύρια έως το 2030. Τα μη διαγνωσμένα περιστατικά επιβαρύνουν το σύστημα υγειονομικής περίθαλψης, δίνοντας έμφαση στην έγκαιρη διάγνωση και στροφή στη μηχανική μάθηση για αποτελεσματικό έλεγχο.

Παρά την αποδεδειγμένη ακρίβειά του στην πρόβλεψη κινδύνου, το να βασίζεστε αποκλειστικά στη γλυκόζη αίματος νηστείας μπορεί να παραβλέψετε πολλές περιπτώσεις. Πολλά άτομα με διαβήτη παρουσιάζουν φυσιολογική γλυκόζη νηστείας, υπογραμμίζοντας την ανάγκη για ευρύτερες μεθόδους προσυμπτωματικού ελέγχου και περαιτέρω έρευνα για τη βελτίωση της ανίχνευσης σε διάφορα δημογραφικά στοιχεία.

Διαβήτης: Σχετικά με τη μελέτη

Η παρούσα μελέτη συνέλεξε δεδομένα φυσικής εξέτασης από τρία νοσοκομεία για την ανάπτυξη ενός πλαισίου για τον εντοπισμό διαβητικών ασθενών με φυσιολογική γλυκόζη νηστείας. Αυτά τα δεδομένα, που κατηγοριοποιήθηκαν ως D1, D2 και D3, υποβλήθηκαν σε αυστηρό καθαρισμό, με δείγματα ταξινομημένα με βάση τα διαγνωστικά κριτήρια του διαβήτη του Παγκόσμιου Οργανισμού Υγείας (ΠΟΥ). Λόγω μιας προφανούς ανισορροπίας τάξης στα σύνολα δεδομένων, εφαρμόστηκε η τεχνική υπερδειγματοληψίας συνθετικής μειοψηφίας (SMOTE), ακολουθούμενη από κανονικοποίηση της βαθμολογίας Z για τυποποίηση.

Το υπολογιστικό μοντέλο χρησιμοποίησε πολλαπλές τεχνικές μηχανικής μάθησης, με το βαθύ νευρωνικό δίκτυο (DNN) να δείχνει ανώτερη απόδοση. Καθιερωμένες μετρήσεις όπως η ευαισθησία και η ακρίβεια χρησιμοποιήθηκαν για τη βελτίωση του μοντέλου, λαμβάνοντας υπόψη τη σημαντική ανισορροπία κατηγορίας των δεδομένων. Παρά τις 27 δυνατότητες που χρησιμοποιήθηκαν αρχικά για προβλέψεις, υπήρξε μια προσπάθεια βελτιστοποίησης αυτού εξαλείφοντας πιθανές απολύσεις. Αυτό επικεντρώθηκε σε 13 βασικά χαρακτηριστικά, που διακρίθηκαν μέσω της χειροκίνητης επιμέλειας και της ανάλυσης μέγιστης συνάφειας και ελάχιστου πλεονασμού (mRMR).

Αποτελέσματα μελέτης

Μεταξύ 2015 και 2018, συλλέχθηκαν δεδομένα φυσικής εξέτασης από το First Affiliated Hospital του Ιατρικού Κολλεγίου Wannan, δίνοντας 61.059 δείγματα με φυσιολογική γλυκόζη νηστείας (NFG). Σχεδόν το 1% (603 συμμετέχοντες) από αυτούς αναγνωρίστηκε ως διαβητικός με βάση ένα όριο επιπέδου αιμοσφαιρίνης A1c (HbA1c) 6,5%. Συγκεκριμένα, η ομάδα των διαβητικών είχε μέσο Δείκτη Μάζας Σώματος (ΔΜΣ) 1,08 μονάδες υψηλότερο και ήταν, κατά μέσο όρο, μεγαλύτερη κατά 10,6 χρόνια σε σύγκριση με τη μη διαβητική ομάδα.

Τα πιο διακριτικά χαρακτηριστικά μεταξύ των διαβητικών και των μη διαβητικών ήταν ο απόλυτος αριθμός λεμφοκυττάρων (ALC), η ηλικία, η γλυκόζη αίματος νηστείας (FBG), ο BMI και ο αριθμός των λευκών αιμοσφαιρίων (WBC), με επιπλέον 11 σημαντικά χαρακτηριστικά που εντοπίστηκαν επίσης. Δεδομένου ότι πολλά ζεύγη χαρακτηριστικών, όπως η αιμοσφαιρίνη (HGB) και ο αιματοκρίτης (HCT) ή τα ουδετερόφιλα (NEU) και τα λεμφοκύτταρα (LYM), είχαν υψηλή συσχέτιση, υπήρχε ανάγκη να εξαλειφθεί ο πλεονασμός για να σταθεροποιηθεί το μοντέλο.

Χρησιμοποιώντας τη χειροκίνητη επιμέλεια και την τεχνική mRMR, εντοπίστηκε ένας βέλτιστος χώρος χαρακτηριστικών. Από τα αρχικά 27 χαρακτηριστικά, επιλέχθηκαν μόνο 13. Και οι δύο μέθοδοι τόνισαν τη σημασία του FBG, του BMI, του ALC και της ηλικίας. Όταν δοκιμάστηκαν, τα μοντέλα που κατασκευάστηκαν με 13 χαρακτηριστικά ξεπέρασαν ελαφρώς τα μοντέλα με 27, επιδεικνύοντας αύξηση της ακρίβειας και της ευαισθησίας. Πραγματοποιήθηκε περαιτέρω επικύρωση σε δύο ανεξάρτητα σετ δοκιμών, το D2 και το D3. Οι τιμές Area Under the Curve (AUC) και των δύο μοντέλων ξεπέρασαν το 0,95 στο D2 και πλησίασαν το 0,90 στο D3.

Ένα αξιοσημείωτο μειονέκτημα ήταν το ψευδώς θετικό ποσοστό του μοντέλου mRMR στο εξαιρετικά μη ισορροπημένο σύνολο δεδομένων D2. Ωστόσο, αυτά τα αποτελέσματα κατέδειξαν την ικανότητα του μοντέλου στον εντοπισμό μη διαγνωσμένων διαβητικών στον πληθυσμό NFG. Για να προσδιορίσει ποια χαρακτηριστικά ήταν υψίστης σημασίας για τον προσδιορισμό του διαβητικού κινδύνου, η μελέτη βασίστηκε στα βάρη από το μοντέλο χειροκίνητης επιμέλειας 13 χαρακτηριστικών. Το ALC, το FBG, η ηλικία, το φύλο και ο ΔΜΣ εμφανίστηκαν ως οι πέντε κορυφαίες μεταβλητές.