Search Icon
ΑΝΑΖΗΤΗΣΗ
Τεχνολογία

Αλγόριθμος γλώσσα: Το MIT αποκαλύπτει νέο αλγόριθμο που μαθαίνεις γλώσσες μόνο παρακολουθώντας βίντεο

Αλγόριθμος γλώσσα: Το MIT αποκαλύπτει νέο αλγόριθμο που μαθαίνεις γλώσσες μόνο παρακολουθώντας βίντεο

Αλγόριθμος γλώσσα: Το Τεχνολογικό Ινστιτούτο της Μασαχουσέτης (MIT) εισήγαγε έναν καινοτόμο αλγόριθμο που μπορεί να μάθει γλώσσα μόνο παρακολουθώντας βίντεο.


Το Τεχνολογικό Ινστιτούτο της Μασαχουσέτης (MIT) εισήγαγε έναν καινοτόμο αλγόριθμο που μπορεί να μάθει γλώσσα μόνο παρακολουθώντας βίντεο. Ο Mark Hamilton, διδακτορικός φοιτητής στην ηλεκτρολόγια μηχανική και την επιστήμη των υπολογιστών, ηγείται αυτού του έργου μαζί με τους συναδέλφους του στο Εργαστήριο Επιστήμης Υπολογιστών και Τεχνητής Νοημοσύνης του MIT (CSAIL). Στόχος τους είναι να χρησιμοποιήσουν μηχανές για την αποκωδικοποίηση της επικοινωνίας των ζώων, ξεκινώντας από την κατάκτηση της ανθρώπινης γλώσσας.

Η έμπνευση για αυτόν τον νέο αλγόριθμο προήλθε από μια απροσδόκητη πηγή: την ταινία “March of the Penguins”. Σε μια σκηνή, ένας πιγκουίνος πέφτει και εκπέμπει ένα βογγητό καθώς προσπαθεί να σηκωθεί. Ο Χάμιλτον παρατήρησε ότι αυτό το βογγητό φαινόταν να υπονοεί μια λέξη, πυροδοτώντας την ιδέα ότι ο ήχος και το βίντεο θα μπορούσαν να χρησιμοποιηθούν μαζί για να διδάξουν τη γλώσσα σε έναν αλγόριθμο. Αυτή η ιδέα οδήγησε στη δημιουργία του DenseAV, ενός μοντέλου που σχεδιάστηκε για να μαθαίνει γλώσσα προβλέποντας οπτικό περιεχόμενο από τον ήχο και αντίστροφα. Για παράδειγμα, το άκουσμα της φράσης «ψήσε το κέικ στους 350» θα ωθούσε το μοντέλο να περιμένει γραφικά ενός κέικ ή ενός φούρνου.

Αλλά για να καταστεί δυνατή η αντιστοίχιση ήχου-βίντεο σε εκατομμύρια βίντεο, το DenseAV πρέπει να μάθει το πλαίσιο του τι συζητούν οι άνθρωποι. Αφού εκπαίδευσε το DenseAV σε αυτήν την εργασία αντιστοίχισης, η ερευνητική ομάδα εξέτασε σε ποια pixel εστίασε το μοντέλο κατά την επεξεργασία ήχων. Όταν αναφέρθηκε η λέξη “σκύλος”, ο αλγόριθμος αναζήτησε εικόνες σκύλου στη ροή βίντεο, υποδεικνύοντας ότι κατανοεί τη σημασία της λέξης. Ομοίως, όταν άκουσε ένα σκυλί να γαβγίζει, αναζήτησε σκυλιά στο βίντεο. Η ομάδα ήταν περίεργη αν το DenseAV μπορούσε να κάνει διάκριση μεταξύ της λέξης “σκύλος” και του ήχου ενός σκύλου που γαβγίζει. Δίνοντας στο DenseAV μια προσέγγιση διπλού εγκεφάλου, ανακάλυψαν ότι η μία πλευρά επικεντρωνόταν φυσικά στη γλώσσα, όπως η λέξη “σκύλος”, ενώ η άλλη επικεντρώθηκε στους ήχους, όπως το γάβγισμα.

Η ομάδα αντιμετώπισε ένα δύσκολο έργο στην εκμάθηση μιας γλώσσας χωρίς εισαγωγή κειμένου, καθώς στόχευε να ανακαλύψει ξανά την ουσία της γλώσσας από την αρχή χωρίς τη χρήση προεκπαιδευμένων γλωσσικών μοντέλων. Αυτή η μέθοδος εμπνέεται από το πώς τα παιδιά μαθαίνουν τη γλώσσα παρατηρώντας και ακούγοντας το περιβάλλον τους. Μια πιθανή εφαρμογή αυτής της τεχνολογίας είναι η εκμάθηση από τον τεράστιο όγκο περιεχομένου βίντεο που ανεβάζεται καθημερινά στο διαδίκτυο. Ο Χάμιλτον και η ομάδα του στοχεύουν στη δημιουργία συστημάτων που μπορούν να μάθουν από εκπαιδευτικά βίντεο και άλλο διαδικτυακό περιεχόμενο.

Μια άλλη ενδιαφέρουσα εφαρμογή είναι η κατανόηση νέων γλωσσών, όπως η επικοινωνία με δελφίνια ή φάλαινες, που δεν έχουν γραπτή μορφή. Η ομάδα ελπίζει ότι το DenseAV μπορεί να βοηθήσει στη μετάφραση αυτών των γλωσσών, οι οποίες έχουν διαφύγει εδώ και πολύ καιρό από την ανθρώπινη κατανόηση.

“Ελπίζουμε ότι το DenseAV μπορεί να μας βοηθήσει να κατανοήσουμε αυτές τις γλώσσες που έχουν αποφύγει τις προσπάθειες ανθρώπινης μετάφρασης από την αρχή. Τέλος, ελπίζουμε ότι αυτή η μέθοδος μπορεί να χρησιμοποιηθεί για την ανακάλυψη μοτίβων μεταξύ άλλων ζευγών σημάτων, όπως οι σεισμικοί ήχοι που κάνει η γη και γεωλογία», είπε ο Χάμιλτον σε δήλωση.

Διαβάστε όλες τις τελευταίες Ειδήσεις για την υγεία από την Ελλάδα και τον Κόσμο
Ακολουθήστε το healthweb.gr στο Google News και μάθετε πρώτοι όλες τις ειδήσεις
Ακολουθήστε το healthweb.gr στο κανάλι μας στο YouTube

Διαβάστε Eπίσης:

Η τεχνητή νοημοσύνη βοηθά τους επαγγελματίες υγείας να διαβάζουν μπερδεμένα ΗΕΓ για να σώζουν ζωές

Η τεχνητή νοημοσύνη βελτιώνει την ακρίβεια διαγνώσεων καρκίνου του δέρματος

Αλγόριθμος μηχανικής μάθησης προσφέρει στους ουρολόγους σημαντικά οφέλη

Ποιοι επιστήμονες αναφέρονται περισσότερο στις ειδήσεις;

svg%3E svg%3E
svg%3E
svg%3E
Περισσότερα

Πώς ο νέος παράγοντας αντίθεσης κάνει τα υπερηχογραφήματα πιο προσιτά και ασφαλή

Υπερηχογραφήματα: Οι πρόσφατες εξελίξεις στην ιατρική απεικόνιση παρουσίασαν έναν νέο παράγοντα αντίθεσης για την τεχνολογία υπερηχογραφίας, ο οποίος θα μπορούσε να βελτιώσει σημαντικά την προσιτότητα και την ασφάλεια των διαγνωστικών διαδικασιών.

Πώς η πανδημία μετέτρεψε τη ψυχιατρική φροντίδα για άτομα με σχιζοφρένεια

Τηλεψυχιατρική: Η τηλεψυχιατρική έγινε γρήγορα ένα βασικό εργαλείο για την εξασφάλιση συνεχούς φροντίδας κατά τη διάρκεια των lockdown και των μέτρων κοινωνικής αποστασιοποίησης.

Είναι οι φορητές συσκευές ο νέος σύμμαχος στην ανίχνευση εξάρσεων φλεγμονώδους νόσου του εντέρου;

Φορητές συσκευές: Οι φορητές συσκευές διαθέτουν αισθητήρες που μετρούν τον καρδιακό ρυθμό, τη θερμοκρασία του δέρματος, τη σωματική δραστηριότητα και τα μοτίβα ύπνου. Σε άτομα με φλεγμονώδη νόσο του εντέρου, αυτοί οι δείκτες συχνά αλλάζουν κατά τη διάρκεια μιας έξαρσης.

Αντιμετωπίζει η τεχνητή νοημοσύνη τις γνωστικές αλλαγές στην εμμηνόπαυση;

Τεχνητή νοημοσύνη: Πρόσφατες εξελίξεις στην τεχνητή νοημοσύνη προσφέρουν υποσχόμενα εργαλεία για την αναγνώριση και παρακολούθηση της γνωστικής καθυστέρησης κατά τη διάρκεια της μετάβασης στην εμμηνόπαυση.

Εστιασμένος υπέρηχος: Μη επεμβατική λύση για τους τρόμους της νόσου του Πάρκινσον

Εστιασμένος υπέρηχος: Η μηχανή εστιασμένου υπερήχου είναι μια επαναστατική ιατρική τεχνολογία που έχει αποδείξει την αποτελεσματικότητά της στη θεραπεία της νόσου του Πάρκινσον, ιδίως στην ανακούφιση ενός από τα πιο εξουθενωτικά συμπτώματά της: τους τρόμους.

Είναι τα βιοδιασπώμενα ηλεκτρόδια η λύση στην αποκατάσταση του εγκεφάλου χωρίς χειρουργείο;

Βιοδιασπώμενα ηλεκτρόδια: Σε μια επαναστατική πρόοδο, οι βιομηχανικοί μηχανικοί ανέπτυξαν βιοδιασπώμενα ηλεκτρόδια που θα μπορούσαν να φέρουν επανάσταση στη θεραπεία εγκεφαλικών τραυμάτων και νευρολογικών διαταραχών.

Close Icon