Search Icon
ΑΝΑΖΗΤΗΣΗ
Τεχνολογία

Αλγόριθμος γλώσσα: Το MIT αποκαλύπτει νέο αλγόριθμο που μαθαίνεις γλώσσες μόνο παρακολουθώντας βίντεο

Αλγόριθμος γλώσσα: Το MIT αποκαλύπτει νέο αλγόριθμο που μαθαίνεις γλώσσες μόνο παρακολουθώντας βίντεο

Αλγόριθμος γλώσσα: Το Τεχνολογικό Ινστιτούτο της Μασαχουσέτης (MIT) εισήγαγε έναν καινοτόμο αλγόριθμο που μπορεί να μάθει γλώσσα μόνο παρακολουθώντας βίντεο.


Το Τεχνολογικό Ινστιτούτο της Μασαχουσέτης (MIT) εισήγαγε έναν καινοτόμο αλγόριθμο που μπορεί να μάθει γλώσσα μόνο παρακολουθώντας βίντεο. Ο Mark Hamilton, διδακτορικός φοιτητής στην ηλεκτρολόγια μηχανική και την επιστήμη των υπολογιστών, ηγείται αυτού του έργου μαζί με τους συναδέλφους του στο Εργαστήριο Επιστήμης Υπολογιστών και Τεχνητής Νοημοσύνης του MIT (CSAIL). Στόχος τους είναι να χρησιμοποιήσουν μηχανές για την αποκωδικοποίηση της επικοινωνίας των ζώων, ξεκινώντας από την κατάκτηση της ανθρώπινης γλώσσας.

Η έμπνευση για αυτόν τον νέο αλγόριθμο προήλθε από μια απροσδόκητη πηγή: την ταινία “March of the Penguins”. Σε μια σκηνή, ένας πιγκουίνος πέφτει και εκπέμπει ένα βογγητό καθώς προσπαθεί να σηκωθεί. Ο Χάμιλτον παρατήρησε ότι αυτό το βογγητό φαινόταν να υπονοεί μια λέξη, πυροδοτώντας την ιδέα ότι ο ήχος και το βίντεο θα μπορούσαν να χρησιμοποιηθούν μαζί για να διδάξουν τη γλώσσα σε έναν αλγόριθμο. Αυτή η ιδέα οδήγησε στη δημιουργία του DenseAV, ενός μοντέλου που σχεδιάστηκε για να μαθαίνει γλώσσα προβλέποντας οπτικό περιεχόμενο από τον ήχο και αντίστροφα. Για παράδειγμα, το άκουσμα της φράσης «ψήσε το κέικ στους 350» θα ωθούσε το μοντέλο να περιμένει γραφικά ενός κέικ ή ενός φούρνου.

Αλλά για να καταστεί δυνατή η αντιστοίχιση ήχου-βίντεο σε εκατομμύρια βίντεο, το DenseAV πρέπει να μάθει το πλαίσιο του τι συζητούν οι άνθρωποι. Αφού εκπαίδευσε το DenseAV σε αυτήν την εργασία αντιστοίχισης, η ερευνητική ομάδα εξέτασε σε ποια pixel εστίασε το μοντέλο κατά την επεξεργασία ήχων. Όταν αναφέρθηκε η λέξη “σκύλος”, ο αλγόριθμος αναζήτησε εικόνες σκύλου στη ροή βίντεο, υποδεικνύοντας ότι κατανοεί τη σημασία της λέξης. Ομοίως, όταν άκουσε ένα σκυλί να γαβγίζει, αναζήτησε σκυλιά στο βίντεο. Η ομάδα ήταν περίεργη αν το DenseAV μπορούσε να κάνει διάκριση μεταξύ της λέξης “σκύλος” και του ήχου ενός σκύλου που γαβγίζει. Δίνοντας στο DenseAV μια προσέγγιση διπλού εγκεφάλου, ανακάλυψαν ότι η μία πλευρά επικεντρωνόταν φυσικά στη γλώσσα, όπως η λέξη “σκύλος”, ενώ η άλλη επικεντρώθηκε στους ήχους, όπως το γάβγισμα.

Η ομάδα αντιμετώπισε ένα δύσκολο έργο στην εκμάθηση μιας γλώσσας χωρίς εισαγωγή κειμένου, καθώς στόχευε να ανακαλύψει ξανά την ουσία της γλώσσας από την αρχή χωρίς τη χρήση προεκπαιδευμένων γλωσσικών μοντέλων. Αυτή η μέθοδος εμπνέεται από το πώς τα παιδιά μαθαίνουν τη γλώσσα παρατηρώντας και ακούγοντας το περιβάλλον τους. Μια πιθανή εφαρμογή αυτής της τεχνολογίας είναι η εκμάθηση από τον τεράστιο όγκο περιεχομένου βίντεο που ανεβάζεται καθημερινά στο διαδίκτυο. Ο Χάμιλτον και η ομάδα του στοχεύουν στη δημιουργία συστημάτων που μπορούν να μάθουν από εκπαιδευτικά βίντεο και άλλο διαδικτυακό περιεχόμενο.

Μια άλλη ενδιαφέρουσα εφαρμογή είναι η κατανόηση νέων γλωσσών, όπως η επικοινωνία με δελφίνια ή φάλαινες, που δεν έχουν γραπτή μορφή. Η ομάδα ελπίζει ότι το DenseAV μπορεί να βοηθήσει στη μετάφραση αυτών των γλωσσών, οι οποίες έχουν διαφύγει εδώ και πολύ καιρό από την ανθρώπινη κατανόηση.

“Ελπίζουμε ότι το DenseAV μπορεί να μας βοηθήσει να κατανοήσουμε αυτές τις γλώσσες που έχουν αποφύγει τις προσπάθειες ανθρώπινης μετάφρασης από την αρχή. Τέλος, ελπίζουμε ότι αυτή η μέθοδος μπορεί να χρησιμοποιηθεί για την ανακάλυψη μοτίβων μεταξύ άλλων ζευγών σημάτων, όπως οι σεισμικοί ήχοι που κάνει η γη και γεωλογία», είπε ο Χάμιλτον σε δήλωση.

Διαβάστε όλες τις τελευταίες Ειδήσεις για την υγεία από την Ελλάδα και τον Κόσμο
Ακολουθήστε το healthweb.gr στο Google News και μάθετε πρώτοι όλες τις ειδήσεις
Ακολουθήστε το healthweb.gr στο κανάλι μας στο YouTube

Διαβάστε Eπίσης:

Η τεχνητή νοημοσύνη βοηθά τους επαγγελματίες υγείας να διαβάζουν μπερδεμένα ΗΕΓ για να σώζουν ζωές

Η τεχνητή νοημοσύνη βελτιώνει την ακρίβεια διαγνώσεων καρκίνου του δέρματος

Αλγόριθμος μηχανικής μάθησης προσφέρει στους ουρολόγους σημαντικά οφέλη

Ποιοι επιστήμονες αναφέρονται περισσότερο στις ειδήσεις;

svg%3E svg%3E
svg%3E
svg%3E
Περισσότερα

Πρωτοποριακό μίνι ρομπότ πραγματοποιεί βιοψίες 

Ρομποτ βιοψία: Ένα από τα κύρια πλεονεκτήματα αυτού του μίνι ρομπότ είναι η ελαχιστοποίηση του κινδύνου μόλυνσης και επιπλοκών που συνδέονται με τις παραδοσιακές βιοψίες. Δεδομένου ότι δεν απαιτείται φυσική παρέμβαση, οι ασθενείς υποβάλλονται σε λιγότερη ταλαιπωρία και η ανάρρωσή τους είναι ταχύτερη.

Σαρώσεις προβλέπουν τις γλωσσικές ικανότητες παιδιών με ΔΑΦ

Σαρώσεις εγκεφάλου: Μελετώντας την εγκεφαλική δραστηριότητα κατά τη διάρκεια γλωσσικών εργασιών, οι ερευνητές μπορούν να εντοπίσουν τις περιοχές του εγκεφάλου που είναι υπεύθυνες για την παραγωγή και κατανόηση της γλώσσας.

Tεστ DNA για την βακτηριακή κολπίτιδα

Βακτηριακή κολπίτιδα: Eρευνητές ανέπτυξαν ένα απλό εργαστηριακό τεστ βασισμένο σε DNA PCR, σε μια πιο λεπτομερή γενετική ανάλυση της κύριας ομάδας βακτηριακών οργανισμών που προκαλούν τη μόλυνση.

Πώς η φορητή τεχνολογία μεταμορφώνει τη φροντίδα των ποδιών

Φορητή τεχνολογία: Είναι ένα σημαντικό βήμα προς τα εμπρός για την υγεία των ποδιών. Προσφέρει έγκαιρες προειδοποιήσεις και εξατομικευμένες πληροφορίες πέρα ​​από την παραδοσιακή μέθοδο.

Πώς οι μαγνητικές σαρώσεις εντοπίζουν 6 τύπους κατάθλιψης 

Μαγνητικές σαρώσεις: Αυτές οι ανακαλύψεις με τη χρήση μαγνητικών σαρώσεων προτείνουν ότι η κατάθλιψη δεν είναι μια ενιαία διαταραχή αλλά ένα σύνθετο φαινόμενο με πολλές υποκατηγορίες, καθένα από τα οποία απαιτεί διαφορετική προσέγγιση στη διάγνωση και θεραπεία.

Close Icon