Λογισμικό της Google καταλαβαίνει τι βλέπει στις φωτογραφίες

Πέμπτη 20 Νοεμβρίου 2014 Ετικέτες

Λογισμικό της Google καταλαβαίνει τι βλέπει στις φωτογραφίες

«Δύο πίτσες ακουμπισμένες στα μάτια της κουζίνας».

«Μια ομάδα ανθρώπων ψωνίζει σε υπαίθρια αγορά» 

Ερευνητές της Google ανέπτυξαν ένα σύστημα τεχνητής νοημοσύνης που περιγράφει σε απλή γλώσσα το περιεχόμενο φωτογραφιών που βλέπει για πρώτη φορά. 

Το λογισμικό, λέει η εταιρεία, θα μπορούσε να βάζει αυτόματα λεζάντες σε εικόνες, διευκολύνοντας έτσι την αναζήτηση εικόνων μέσω του Google Images. 

Θα μπορούσε επίσης «να βοηθά ανθρώπους με προβλήματα όρασης να κατανοούν φωτογραφίες» γράφουν οι ερευνητές της εταιρείας στο Google Research Blog. 

Λογισμικό της Google καταλαβαίνει τι βλέπει στις φωτογραφίες
Παραδείγματα αυτόματης περιγραφής εικόνων. Κλικ για μεγέθυνση (Πηγή: Google)

To σύστημα αποτελείται από δύο «νευρωνικά δίκτυα» -μια αρχιτεκτονική επεξεργασίας που βασίζεται στη δομή του ανθρώπινου εγκεφάλου. Οι «νευρώνες» κάθε δικτύου επικοινωνούν μεταξύ τους και μπορούν να διδαχθούν να επεξεργάζονται πληφορορίες και να δίνουν απαντήσεις. 

Το πρώτο νευρωνικό δίκτυο αναλαμβάνει να αναγνωρίσει τα αντικείμενα της εικόνας και τις μεταξύ τους σχέσης, ενώ το δεύτερο δίκτυο αναλαμβάνει να περιγράψει τα συμπεράσματα του πρώτου. 

Η μελέτη των ερευνητών της Google, διαθέσιμη στην υπηρεσία προδημοσίευσης ArXiv, έρχεται δύο χρόνια μετά την παρουσίαση ενός νευρωνικού δικτύου της εταιρείας που έμαθε να αναγνωρίζει τις γάτες σε βίντεο του YouTube.

0 σχόλια :