Il captionbot di Microsoft descrive le immagini, quindi non è necessario

Video: I used Advanced AI to caption Weird Stock Photos 2024

Video: I used Advanced AI to caption Weird Stock Photos 2024
Anonim

Microsoft ha lanciato uno strumento di riconoscimento delle immagini che tenta di descrivere il contenuto di un'immagine. Questo strumento di intelligenza artificiale è ancora in fase di sviluppo e apprende costantemente dalle immagini caricate dagli utenti.

Per quanto riguarda l'accuratezza, a volte la descrizione è abbastanza accurata mentre a volte CaptionBot offre descrizioni che non hanno nulla a che fare con ciò che viene rappresentato. Ci sono anche casi in cui l'app non è in grado di fornire una descrizione, a causa del suo stato approssimativo.

Microsoft ha progettato CaptionBot per apprendere con maggiore esperienza, con l'aspettativa che le sue didascalie diventino più accurate nel tempo. Più immagini caricano gli utenti, migliore diventa l'app, come si descrive CaptionBot:

Riesco a capire il contenuto di qualsiasi immagine e cercherò di descriverlo così come qualsiasi essere umano. Sto ancora imparando, quindi terrò sulla tua foto ma nessuna informazione personale.

CaptionBot utilizza tre tecnologie per descrivere ciò che viene rappresentato in un'immagine: Computer Vision, Emotion e Bing Image di Microsoft. L'API di Computer Vision estrae informazioni dettagliate dalle immagini per classificare ed elaborare i dati visivi oltre a identificare ed estrarre il testo da un'immagine. L'API Emotion, come suggerisce il nome, analizza i volti per rilevare una serie di sentimenti, da rabbia, disprezzo, disgusto, paura, felicità, neutralità, tristezza e sorpresa. Bing Image cerca immagini nel Web.

Abbiamo testato CaptionBot e i risultati sono stati accurati nel 50% dei casi. Ad esempio, abbiamo caricato due foto: una raffigurante un mouse da gioco, l'altra una pila di carte. In entrambi i casi, lo strumento ha suggerito che si trattava di un telefono cellulare. D'altra parte, CaptionBot ha rilevato con precisione esseri umani e volti.

Apparentemente, CaptionBot ha un'ossessione per i cellulari. Un utente di Twitter ha riferito che l'app pensava che Michelle Obama fosse un telefono cellulare. Per ulteriori didascalie divertenti CaptionBot, dai un'occhiata a questa pagina Twitter.

Puoi anche testare CaptionBot qui. Provalo: aiuterai lo strumento a migliorare o ti farai una bella risata!

Il captionbot di Microsoft descrive le immagini, quindi non è necessario