@maurinoh @LaVi il problema della descrizione automatica è che non sa per quale motivo è stata postata la foto, e quindi non sa cosa deve descrivere e rischia o di tralasciare i dettagli fondamentali o di aggiungere minuzie irrilevanti (che per chi usa un lettore di schermo vogliono dire perdere tempo e dover mantenere l'attenzione mentre vengono letti).
Un esempio un po' estremo ma indicativo del principio possono essere delle foto di due persone in una piazza di una città italiana.
* una foto di me ed un amico in vacanza: in questo caso è rilevante scrivere che siamo noi, in che città siamo, magari descrivere le espressioni di gioia per essere finalmente in vacanza assieme.
* una foto di due politici: in questo caso è importante scrivere il nome dei due politici (anche per chi ci vede, ma ha problemi a riconoscere le facce); a seconda dei casi potrebbe essere rilevante o meno dire in che città si trovano: magari sono politici locali ed è ovvio, magari sono politici che si sono fatti vedere nella città dove è appena successo qualcosa, ed è importante specificarlo
* una foto di un politico e un mafioso che si fanno un selfie assieme (ok, spero che abbiano la decenza di non farlo): beh, è evidente che qui è importante dire di chi si tratta, specificare perché sono persone rilevanti. lo sfondo potrebbe essere totalmente irrilevante.
* una foto di due turisti, sullo sfondo si vede un accampamento di senzatetto: in questo caso il primo piano della foto si può descrivere in due parole, la parte importante è *quel* dettaglio sullo sfondo, e non ad esempio il negozio dall'altro lato.
* una foto di me e una celebrità, anche qui importante precisare il nome della celebrità, e magari entrare nel dettaglio della mia espressione
* una foto di due turisti a caso che per caso si sono fatti un selfie mentre dietro di loro avveniva un fatto di cronaca: in questo caso i turisti sono irrilevanti, e la parte importante è il dettaglio sullo sfondo
questo è un caso estremo con tante varianti, ma casi più semplici sono più frequenti di quanto si pensi, e l'autore del post non fa la minima fatica a distinguere e descrivere la cosa giusta, per un descrittore automatico può andare dal difficile all'impossibile a seconda di quanto contesto c'è attorno.