Login
Adresse email
Mot de passe
Confirmez votre Mot de passe

Lense

Nima de Google : quand l’intelligence artificielle note les photos

Nima, la technologie d’intelligence artificielle dévoilée par Google le 18 décembre dernier, permet d’évaluer la qualité esthétique d’une photo.

Ces derniers mois, Adobe a impressionné par ses innovations en termes d’intelligence artificielle appliquée à la photographie. Google a travaillé aussi, mais dans une autre direction. Le géant d’Internet présente une technologie capable de déterminer si une photographie est plus ou moins réussie.

Qualité d’image et esthétique : deux éléments distincts

Évaluer la qualité d’une image à partir d’un algorithme est la partie la plus “facile” de l’opération, car il est possible d’évaluer la dégradation des pixels généré par le bruit, le flou, la compression ou encore l’exposition, etc.

Mais dans le domaine de l’esthétique, les choses se compliquent. Le bruit dans une image n’est pas nécessairement inesthétique. De la même manière, considérer le flou comme un manque de netteté est loin d’être toujours pertinent.

Le « machine learning » à l’œuvre

Google a utilisé l’intelligence artificielle pour intégrer de nouveaux critères d’analyse et entraîner son système à reconnaître les éléments qui sont à l’origine d’émotions humaines et de l’impression de beauté.

En isolant de nombreux critères de qualité et d’esthétique, et en analysant séparément chaque élément avant de regrouper le tout dans une note globale, Google affirme être capable de proposer une analyse plus fine que les technologies existant auparavant.

Avec cette approche, Google peut désormais proposer un système de notation qui prend en compte le degré de perfection technique d’une photo, ainsi que son attractivité esthétique.

Et au final, cela semble plutôt bien fonctionner. Google a entraîné son outil, puis a fait un test comparatif avec l’avis de nombreuses personnes réelles constituées en jury. L’outil a été capable ensuite de noter d’autres photos avec des résultats très proches de ce que trouvait un jury humain. Même si les photos ci-dessus montrent des écarts (les deux chiffres sous chaque photo), les résultats sont étonnamment proches.

Mais les choses se compliquent pour l’algorithme confronté à de véritables œuvres d’art, surtout si elles sortent des sentiers battus. Dans ce domaine, l’algorithme n’est plus pertinent, du moins pour le moment, et c’est plutôt rassurant.

Un outil aux applications multiples

Nima (Neural Image Assessment) n’est pas fait à ce stade pour remplacer une analyse humaine. Mais l’outil pourrait être intéressant pour l’apprentissage, permettant ainsi de mieux comprendre pourquoi certaines de leurs images “fonctionnent”, et d’autres non. Cela permettra aussi de déterminer ce qui peut être amélioré.

Autre possibilité : pouvoir présélectionner les meilleures images dans une masse importante, ou supprimer celles totalement ratées, pour isoler les plus intéressantes sans intervention humaine.

Google se penche aussi sur l’édition d’images. De nouveaux outils pourraient faire leur apparition et se concentrer sur la correction des éléments les moins réussis d’une image.  On pourra certainement dans quelque temps optimiser sa photo d’un simple clic, avec le risque de le faire pour augmenter sa note.

Le risque d’une allégeance à l’algorithme

Mais il y a bien sûr un risque d’effet pervers avec cette approche. Google, dont le cœur de métier est l’organisation du contenu, a toujours œuvré à automatiser le fastidieux travail de tri humain. Mais cela pourrait générer les mêmes écueils qu’avec les contenus, où le fait d’apparaître en haut des résultats de recherche peut rapidement devenir plus important que le contenu lui-même.

Le jour où un algorithme décidera seul de ce qu’est une belle photo, on risque de voir apparaître une nouvelle course à l’optimisation. Et si en plus un clic de souris permet d’améliorer son score et donc son positionnement, le risque d’uniformisation deviendra lui aussi bien réel.

Dans le domaine des contenus, Google a limité la sur-optimisation en donnant de plus en plus de place à la réaction de ceux qui les consultent. Il faut espérer que dans le domaine de l’image, une grande place sera directement faite à cette subjectivité.

Source : Google 

commentaire

Ajouter le vôtre

Laissez un commentaire

Laissez un commentaire

Devenir Lenser