Grace aux avancées de l’intelligence artificielle, Facebook a officiellement lancé le 5 avril dernier une fonctionnalité appelée « automatic alternative text » permettant de décrire le contenu des photos publiées sur son réseau. Cette option, basée sur la technologie de reconnaissance d’objets, est destinée aux aveugles et malvoyants. Disponible pour le moment uniquement sur iOS et sur des marchés anglophones spécifiques, à savoir les États-Unis, le Royaume-Uni, le Canada, la Nouvelle Zélande, le dispositif devrait être étendu rapidement à d’autres langues et systèmes d’exploitation.

La nouvelle fonctionnalité Facebook capable de lire le contenu d’images

D’après Facebook, il existerait 39 millions d’aveugles et 246 millions de malvoyants dans le monde, qui ont jusqu’à date été exclus des interactions portant sur les photos. C’est un enjeu de taille pour la plateforme sociale ainsi que pour ses filiales Instagram, Messenger et Whatsapp qui voient circuler par moins de deux milliards de photos chaque jour. Ainsi, une centaine d’éléments pourront être reconnus, comme les modes de transports, la nourriture, et l’apparence des personnes. Un texte alternatif ou « automatic alternative text » sera utilisé par les logiciels de lecture d’écran utilisés par les malvoyants.

La description fournit à l’utilisateur quelques mots sur ce qui a pu être automatiquement reconnu

Dans le cadre d’une démonstration pour la presse, le système indiquait qu’une photo pouvait montrer le ciel, un arbre, une pizza, ou trois personnes qui sourient. La description du contenu de l’image reste partielle, avec pour le moment une petite centaine d’éléments reconnus automatiquement, comme les modes de transport (voiture, bateau, avion, vélo…), des éléments naturels (extérieur, montagne, arbre, océan, soleil…), des sports (tennis, natation, golf…) ou de la nourriture (pizza, sushi, café, dessert).

À l’origine du projet, un ingénieur aveugle

Matt King, un ingénieur du groupe qui a perdu la vue quand il était à l’université, et Jeff Wieland, un des membres de l’équipe s’occupant des questions d’accessibilité chez Facebook, ont expliqué à la presse que le choix des éléments décrits par la fonctionnalité repose sur la fréquence d’apparition de ces éléments au sein des photos publiées sur Facebook, mais aussi sur la capacité du système à les reconnaître de manière fiable. Ils ont ajouté que dans le futur le système pourrait être développé pour fournir des descriptions plus complètes, et par exemple préciser les activités auxquelles se livrent les personnes sur une photo.

Une option disponible pour cinq pays anglophones pour le moment

La description de photos sera pour le moment disponible sur les smartphones Apple et dans cinq pays anglophones, à savoir les États-Unis, le Royaume-Uni, le Canada, l’Australie et la Nouvelle-Zélande. L’objectif est toutefois de l’étendre rapidement à d’autres langues et à d’autres plateformes Comment l’utiliser ? Rien de plus facile, il faut se rendre dans le menu « accessibility » puis ensuite activer l’option « Voice Over ».

Comment cette technologie traduit les ambitions de Facebook dans l’intelligence artificielle

La firme américaine a ouvert un centre de recherche à Paris en 2015 entièrement dédié à l’intelligence artificielle. Il s’agit même du premier centre en la matière situé en dehors des États-Unis. Mais c’est Twitter qui a donné le pas il y a quelques semaines avec le lancement d’une fonctionnalité similaire, qui permet une description de 420 signes sur chaque image publiée. Le texte peut ensuite y être reconnu par les logiciels de lecture d’écran et de lecture du braille. Mais contrairement à Facebook, la description se fait de manière manuelle et non par l’intelligence artificielle.

Yann Lecun, le pionnier français en la matière

Le français Yann LeCun, vedette de l’intelligence artificielle chez Facebook, est considéré comme un dieu dans sa discipline. Il a convaincu la communauté scientifique, devenue frileuse sur l’intelligence artificielle, de relancer le deep learning (apprentissage profond) qui a révolutionné la reconnaissance automatique de formes et d’images.

Mais Facebook n’est pas le seul à avoir flairé le filon

En effet Facebook n’est pas le seul géant du web à utiliser l’intelligence artificielle pour aider les personnes handicapées. Lors d’une conférence fin mars 2016, Microsoft avait aussi évoqué l’intégration de fonctions de reconnaissance d’objet ou de texte à des applications mobiles, et avait même montré dans une vidéo comment ce type de fonctionnalité pourrait par exemple s’intégrer à des lunettes ou un smartphone pour voir à la place d’un aveugle, et de lui décrire les personnes qui l’entourent ainsi que leurs réactions, ou encore leur lire le menu d’un restaurant.

La communauté des aveugles enthousiaste quant à ces initiatives

À en croire Vincent Michel, président de la Fédération des aveugles de France, les initiatives de Facebook et Twitter sont excellentes. Lui-même aveugle, il s’est mis récemment à ces réseaux sociaux. Il explique : « Avec aussi peu de signes dans les messages qui sont limités à 140 caractères et sans voir la photo, on passe la plupart du temps à côté du message. Tout ce qui concourt à ce que ce monde de plus en plus visuel nous soit accessible va dans le bon sens. »

La fédération des malvoyants de France suit de très près les questions liées à l’usage des nouvelles technologies, et en particulier celles liées à l’accessibilité du Web. Il ajoute : « Dans une société de l’image, l’accessibilité est un problème majeur. Nous devons constamment nous adapter à des techniques qui évoluent. »

La loi française oblige les sites web à favoriser l’accès aux aveugles et malvoyants

Mais seulement en théorie. Si l’organisme de standardisation de l’Internet, le World Wide Web Consortium (W3C), a établi des critères  précis d’accessibilité, comme un code qui facilite le travail des logiciels de lecture d’écran, dans les faits tous les sites internet ne répondent pas à ces critères de façon égale.

Selon Vincent Michel « Plus les sites sont complexes, moins ils sont faciles à lire pour nous. L’informatique est conçue pour les voyants, qui lisent l’écran d’un seul regard. Nous avons une vision plus parcellaire, nous devons fouiller dans tous les recoins d’un site. »

contact us btn icon

Passez à l'étape supérieure avec Alvexo Donnez nous la possibilité de vous contacter.

Ravi de vous rencontrer! Utilisez au moins 3 caractères
C'est bon! Quelque chose ne colle pas. Veuillez réessayer
x

On se connait déjà! Connectez-vous ou récupérez votre mot de passe

Êtes-vous sûr? Veuillez réessayer s’il vous plaît
+ -