Qu’est-ce que la computer vision ?
Qu’est-ce que la computer vision ?
La Computer Vision est une discipline informatique qui fait appel à l’intelligence artificielle pour comprendre des données visuelles (images). Si l’on considère que l’intelligence artificielle permet de « réfléchir » en analysant et interprétant les données qui lui sont fournies, la Computer Vision « voit » en suivant le même processus.
Les données visuelles soumises à la Computer Vision incluent tout élément contenant des pixels : images, vidéos, icônes, etc. L’objectif est d’interpréter les images comme le feraient des êtres humains. Cette technologie est en plein essor, mais on peut aujourd’hui lui rattacher les trois tâches suivantes :
- Classification des objets :
capacité à localiser ou classer un objet au sein de données visuelles. Dans sa forme la plus simple, il s’agit de permettre à l’ordinateur d’identifier le contenu d’une image, par exemple des arbres, l’océan ou encore un chien.
- Localisation d’objets :
la localisation d’objets permet de localiser un objet donné au sein de données visuelles. Par exemple, l’ordinateur est capable d’identifier et de localiser où se trouve le chien sur une photo.
- Détection d’objets :
la détection d’objets est une forme plus élaborée de Computer Vision. Elle permet aux ordinateurs d’identifier et de localiser avec précision plusieurs objets au sein de données visuelles. Par exemple, imaginez une photo représentant un chien et un chat. Avec la détection d’objets, l’ordinateur peut faire la différence entre ces deux objets, les identifier et les localiser.
Comment fonctionne la computer vision ?
La Computer Vision repose sur la reconnaissance de structures. Elle utilise des algorithmes pour analyser une immense quantité de données visuelles et les interpréter.
Ces algorithmes sont entraînés par exposition à des quantités impressionnantes de données visuelles, qui leur permettent d’apprendre à distinguer des caractéristiques et structures clés. Par exemple, pour enseigner à un ordinateur à reconnaître des bateaux, les data scientists doivent l’alimenter en images représentant des bateaux et d’autres objets liés. Au fil du temps, l’ordinateur apprendra ainsi à distinguer ce qui est un bateau et ce qui ne l’est pas, mais aussi les caractéristiques clés d’un bateau.
Une fois que l’ordinateur est capable d’identifier avec précision ce que représente une image, il est capable d’en segmenter, détecter et classer le contenu à diverses fins. Grâce aux progrès de l’intelligence artificielle, la Computer Vision est aussi bonne, voire souvent supérieure à son équivalent humain.
Utilisations de la computer vision
La Computer Vision présente déjà de nombreux cas d’utilisation, et de nouveaux voient rapidement le jour avec l’accessibilité grandissante de cette technologie. À l’heure actuelle, nous pouvons citer parmi les plus courants :
Sécurité de l’email :
Technologie de reconnaissance faciale :
la Computer Vision est à la base de logiciels qui analysent les caractéristiques du visage des personnes pour confirmer leur identité. Les cas d’utilisation de la reconnaissance faciale se multiplient rapidement, mais les plus populaires incluent la sécurité lors des contrôles aux aéroports et aux frontières, l’identification de criminels et la connexion sur smartphone.
Voitures autonomes :
la Computer Vision est aussi au cœur de la technologie des véhicules autonomes. Les Tesla, par exemple, ont recours à la classification, l’identification et la localisation des objets pour manœuvrer en toute sécurité, avec un minimum d’interventions humaines.
Détection des feux tricolores et des piétons :
la détection des feux tricolores permet d’optimiser le trafic. Cette technologie utilise des capteurs numériques pour reconnaître des moments clés du trafic, par exemple des voitures qui attendent le feu vert, la présence de véhicules de secours à proximité ou même le passage d’un véhicule au feu rouge. De même, la détection des piétons permet d’identifier les piétons aux passages qui leur sont réservés et à divers endroits de la route.
Imagerie médicale (rayons X, scanners, etc.) :
les radiologues et autres spécialistes médicaux s’appuient sur la Computer Vision pour interpréter avec plus de précision les images médicales. Les modèles d’IA mettent en exergue les anomalies qui sont difficiles à détecter à l’œil nu et améliorent ainsi considérablement la précision du diagnostic et même le pronostic.
Computer vision et cybersécurité
En 2019, le monde de la cybersécurité a misé sur la Computer Vision pour détecter plus efficacement les menaces. Avec le machine learning, les chercheurs ont pu créer un programme capable de détecter un malware en s’appuyant sur les images qui lui sont associées. Au fil du temps, cette technologie a évolué pour inclure la détection des sites et emails de phishing, et bien plus encore.
De manière générale, la Computer Vision identifie les menaces de cybersécurité en recourant à la visualisation binaire pour identifier des structures reconnaissables. Cette visualisation binaire lui permet de détecter des structures malveillantes ou sûres. Par exemple, les fichiers malveillants ont tendance à inclure des caractères ASCII ou des images très dynamiques.
Historiquement, la protection contre les sites malveillants impliquait de mettre en liste noire les domaines suspects. La Computer Vision améliore la cybersécurité en détectant les malwares à partir des images contenues dans les emails de phishing. Cette technologie ajoute un niveau de protection avant même que le destinataire d’un email malveillant ne clique sur un lien d’un domaine dangereux.
Contribution de la computer vision au renforcement de la sécurité de l’email
- Manipulation d’images :
- Images composées de texte :
- Images distantes :