Le Machine Learning Blog

C'est quoi les réseaux neuronaux et à quoi servent-ils?

artificial brain

Les réseaux neuronaux sont au cœur de l'intelligence artificielle. Ils sont utilisés par des organisations du monde entier pour innover,automatiser les tâches et pour devenir plus compétitifs. Dans cet article, je vais vous expliquer en termes simples et sans termes mathématiques ou techniques ce qu'ils sont et comment vous pouvez les utiliser pour innover dans votre domaine.

 

Il n'y a rien d'intelligent dans l'intelligence artificielle

Lorsque le terme «intelligence artificielle» entre dans une conversation, la plupart des gens pensent probablement à un cerveau robotique fait de parties électroniques qui est capable de se reveiller d'un moment à l'autre ... J'ai récemment écrit un billet sur la vérité étonnante et ennuyeuse sur Artificial L'intelligence, où j'explique en termes simples pourquoi il n'y a rien d'intrinsèquement intelligent au sujet de l'intelligence artificielle... C'est juste un logiciel informatique utilisant les maths pour faire des calculs compliqués. Les réseaux des neurones sont l'un des moyens les plus populaires de faire du machine learning. Mais il s'avère que nous leur avons donné ce nom, simplement parce que l'architecture du logiciel qui fait tous les calculs a été inspirée par notre compréhension du cerveau humain.

 

Comment fonctionne le cerveau humain

Le cerveau humain est l'unité de traitement centrale du corps humain et il est constitué d'environ 86 milliards de cellules appelées neurones. Chaque neurone a un noyau et se connecte à d'autres neurones par des axones qui forment des synapses. Nous avons environ un quadrillion de synapses dans notre cerveau qui transportent des signaux électriques. Chaque neurone fonctionne comme une «passerelle» qui décide si le courant électrique qu'il reçoit doit passer à la neurone suivant ou non.

neuron

Chaque fois qu'il y a une "entrée" de notre corps, disons par exemple que notre main touche une surface brûlante, un signal électrique est envoyé de la main à notre cerveau et dans un très court laps de temps, le signal électrique voyagera du neurone vers neurone, traitant l'information, jusqu'à ce qu'un signal "de sortie" soit renvoyé à la main, lui disant de s'éloigner de la surface brûlante dès que possible.

 

Le perceptron

À la fin des années 1950, un physicien américain du nom de Frank Rosenblatt, a inventé le concept du perceptron. Le perceptron est un algorithme d'apprentissage supervisé qui a été modélisé d'après le Neuron humain et en tant que tel, il a:

  • Plusieurs canaux d'entrée (différents courants électriques)
  • Une unité de traitement (le noyau du neurone)
  • Une sortie (le courant électrique passe à la neurone suivante ou non)

Le processus se répète plusieurs fois et les sorties deviennent de nouvelles entrées pour d'autres unités de traitement.

perceptron

Une secrétaire virtuelle alimentée par AI

Disons que je suis une personne très célèbre et que chaque jour je reçois dans mon courrier des centaines d'invitations à participer à des événements. Je perds trop de temps à lire chaque invitation et à décider si je devrais participer ou non à l'événement. Je décide que je veux former une secrétaire virtuelle et lui fournir un réseau de neurones afin qu'elle puisse faire le travail pour moi.
La secrétaire pourra filtrer les futures invitations et m'envoyer seulement celles qui valent mon temps et mon attention.

machine learning

Classification binaire

Par souci de simplicité, disons qu'il y a seulement deux facteurs que je veux prendre en considération lorsque je décide de participer à un événement:

  • L'intérêt du sujet
  • La distance de ma maison

Si le sujet est très intéressant et que l'événement est proche de chez moi, je vais certainement y assister. Si au contraire, l'événement est ennuyeux et qu'il est aussi très loin de chez moi, je ne vais certainement pas y aller. Le réseau neuronal ressemblerait à ceci:

Perceptron

Disons que je veux passer du temps avec mes secrétaires virtuelles afin de filtrer correctement mes invitations. Si je prends 20 exemples, je peux enseigner à ma secrétaire virtuelle les bons résultats pour chaque exemple.
Si je trace tous les exemples sur un graphique en deux dimensions, les résultats ressembleraient à ceci.

Linear regression

Le but ultime du machine learning est de découvrir l'équation mathématique qui représente le plus précisément la ligne de décision de limite, de sorte qu'il peut prédire correctement si je vais assister à un événement futur ou non sur de nouvelles données que je vais le nourrir.
Avec les données du dataset d'entraînement, nous pouvons voir que c'est un exemple classique declassification binaire, où la frontière qui sépare ma prise de décision est une simple ligne droite.

Linear regression

Régression non linéaire

Parfois, l'ensemble de données ne correspond pas nécessairement à une ligne droite ...
Que se passerait-il par exemple si le sujet de l'événement est intéressant mais très éloigné de chez moi, disons par exemple dans une autre ville?
Il est très probable qu'il existe une distance maximale que je suis prêt à parcourir pour assister à un événement donné, peu importe son intérêt.
Dans ce cas, nous aurions besoin d'adapter notre équation mathématique afin qu'elle puisse fournir des résultats plus précis et le résultat ressemblerait un peu à ceci.

non linear regression
Ceci est connu comme "régression non-linéaire" et c'est probablement une représentation plus correcte de la réalité. La régression non linéaire peut être appliquée à un nombre différent d'ensembles de données pour tracer avec précision la prédiction ou la «classification» d'une décision.

Régression multivariable

Dans notre exemple, nous avons seulement utilisé deux paramètres pour prédire un résultat, mais en réalité, il y a plusieurs critères qui pourraient influencer ma décision, tels que:

  • La météo
  • Le coût de l'événement
  • Ma santé
  • Mes disponibilités
  • etc

Toutes les entrées n'ont pas le même poids sur la sortie. Par exemple, un événement peut être très intéressant et proche de chez moi, mais si je suis très malade, il n'y a aucun moyen de sortir de mon lit.
Dans ce cas, l'entrée "santé" a un poids très élevé (impact) sur la sortie.

 

sick

Réseaux neuronaux multicouches

Parfois, il est simplement impossible de classer toutes les données avec une ligne et en 1989, le mathématicien George Cybenko, a postulé la Théorie de l'approximation universelle. La théorie a montré que les réseaux de neurones multicouches étaient des données de classification plus précis.
Les réseaux multicouches ont différentes couches "cachées" d'entrées qui sont utilisées comme étapes supplémentaires dans le calcul final de la sortie.
Il n'est pas nécessairement simple de comprendre ce que ces unités cachées signifient. Pluis les couches sont cachées dans un réseau de neurones, plus elles deviennent des concepts abstraits.

 

multilayer neural network

Dans l'apprentissage supervisé, le but ultime est de trouver la bonne équation mathématique qui sera en mesure de prédire ou de classer un résultat. Pour cela, le chercheur en machine learning aura besoin à la fois de définir l'architecture du réseau neuronal (nombre d'entrées, nombre de couches cachées, etc.), et aussi d'entraîner son modèle, pour lui apprendre le "bons paramètres" ou les poids pour chaque entrée. Pour cela, il implémentera quelque chose appelé "back propagation", un sujet que je couvrirai probablement dans un article différent.

Ok, alors que puis-je faire avec les reseaux de neurones?

Vous pouvez oublier la secrétaire virtuelle :)
Maintenant que nous avons couvert les bases des reseaux neuronaux, imaginez que les sources d'entrée pour un modèle peuvent être celles que vous voulez. Ça peut être des données financières, des chiffres du marché, des statistiques salariales ou tout ce que vous pourriez imaginer.
Les entrées peuvent également être des pixels d'une image et cela ouvre la porte à des applications très intéressantes comme la reconnaissance faciale, la conduite autonome et les diagnostics médicaux, juste pour en nommer quelques-uns.
Les applications des réseaux de neurones sont infinies et la seule limite est notre imagination.

artificial neural networks

En fin de compte, c'est juste un tas de calculs

Comme je l'ai mentionné auparavant, il n'y a rien d'intrinsèquement intelligent au sujet de l'intelligence artificielle. Les réseaux neuronaux ont été vaguement calqués sur notre compréhension actuelle du cerveau humain et de ses synapses, mais c'est un domaine où de nombreuses recherches sont actuellement en cours et il reste encore beaucoup à découvrir.
En fin de compte, c'est juste un tas de mathématiques qui ont lieu afin de prédire un résultat. C'est qui est génial, c'est que le cloud computing nous donne la possibilité de faire tous ces calculs pour un prix très bas

MLab, les spécialistes du Machine Learning à votre service!

Si le machine learning vous inspire et que vous pensez que vous souhaitez implémenter un cas d'utilisation dans votre organisation, veuillez contactez nousNous sommes agnostiques et nous recommandons et intégrons la technologie qui s'adapte le mieux à vos besoins. Si les technologies disponibles ne répondent pas à vos besoins, nous pouvons toujours former un modèle personnalisé adapté à votre projet.

Apprentissage automatique