Principe de fonctionnement des GANs
Introduits en 2014 par Ian.J.Goodfellow, les Generative Adversarial Networks, (ou Réseaux Antagonistes Génératifs en français), sont une catégorie d’algorithmes d’apprentissage non-supervisés.
Pour faire simple, le but premier de ces algorithmes est de permettre la génération d’images plus belles que celles que je saurais faire sur Paint, ou même Photoshop, et ce à partir de requêtes textuelles simples. Le processus s’effectue grâce à un réseau neuronal basé sur un ensemble de données vectorielles et d’un bruit aléatoire, appelé « graine ».
Dans un contexte GAN, deux réseaux génératifs entrent en compétition basée sur le principe de théorie des jeux (IA vs IA, en opposition au test de Turing qui confronte une IA à un être humain). Un réseau est générateur, l’autre discriminateur. Le premier génère un échantillon, par exemple une image, tandis que l’autre tente de déterminer si cet echantillon est suffisamment bien généré pour être considéré comme réel.
Pourquoi c’est génial pour le grand public ?
Parce que plus les processeurs graphiques seront évolués, plus cette génération d’image sera simple. Il en va de même avec le vocal.
Si comme moi vous ne savez pas dessiner, pensez au petit prince, et dites vous que votre smartphone/PC vous dessinera véritablement un mouton lorsque vous lui demanderez.
Pensez ensuite imprimante 3D et imaginez les opportunités.
Pourquoi c’est génial pour la recherche ?
Parce qu’en recherche pharmaceutique, la base minérale de toute molécule contient une infinité de substances, et que seule une infime part d’entre elles sont exploitées. Le problème étant que l’être humain n’a ni le temps, ni les capacités cérébrales de tester toutes les combinaisons possibles.
Grâce aux GANs, des scientifiques ont pu appliquer un réseau neuronal génératif afin de générer des médicaments pharmaceutiques jusqu’alors inédits avec les caractéristiques désirées. Ils ont alors été en mesure d’inventer des structures moléculaires neuves, réduisant ainsi de manière exponentielle les couts de recherche.
Pourquoi c’est génial (et un peu flippant) pour le marketing ?
Si vous savez ce que signifie l’acronyme SEO, vous avez forcement déjà entendu la phrase « Google ne lit pas les images ».
C’est pour l’instant vrai, même si des logiciels de reconnaissance optique des caractères (OCR) permettent d’ores et déjà d’extraire du texte à partir d’images ou de fichiers PDF.
Considérons à présent l’ensemble des données personnelles que nous envoyons chaque jours et qui permettent un ciblage publicitaire avancé.
Nous avons vu que dans un contexte GAN, il existe un générateur, qui crée la séquence, et un discriminateur qui la déchiffre. Ce discriminateur serait alors tout aussi capable de déchiffrer une photo de vous pour en tirer des conclusions d’une précision incroyable sur vos habitudes de consommation. Une fois ces informations retournées au générateur, une publicité sur mesure pourra être crée en un claquement de doigts. Cela engendrera une bulle de rétroaction constance qui s’adaptera en fonction de chacune de vos interactions en réduisant considérablement les publicités non pertinentes.
Sources
Generative Adversarial Networks, un nouveau paradigme pour l’entraînement d’ANN