Jouer avec vos réseaux de neurones !

Un neurone

Coucou les gens ! vous aviez aimé mes TPs sur les réseaux de neurones autour de tesseract-ocr ou encore la vidéo de Science étonnante sur le deep-learning ? Si je résume je vous avait montré ce qu’on peut faire à l’aide de ce type de programme et la vidéo expliquait un peu plus comment ça fonctionne. En gros il vous restait plus qu’a pratiquer le sujet. Mais bon, comme coder soit même un neural network c’est un peu long sans un peu beaucoup de motivation (i.e plus que « parce que je peux le faire »), y’a deux gars de Google qui proposent une application web tutoriel pour mieux comprendre comment ça fonctionne.

Network Playground ou les réseaux de neurones pour les nuls

Le site web Neural Network Playground permet de se rendre compte en interactif de comment se comportent les réseaux de neurones. L’application en question essaye d’extrapoler des zones bleu ou orange dans une image à partir de points de couleurs dans celle ci. C’est le principe de dessiner en reliant les points, puis colorier l’intérieur des zones ainsi définies (en simplifiant beaucoup). Mais comme un bon dessin vaut mieux qu’un long discours :

Le jeu de données … Lire la suite

Les réseaux de neurones

Un neurone

Salut les gens!

Vous vous souvenez dans mon article sur TESSERACT-OCR sur la reconnaissance de caractères optique ? Il y a un moment dans l’article ou j’ai esquivé l’explication sur : « comment ça fonctionne un neural network ? ». Et bien : c’est toujours pas pour aujourd’hui…

Par contre je suis tombé sur une vidéo de la chaîne YouTube Science étonnante qui, je trouve, explique ça très bien (à ma place donc). La vidéo est titrée « Deep Learning », mais en fait il y passe les trois quart à décrire le fonctionnement des réseaux de neurones.

Je vous laisse vous faire un avis par vous même du coup, c’est par ici :

@++… Lire la suite

Reconnaissance de caractères avec TESSERACT-OCR

OCR

Marre des Captchas à noix ? aucun problème aujourd’hui on va résoudre ça grâce à la reconnaissance de caractères. Ça va se traduire sous forme d’une un gros TP pour debian (8.2 Jessie) où on va s’intéresser particulièrement au logiciel TESSERACT-OCR (OCR pour Optical Character Recognition).

Note : Tesseract-OCR n’a absolument rien à voir avec le tesseract des Avengers ou du film Cube, comme ça s’est dit…

Pour la petite histoire, il s’agit d’un logiciel initialement développé par HP (entre 1985 et 1995) puis abandonné. En 2005 le code source est finalement libéré sous licence Apache, et maintenu depuis par des équipe de Google. Tesseract-OCR est LA référence dans les moteurs de reconnaissance de caractères, il reconnait 60 langues au moment de la rédaction de cet article, à le bon gout d’être opensource et est déjà packagé sous la plupart des grosse distribution Linux : ce qui fait qu’il est utilisable quasiment clé en main sans trop se poser de question.

Sans transition, le github du projet : https://github.com/tesseract-ocr
(et l’ancien site sur Google Code      : https://code.google.com/p/tesseract-ocr/)

Installation de TESSERACT-OCR

Pour les barbus, compilation depuis les sources

Avant de pouvoir installer Tesseract, il faut déployer un autre soft en prérequis.

Leptonica

Leptonica est … Lire la suite