Vivre, Reconnaissance de caractères avec Tesseract-OCR

OCR

Alors voilà, je vois propose un second TP sur la reconnaissance de caractères avec tesseract-ocr. Il fait écho à une situation rencontrée dans « la vraie vie ». Lors de notre dernier trek, le guide nous à lu un joli texte sur l’alpinisme issu d’un vieux magazine Petzl. Il nous a laissé prendre en photo sa photocopie du texte, qu’il traîne avec lui depuis dieu seul sait combien de temps. Autant vous dire que niveau qualité de la source on est pas au top.

Un peu comme la chronique de Raphaël Enthoven sur l’alpinisme je voulais partager ce texte avec vous. Bon, je pourrais me contenter de vous claquer la photo du texte ci dessous, mais je me suis dis que c’était l’occasion de ressortir tesseract-ocr pour un TP en conditions réelles.

Voici l’image source en question :

Autant vous dire que c’est pas gagné d’avance pour la reconnaissance de caractères avec tesseract-ocr.

Préparation

Alors deux trucs que j’ai fait à la main (dans paint.net) avant de commencer :

  1. Empiler les colonnes pour avoir un texte d’une seul colonne dans le bon ordre ; et
  2. appliquer un seuil en passant en noir et blanc (comme proposé à la fin
Lire la suite

Commenter plusieurs lignes avec vim

Vim

Salut à tous, aujourd’hui je vous donne une astuce pour commenter plusieurs ligne dans vim. En cherchant aujourd’hui, je me suis rendu compte qu’on tombe sur des trucs comme ça, utilisant le mode visuel avec 5 étapes, plusieurs changement de mode, et un retour visuel de l’interface pas du tout intuitif. Alors OK vim n’est pas un modèle d’ergonomie et même si il est un peu ésotérique : ça reste ultra puissant. Je me suis dit qu’on devait pouvoir faire mieux pour commenter plusieurs lignes avec vim.

Et effectivement 2-3 recherches plus loin, on trouve comment commenter les 23 lignes suivantes (par rapport au curseur), tapez (en mode normal) :

:.,+23 s/^/#/g

Pour supprimer les commentaires de ces même 23 lignes :

:.,+23 s/^#//g

Comment ca marche ? :range s[ubstitute]/pattern/string/cgiI

Comme j’aime bien expliquer ce qui se passe plutôt que de vous filer les commandes que vous ne comprenez pas. Voilà ce que vous êtes en train de lui dire :

range

:.,+23

Signifie : sélectionne les lignes depuis la ligne actuelle (« . ») jusqu’à 23 lignes après (« +23 »).  Mais on peut aussi lui demander de la ligne 42 à 66 :

:42,66

Ou … Lire la suite

Casser un p12 (ou pfx) avec JohnTheRipper

PenTest Physique et casser un p12

Aujourd’hui je vais vous montrer comment casser un p12 (ou pfx) avec JohnTheRipper ! Un p12 est un format de fichier type PKCS qui protège un certificat et la clé privé associée. Ce format est souvent utilisé par les PKI pour délivrer le certificat et la clé au détenteur final. Mais on le trouve parfois comme moyen de protection de certificats stockés en production.

Pour casser des mots de passes, un des outils de références dans le milieu c’est : JohnTheRipperOpen-source, et disponible directement sous forme de paquets dans la majorité des distributions linux, il existe aussi sous Windows. Une version pro existe aussi pour modique somme de 171,05€. Enfin, on trouve des variantes comme celle que je vais utiliser dans ce TP : la « community-enhanced » (ou Jumbo). Souvent utilisé en PenTest pour casser les hash de mots de passe de comptes, John permet en fait d’attaquer à peu près tout ce qui se fait comme protections des mots de passe… Et casser un p12, ça en fait partie !

Un petit tour sur la page Wikipédia du projet vous indiquera tout ce que vous avez besoin de savoir sur le projet. 

Jumbo : la

Lire la suite

Mises à jour automatiques de Debian grâce à cron-apt

Pansement

Vous savez tous qu’aujourd’hui une bonne pratique pour sécuriser son serveur, c’est de le garder à jour. Sauf que il n’y a pas de mises à jour automatiques de Debian par défaut, il faut passer régulièrement sur le serveur pour faire votre apt-get update; apt-get upgrade à la main. C’est très bien pour de la production car les serveurs ne changent pas de config que lorsqu’un admin est dessus. Mais beaucoup moins pour la sécurité, car moins vous mettez à jour votre serveur, plus celui-ci à plus de chances de rester dans sa dernière version « stable » : comme il tourne bien, on va plus dessus, mode « if it works, don’t fix it » et du coup plus de patch des failles de sécu ! Mais ce temps là est terminé grâce à cron-apt : un simple utilitaire pour faire des mises à jour automatiques de Debian et autres linux. On va voir comment ça fonctionne ci dessous.

Installation

Toujours très complexe, hein, vous commencez à avoir l’habitude :

apt-get install cron-apt

 Fonctionnement et politique des mises à jour automatiques de Debian

Cron-apt exécute les actions demandées dans /etc/cron-apt/action.d, et ce, dans l’ordre lexicographique (soit le fichier « … Lire la suite