Une nouvelle vie pour un outil qui fête ses huit ans...
Captcha, ce sont ces petites lettres que vous retrouvez au moment de vous inscrire sur un site, ou de publier un commentaire, et qui assurent que vous êtes humain et non un bête robot. Les lettres sont déformées de sorte qu'il faut (parfois avec de l'imagination) réfléchir pour les reproduire dans la case prévue à cet usage.
L'antispam au secours des livres
Conçu voilà huit ans pour empêcher les ravages du spam dans les boîtes à courriel, Captcha est actuellement en cours d'évolution et servira prochainement à transcrire les journaux et manuscrits aux lettres passablement... déformées. Sa sécurité n'est pas de 100 %, et l'on rapporte çà et là des systèmes de robots qui en sont venus à bout, mais dans l'ensemble, ça freine bien.
Captcha, ce sont ces petites lettres que vous retrouvez au moment de vous inscrire sur un site, ou de publier un commentaire, et qui assurent que vous êtes humain et non un bête robot. Les lettres sont déformées de sorte qu'il faut (parfois avec de l'imagination) réfléchir pour les reproduire dans la case prévue à cet usage.
L'antispam au secours des livres
Conçu voilà huit ans pour empêcher les ravages du spam dans les boîtes à courriel, Captcha est actuellement en cours d'évolution et servira prochainement à transcrire les journaux et manuscrits aux lettres passablement... déformées. Sa sécurité n'est pas de 100 %, et l'on rapporte çà et là des systèmes de robots qui en sont venus à bout, mais dans l'ensemble, ça freine bien.
Le système, pensé par Luis von Ahn, à l'origine du modèle Captcha, et qui supervise la numérisation de livres dans 70 universités, a ainsi proposé d'ouvrir son système à qui veut s'inscrire et permettra alors d'aider à la numérisation. En effet, les personnes vont scruter le mot affiché, proposer leur version et par recoupement, Captcha relaiera à un ordinateur le mot mystère. Cela aiderait alors à la numérisation de 160 livres par jour.
reCAPTCHA, version reloaded !
Le nouveau système, modestement baptisé reCAPTCHA servira pour des livres publiés avant 1900 et serait doté d'une efficacité de 80 % de réussite. En passant par une phase de reconnaissance optique de caractère (OCR), on s'appuiera ensuite sur la base de données de référence pour décoder le mot qui pose problème.
« Environ 60 millions de Captcha sont utilisés à travers le monde chaque jour - chacun prenant environ 10 secondes. Par personne, cela ne représente pas grand-chose, mais bout à bout, ces puzzles impliquent 150.00 heures de travail », explique von Ahn.
Encore à perfectionner
Si la numérisation et la reconnaissance tendant de toute manière à être perfectionnées, elles semblent tout de même plus attentives que les opérations de numérisation de masse. Du côté de Google, quand on ne numérise pas à la main, on se sert d'un logiciel de détection maison, ainsi que sur la reconnaissance humaine. Mais on refuse de dire si reCaptcha pourrait devenir un partenaire...
source >>>>> ici
Aucun commentaire:
Enregistrer un commentaire