reCAPTCHA czyli przydatna Captcha

reCAPTCHA czyli przydatna Captcha

Captcha to mechanizm bardzo popularny i bardzo prosty. Zgodnie z definicją Wikipedii to (Completely Automated Public Turing test to te Computers and Humans Apart). Czyli test Turinga na rozpoznanie czlowieka. Polega on na tym, że generowany jest obrazek z tekstem, który ma być niemożliwy do odczytania przez boty, które mają mechanizmy OCR (rozpoznawania tekstu). Niestety coraz częściej obrazki Captcha nie dają się odczytać nawet przez ludzi 🙂 Zamiast blokować boty, blokują ludzi. Niestety prawda jest taka, że jest to jedyna metoda na wszelkiego rodzaju upierdliwe automaty dopisujące komentarze, czy wypełniające formularze jakie tylko mogą się trafić.

Aktualizacja 2018:

reCAPTCHa została przejęta przez Google i teraz wszystko dzieje się na stronie www.google.com/recaptcha/intro/ . Dosyć ciekawy artykuł na temat innych metod Captcha można znaleźć [tutaj](<https://www.whoishostingthis.com/resources/captcha)

Co ciekawe, jakiś czas temu znalazłem informacje o tym, że spamerzy zatrudniają Hindusów, których praca polega na przepisywaniu tekstów z rozpoznanych obrazków. Swoją drogą na każdą metodę zawsze znajdzie się jakas antymetoda 🙂 W każdym razie bardzo cieszy mnie fakt, że ktoś wpadł na pomysł jak wykorzystać Captcha do czegoś pożytecznego. Powstał projekt reCAPTCHa który polega na możliwości osadzenia mechanizmu na własnej stronie (lub BLOGu) a jednocześnie dany obrazek jest wykorzystywany do… digitalizacji starych książek i gazet. Tam gdzie nie daje rady OCR to człowiek powinien sobie poradzić. Zamiast przepisywać bezmyślne literki i cyferki, możemy się przydać do tłumaczenia i rozpoznawania tego z czym nie daje sobie rady OCR. Mechanizm jest prosty, komputer podrzuca nam dwa słowa – jedno które już zna, a drugie z którym ma problem. To znane potwierdza nam, że jesteśmy człowiekiem a to drugie trafia na listę prawdopodonych rozpoznań. Drugie słowo wędruje jeszcze do n-użytkowników i tym samym generuje się lista potencjalnie odgadniętych literek. Jeżeli okazuje się, że nieznane słowo zostało rozpoznane przez n-osób tak samo, to wiemy że to musi być ono. reCaptcha jest prosta w obsłudze i może też pomóc chronić nam nasze e-maile, jeżeli ktoś chce się pobawić to wystarczy zerknąć na ten przykład:
slaw @jasinski.us