Что такое RECAPTCHA (Рекапча)


RECAPTCHA - это бесплатный сервис CAPTCHA (капча), помогающий оцифровывать книги.

Капча - программа или сервис, проверяющая, является ли ее пользователь человеком или компьютером. Вы, вероятно, видели их - красочные изображения с искаженным текстом внизу регистрационных форм на различных сайтах. Капчи используются многими вебсайтами, чтобы предотвратить атаки ботов, обычно используемых для рассылки спама. Очень немногие компьютерные программы могут понимать искаженный текст, тогда так люди могут делать это достаточно легко. Таким образом, сайты и интернет-сервисы затрудняют ботам их вредоносную деятельность.

Около 60 миллионов капчей распознаются людьми во всем мире каждый день. В каждом из этих случаев требуется примерно 10 секунд. По отдельности это занимает не так много времени, но в совокупности занимает более 150000 часов каждый день. Что было бы, если бы мы могли использовать эти человеческие усилия с пользой? RECAPTCHA использует эти усилия по разгадке капчей "чтения" книг.

Чтобы сохранить человеческие знания и сделать информацию более доступной для всех, многие проекты в настоящее время оцифровывают бумажные книги, которые появились до века компьютеров. Книжные страницы сканируются, и затем преобразуются в текст с помощью "Оптического Распознавания Символов" (OCR). Преобразование отсканированного изображения в текст необходимо потому, что при сканировании книг получаются изображения, которые сложно разместить на устройствах с малым объемом памяти, к тому же они не могут быть проиндексированы поисковыми системами. Еще одна проблема состоит в том, что OCR не идеально по своей сути и зачастую распознает отсканированные тексты с ошибками.

RECAPTCHA улучшает процесс оцифровки книг, отсылая слова, которые не могут быть распознаны компьютерами, в Сеть, в виде капчей для людей, чтобы те могли их расшифровать. Точнее, каждое слово, которое не может быть правильно распознанным OCR, помещается в изображение и используется как капча. Это не сложно, т.к. большинство программ OCR извещают пользователя, когда слово не может, по какой либо причине, быть распознанным верно.

Но если OCR не всегда может дешифровать капчу, как система узнает правильный ответ? А вот как: Каждое новое слово, которое не может быть правильно распознано OCR, отдается пользователю вместе с другим словом, которое системе уже известно. Пользователя просят ввести оба слова. Если человек угадывает то слово, которое уже известно системе, то предполагается, что ответ верный. Затем система RECAPTCHA отдает это изображение другим людям, чтобы определить, с более высокой точностью, был ли ответ верным.

В настоящее время, мы оцифровываем книги из Интернет-Архива и старых выпусков "Нью-Йорк Таймс".

Как мы можем помочь системе RECAPTCHA?

Чтобы достичь нашей цели в оцифровке книг, мы нуждаемся в Вашей помощи. Если у Вас есть ресурсы, которые страдают от проблем со спамом, Вы можете разместить систему RECAPTCHA на них. Для некоторых скриптов ведения сайтов (таких как Wordpress и Mediawiki), у нас есть готовые решения, которые помогут Вам использовать RECAPTCHA без необходимости написания отдельного кода. У нас также есть удобный в использовании код для часто используемых языков программирования, таких, например, как PHP.

Если Вы получаете почтовый спам, мы можем предоставить вам защиту, которая позволит уменьшить его количество. Многие спамеры сканируют ресурсы сети, чтобы найти адреса электронной почты. Когда новый адрес электронной почты найден на web-странице, он незамедлительно подвергается спам-атаке. MailHide позволяет Вам безопасно размещать адрес своей электронной почты в Сети. MailHide берет адрес, например, такой как johnsmith@example.com и превращает его в jsm...@example.com. Чтобы узнать настоящий адрес, пользователь должен нажать "..." и расшифровать капчу RECAPTCHA. Если Вы будете использовать MailHide для сокрытия своего адреса электронной почты, то спамеры будут не в состоянии найти Ваш реальный адрес электронной почты, и Вы будете получать меньше спама.

6 комментариев:

Анонимный комментирует...

Забыли упомянуть что все права на reCAPTCHA принадлежат Google, а значит результаты трудов миллионов человек тоже использует Google. За бесплатно.

Анонимный комментирует...

спасибо за статью

Анонимный комментирует...

Походу рекапча слетела(

Анонимный комментирует...

Большой брат следит за тобой.

Unknown комментирует...

Jr

Unknown комментирует...

jj