| Разработчики: | |
| Дата последнего релиза: | октябрь 2018 г |
| Отрасли: | Интернет-сервисы |
Содержание |
CAPTCHA — с англ. Completely Automated Public Turing test to tell Computers and Humans Apart — полностью автоматизированный публичный тест Тьюринга для различения компьютеров и людей. Основная идея заключается в том, чтобы предложить пользователю такую задачу, которая с легкостью решается человеком, но крайне сложна и трудоемка для компьютера. «Капча» разработана в Университете Карнеги-Меллон и впоследствии получила продолжение в проекте под названием reCAPTCHA. В 2009 году система reCAPTCHA была приобретена компанией Google.
2018
Создан самый быстрый и точный алгоритм для взлома CAPTCHA
В конце декабря 2018 года стало известно о разработке самого быстрого и точного алгоритма машинного обучения, который может взламывать текстовые системы CAPTCHA.
Этот новый алгоритм, разработанный учеными из Университета Ланкастера (Великобритания), Северо-Западного университета (Китай) и Пекинского университета (Китай), основан на концепции GAN. Это особый класс ИИ-алгоритмов, которые используются в случаях недоступности большого объема информации. Классифицирующим алгоритмам машинного обучения обычно требуются огромные базы данных для обучения, но GAN использует так называемый «генеративный» подход для создания сходной информации на основе доступной. Эти «сгенерированные» данные затем анализируются общим алгоритмом.
Ученые применили эту концепцию для взлома текстовых CAPTCHA, которые в подавляющем большинстве предыдущих исследований оценивались только с точки зрения классических алгоритмов машинного обучения. Исследователи утверждают, что в реальном сценарии злоумышленник не сможет сгенерировать миллионы CAPTCHA на реальном веб-сайте или API без обнаружения. Поэтому для своего исследования они использовали только 500 текстовых CAPTCHA из каждого текстового сервиса.
Полученный алгоритм смог быстро и точно распознавать текст, причем такой подход оказался более эффективным и дешевым, чем любые другие доступные системы. По утверждениям исследователей алгоритм способен взломать любой текст CAPTCHA в течение 0,05 секунды при использовании обычного ПК. Это означает, что злоумышленникам не нужно будет покупать дорогие серверы облачных вычислений и платить за них, чтобы взламывать текстовые CAPTCHA в реальном времени на веб-сайтах.Как построить цифровой фундамент для мебельного ритейла будущего
Исследователи рекомендуют владельцам веб-сайтов внедрять альтернативные меры по обнаружению ботов, использующие несколько уровней безопасности, такие как сравнение шаблонов использования, местоположение устройства или биометрические данные.[1]
Выход reCAPTCHA v3
В конце октября 2018 года Google представила новую версию системы защиты сайтов от роботов reCAPTCHA. Технология интересна тем, что не требует от пользователя специальных действий, вроде набора текста или выбора картинок, подтверждающих, что он человек, а не робот.
| | В течение последних десяти лет reCAPTCHA постоянно улучшала свою технологию. Если вкратце, reCAPTCHA помогает защитить ваши сайты без неудобств для пользователей и даёт вам больше возможностей решить, что делать в ситуациях риска, — отметил менеджер по управлению продуктами Google Вэй Лю (Wei Liu). | |
reCAPTCHA анализирует действия посетителей сайта, в том числе движения мыши и взаимодействия со страницами, и отличает роботов от реальных людей.
Администратор сайта может установить пороговый уровень, при котором система будет требовать от пользователя пройти дополнительную проверку. Для этого они добавляют страницам или их разделам метки action. Одним из вариантов таких действий может быть требование пройти телефонную верификацию, в ответ на попытку оставить комментарий, получить доступ к профилю пользователя или к истории транзакций.
reCAPTCHA v3 также принимает во внимание сигналы по нескольким страницам, а не по одной, как это было в первой и второй версиях технологии. reCAPTCHA v3 уже доступна для установки на сайты.[2]
2017: Рекурсивной нейросети удалось взломать капчу
Ученые из американской компании Vicarious создали алгоритм, расшифровывающий капчу — самый распространенный способ отличить человека от робота. Такой алгоритм работает на основе компьютерного зрения и рекурсивной кортикальной нейросети и, по утверждению разработчиков, может расшифровать капчу на многих популярных интернет-платформах, включая PayPal и Yahoo. Работа опубликована в журнале Science.[3]
CAPTCHA
Капча (CAPTCHA, расшифровывается как Completely Automated Public Turing test to tell Computers and Humans Apart — полностью автоматизированный публичный тест Тьюринга, позволяющий отличить человека от робота) используется для того, чтобы выяснить, кто пытается воспользоваться каким-либо сервисом: человек или какая-нибудь программа для автоматизации действий в интернете. В основе капчи обычно лежит задание, например, различить «плавающие» буквы, выделить слово на фоне или отметить фотографии, которые содержат определенный объект. Для его решения человеку достаточно имеющихся у него знаний об окружающем мире и базовых навыков (например, чтения). Компьютеру, однако, для выполнения подобного теста требуется огромное количество данных. Он может распознать любые стандартные символы, но, например, «плывущие» буквы, которые встречаются ему впервые — с трудом. С другой стороны, для человека подобная задача не представляет большой проблемы; искусственный интеллект, соответственно, должен быть максимально развит (по сравнению с настоящим, человеческим интеллектом) для ее решения.
Рекурсивная нейросеть
Ученым из Vicarious удалось разработать нейросеть для расшифровки капчи, получившую название «рекурсивная кортикальная нейросеть» (англ. recursive cortical network, сокращенно RCN). Для ее создания использовались знания об обработке визуальной информации человеком, а именно — об эффективном разделении объекта и фона, даже в том случае, когда они имеют очень похожую структуру. Созданная нейросеть способна выделять на общем фоне контур объекта (например, буквы) даже в том случае, если часть объекта скрыта за другим.
Для обучение нейросети было задействовано всего около 26 тыс. изображений. Для сравнения, алгоритму распознавания капч на основе сверточной нейросети (англ. convolutional neural network, CNN) их требуется несколько миллионов.
Для проверки работы нейросети использовались данные из открытого генератора капч Google — reCAPTCHA, особенность которых, по словам разработчиков, состоит в их сравнительной легкости распознавания для людей и сложности для компьютеров. Кроме того, для проверки были использованы капчи Yahoo, PayPal и Botdetect.
Итоги тестирования нейросети
Капча считается решенной, если компьютеру удалось распознать ее в одном проценте случаев. Нейросеть, созданная Vicarious, смогла расшифровать примеры из reCAPTCHA с точностью до 66,6%. Для сравнения, человек может распознать те же самые комбинации с точностью 87%.
Примеры использованных для тренировки капч и эффективность работы нейросети на уровне слов (третий столбец) и букв (четвертый столбец)
Алгоритм также показал лучшую (по сравнению с другими алгоритмами, работа которых основана на сверточных нейросетях) эффективность в распознавании отдельных символов: до 94,3%. Для сравнения, эффективность работы сверточной нейросети существенно падает с увеличением визуальных различий между обучающей и тренировочной выборками.
Эффективность распознавания отдельных символов рекурсивной нейросетью, или RCN, и сверточной нейросетью, или CNN. По оси y — доля различия данных из обучающей и тренировочной выборок
В целом эффективная работа представленного алгоритма поднимает вопрос о необходимости улучшения существующих решений по кибербезопасности и разработки средств для защиты данных пользователей от искусственного интеллекта.



