基于图像测试的CAPTCHA要求用户解决视觉模式识别问题或理解图片所表达的概念。由于显示图像需要较高的困难和较大的区域,导致服务器负担加重。此外,建立一个大的数据库也可能存在问题,比如与特定主题的网站不相符。
基于音频测试的CAPTCHA侧重于机器很难理解存在扭曲、退化和背景噪声的口语[61,容易受外界干扰,降低语音的识别度。
1.2基于马赛克图形的人机识别算法设计及分析
随着计算机视觉和模式识别的进步,这种基于文本的CAPTCHA已经没有原来那么有效,更容易受到特定的攻击。目前,计算机还不能完成很多与视觉相关的任务,而这些任务对于人类来说是容易的,可以利用这一点来设计一种方法来区别人类和机器人。
AlessandroBasso和StefanoSieeo提出了一种算法,被命名为”MosaHIP”是Mosaic—basedttumanInteractiveProof(基于马赛克的人机互动证明)17],它利用了现有的计算机在执行中的一些困难:1)在复杂背景下的,在感兴趣的区域中的图像分割:
2)在背景混乱情况下的特定概念的识别:
3)特定转化被应用到图像后的图形匹配。
”MosaHIP”是基于将图像进行拼凑、镶嵌,使用一个由许多小的,部分重叠的图像来组成大的图像的想法。这些小的图像来自两不同的类别:
1)描述真的,有意义概念的图像:
2)描述人工的或没有意义概念的图像。
只有很少的一部分图像是真的,属于第一类,它们需要被用户识别,它们伪随机的放置在拼凑的图像中.并且彼此是重叠的,这,对于计算机来说,识别它们不是容易的事情。剩下的假的图像是由真的图像的颜色直方图中的随机的颜色产生的图形、线等,它被用来产生混乱的背景,目的是为了使机器人识别真的图像困难。
图1显示的是基于概念的MosaHIP,要求用户识别被拼凑的图像中包括的真的图像。网2显示的是“最上层”的MosaHIP.要求户识别描述“一些存在”意义的和“放置在最上层”的,不被其他图像覆盖的图像。