我对上面使用的验证码系统很着迷,所以…我想知道更多关于
many factors
“这使recaptcha起作用。开发人员,可以理解的是,考虑到滥用的可能性,保持相当安静的系统的确切内部工作…但这种行为是有据可查的,所以也许我的好奇心还能得到满足:
如果我要设计一个recaptcha的克隆,我该怎么做呢?
Recaptcha允许:
-
打字错误
-
在人们这样做的地方。
这建议我,您需要有关于错误的历史数据,然后在此基础上生成一个算法。
检测打字错误需要广泛使用数据库:一个用于数字化书籍中的单词,另一个用于已知单词。
技术已知细节
-
两个数据库:一个用于已知词,另一个用于未知词
-
单词组合的后续数据库
未知的技术详细信息
-
如何在飞行中分离单词,以便您看到来自不同数据库的单词组合?
这是关于信号处理的。
-
如何为用户提供来自两个数据库的数据?
-
在两个独立的数据库中,数据的初始形式是什么?PDF?
-
当来自两个数据库的数据合并时,后续的数据形式是什么?PDF?
-
如何将数据从两个PDF文件合并为一个?
-
如何有效地旋转图像?
-
使用哪些算法将图像从书中分离出来?
相关主题
-
信号处理
-
微积分
:傅立叶和拉普拉斯等系列,用于字检测算法。
-
概率论
:具有一个“计算机人”系数,该系数仅在具有95个置信区间的情况下通过。
-
也许
数论
:我们需要有效地存储和比较数据