代码之家  ›  专栏  ›  技术社区  ›  Peter

我如何设计一个类似于recaptcha的系统?

  •  1
  • Peter  · 技术社区  · 6 年前

    我对上面使用的验证码系统很着迷,所以…我想知道更多关于 many factors “这使recaptcha起作用。开发人员,可以理解的是,考虑到滥用的可能性,保持相当安静的系统的确切内部工作…但这种行为是有据可查的,所以也许我的好奇心还能得到满足:

    如果我要设计一个recaptcha的克隆,我该怎么做呢?


    Recaptcha允许:

    1. 打字错误
    2. 在人们这样做的地方。 这建议我,您需要有关于错误的历史数据,然后在此基础上生成一个算法。

    检测打字错误需要广泛使用数据库:一个用于数字化书籍中的单词,另一个用于已知单词。

    技术已知细节

    1. 两个数据库:一个用于已知词,另一个用于未知词
    2. 单词组合的后续数据库

    未知的技术详细信息

    1. 如何在飞行中分离单词,以便您看到来自不同数据库的单词组合? 这是关于信号处理的。
    2. 如何为用户提供来自两个数据库的数据?
    3. 在两个独立的数据库中,数据的初始形式是什么?PDF?
    4. 当来自两个数据库的数据合并时,后续的数据形式是什么?PDF?
    5. 如何将数据从两个PDF文件合并为一个?
    6. 如何有效地旋转图像?
    7. 使用哪些算法将图像从书中分离出来?

    相关主题

    1. 信号处理
    2. 微积分 :傅立叶和拉普拉斯等系列,用于字检测算法。
    3. 概率论 :具有一个“计算机人”系数,该系数仅在具有95个置信区间的情况下通过。
    4. 也许 数论 :我们需要有效地存储和比较数据
    1 回复  |  直到 16 年前
        1
  •  3
  •   Ólafur Waage    16 年前