代码之家  ›  专栏  ›  技术社区  ›  Zachary Yates

是否有一个API或算法匹配文本块中的字符串并解释可能的拼写错误?

  •  0
  • Zachary Yates  · 技术社区  · 14 年前

    我正在寻找一种解决方案,它可以处理大量的用户输入文本,并将其与存储在数据库中的一组字符串相匹配。唯一的问题是用户输入文本中的字符串经常拼写错误。(数据库中的字符串拼写正确)

    我知道现代的搜索引擎会给出解释拼写错误的结果,但我不知道这些算法叫什么,或者它们是否适用于我的情况。

    首先,我需要知道这些算法的名称(或者它们通常被称为什么)。其次,我需要知道如何应用它们。有什么想法吗?

    1 回复  |  直到 14 年前
        1
  •  3
  •   kagali-san    14 年前

    使用libaspell查找拼写错误的单词,然后通过一些集群(k-means?)纠正它的建议。ALGO,或与 http://en.wikipedia.org/wiki/Levenshtein_distance (弦乐)如果要搜索零件目录或科学图书数据库,代码还应处理不完整的非字典单词。