![]() |
1
15
我不是这方面的专家,但你的要求对我来说很难。 Soundex 专为英语发音和汉字设计。我认为它在非英语语言中不会表现得很好。例如,请参见对 this related question . Double-Metaphone 试图处理比Soundex或隐喻复杂得多的变体,旨在处理各种语言中的异常情况。这可能足以满足你的需要。链接页上有一个库实现列表。 支持中的其他语言 Lucene 是基于 Analyzers . Lucene附带了一组不同语言的分析器(尽管我找不到默认列表),但是质量可能是 quite variable . |
![]() |
2
0
维基百科上有一些很好的参考资料,从 Soundex 文章。我不知道是否有现有的库可以处理如此广泛的语言。 |