![]() |
1
11
我会尝试这样的递归算法:
例如,将其设置为“ContenceIsGood”将运行:
所以你可以选择3作为答案。 |
![]() |
2
7
尝试随机规则语法(相当于隐马尔可夫模型),规则如下:
概率可以从训练集中得到,但请参见下面的讨论。
最有可能的解析是使用维特比算法计算的,它在隐藏状态的数量上具有二次时间复杂性,在本例中是您的词汇表,因此您可能会遇到大型词汇表的速度问题。但是,如果你把所有的p_w=1,q_w=1 p=0.5设置为,这意味着,在一个人工语言模型中,这些都是概率,在这个模型中,所有的词都是同样可能的,所有的非词都是同样不可能的。当然,如果不使用这种简化方法,您可以更好地分段,但是算法的复杂性会降低很多。如果你在
wikipedia entry
对于这个特殊情况,您可以尝试简化它。到k位置的维特比分析概率可以简化为
|
![]() |
3
3
这是我最近为一个代码高尔夫开发的Mathematica代码。
样本输入
产量
高温高压 |
![]() |
4
0
检查拼写更正算法。下面是一篇关于谷歌算法的文章的链接- http://www.norvig.com/spell-correct.html . 在这里你会发现 a scientific paper on this topic from google . |
![]() |
5
0
在进行递归拆分和字典查找之后,为了提高短语中单词对的质量,您可能有兴趣使用单词对的相互信息。 这基本上是通过一个训练集,找出单词对的m.i.值,它告诉你阿尔伯特·辛普森比阿尔伯特·爱因斯坦的可能性要小。 你可以尝试直接在科学中搜索这个主题的学术论文。有关相互信息的基本信息,请参阅 http://en.wikipedia.org/wiki/Mutual_information 去年,我参与了一个搜索引擎项目的短语搜索部分,在这个项目中,我试图通过维基百科数据集进行解析,并对每一个词对进行排序。我有C++的代码,如果你能和它分享,如果你能找到它的使用。它解析wikimedia,并为每一个词对找出相互的信息。 |
![]() |
Okonjo Mitchel · CS50凯撒:分段故障问题 3 年前 |
![]() |
Baraa · 而我在java中得到无限的while循环 3 年前 |
![]() |
deficiencyOn · 用DP求解“背包” 7 年前 |
![]() |
Robbie · 使用嵌套的if-else语句理解Do-While循环 7 年前 |
![]() |
Andrei · 查找两个数组中的差异[重复] 7 年前 |
![]() |
Shkarik · 为什么我在Scala中的二进制搜索实现如此缓慢? 7 年前 |