![]() |
1
1
你问的是如何建模,而不是如何有效地解决这个问题: 它可以很容易地建模为一个部分可观测的马尔可夫决策过程( wiki link ). 这对侦探和罪犯都有用。pomdp是一个非常通用的模型。 |
![]() |
2
1
我喜欢这个游戏,我想对于侦探们来说,你应该模拟罪犯在每个地点的概率。每隔一段时间你就知道罪犯的确切位置,然后你就可以考虑他所做的以下动作来确定他可能在哪些地点。 一旦你有了这个,我不太确定如何优化侦探的行动。你可以移动侦探,以减少一套可能性,有效地腐蚀罪犯。但我相信,围绕门票还有一些更高层次的策略需要,而不是耗尽门票。 |
![]() |
3
0
我认为某种蒙特卡罗实现是一个很好的选择,比如说,模拟成千上万的组合,然后选择一个在大多数情况下都以最佳结果结束的组合。由于罪犯必须在5个回合内可见,分支因子应该保持在良好的控制之下,尽管MC在高分支因子的游戏中也被证明是一种非常好的技术,即Go。 |
![]() |
4
0
为了让侦探之间的团队合作,你需要把他们塑造成一个团队而不是个人。Minimax仍然是一个很好的方法,但是(遗憾的)你的分支因子将会飙升。 你不用一步一步地检查所有的侦探,让他们做出似乎对每一个都是最好的,而不是对你的侦探团队,你要找出他们可能做出的每一个动作排列。如果团队合作在这个游戏中有帮助的话,那么极大极小值将有利于侦探们一起工作的排列。 我不确定它是否实用,24层5个侦探可能太多的工作,但它会很有趣的尝试,这就是重点,对吗? |
![]() |
John V · 是否存在单元测试无法发现的逻辑/流错误类型? 7 年前 |
![]() |
Beefster · 为什么ANSI颜色转义以“m”而不是“]”结尾? 7 年前 |
![]() |
Guillermo Gutiérrez · STR转换是如何工作的? 7 年前 |
![]() |
RudziankoÅ · 合并排序数组算法 7 年前 |
|
user8852560 · 构造函数中的验证和构造函数冲突 7 年前 |
![]() |
jav974 · 订购产品时寻找最佳价格组合的算法 7 年前 |
![]() |
hippietrail · 确定浮点数中前导零的数量 7 年前 |