![]() |
1
2
对于一般算法,我建议您检查阿尔伯塔大学人工智能游戏组所做的研究: http://games.cs.ualberta.ca 那里的许多算法保证找到最佳策略。不过,我怀疑你是否真的有兴趣找到最理想的游戏,除非你想在韩国销售,否则就要瞄准“足够好”的游戏。 从你的描述中,我已经了解到游戏是一个两人游戏,具有完全的可观察性,即没有隐藏的单位和这样的完全确定性,即玩家的行动结果不需要滚动,那么你应该看看由美国阿尔伯塔人提出的实时有界搜索极大极小导数。但是,能够进行绑定以及值函数备份的深度可能是向游戏添加“难度级别”的好方法。他们一直在做一些工作-有点可疑的IMO-抽样搜索空间,以提高价值函数估计。 关于你所描述的“战略”部分:在我提到的框架中,你必须将知识编码为一个评估函数。看看Michael B_¼Ro和其他人的作品——同样是在U Alberta集团——以获取此类知识工程的例子。 另一种可能是把这个问题当作一个强化学习问题,对手的行动被汇编成“后状态”。在Barto&Sutton的书中查找: http://webdocs.cs.ualberta.ca/~sutton/book/the-book.html 然而,由这种编译产生的RL问题的值函数可能证明有点难以优化地解决——状态的数量将像氢弹一样爆炸。但是,如果您看到如何使用分解表示,事情可能会容易得多。你的“策略”可能被编码成某种形状函数,这将大大加快学习过程。 编辑:该死的英语介词 |
![]() |
2
3
以前是这里一个游戏小组的成员。 那个分支因子是疯狂的。比去还糟。 基本上,你被套住了。 这个游戏的问题是,由于随机瓷砖的选择,它不具有确定性。这实际上在树中的每个现有节点层之间添加了另一层节点。你会对我的 publications on *-Minimax 学习随机域搜索技术。 为了在本世纪末之前完成单层搜索,您需要一些非常积极的正向修剪技术。尽早把最好的搬出窗户,集中精力建立良好的搬动秩序。 |
![]() |
SuphawichC · “自动提交消息”来自哪个VS代码扩展? 1 年前 |
|
Yashas Nadig · 调用堆栈lifo队列是否正确? 1 年前 |
![]() |
JoeBim · PHP中的中程API 1 年前 |