|
|
1
5
答案很简单:打开通过ssh认证的MPI,然后打开节点之间的TCP/IP套接字。计算节点上的防火墙设置为只接受彼此的ssh连接,而不是任意连接。所以,在更新了iptables之后,hello world像冠军一样在所有节点上运行。 编辑: 应该指出的是,文件服务器的防火墙允许任意连接,所以MPI程序在其上运行的行为与在计算节点上运行的行为不同。 |
|
|
2
2
我的第一个建议是简化:
如果是这样,那么
应该穿过。一旦你把这些基础知识整理好,就可以尝试一下Boost教程…并确保在计划运行的所有主机上都有Boost和MPI库。 |
|
|
3
2
考虑使用参数 --mca btl_tcp_如果_包括eth0 要使节点只使用eth0接口并阻止openmpi来确定哪个是最好的网络。也有 --mca btl_tcp_如果排除eth0 记住字幕 种族歧视 对于您的特定界面。 我的/etc/主机包含如下行: 10.1.2.13节点13 … 10.1.3.13节点13 Ib 当我启动mpirun时,选择了tcp网络,节点使用tcp网络,但是经过一段时间(20秒),openmpi发现了ips 10.1.3.xxx并尝试使用它们,导致了错误消息。 希望有帮助 |