![]() |
1
1
你要做的是一个小刮刀。您一定可以得到页面源,然后分析它。我建议使用正则表达式来查找所需的内容。当然,如果页面设计发生变化,则必须不断更新解析例程。 |
![]() |
2
0
HTTP支持请求头(如果在此后进行了修改),如果在过去的某个指定日期后请求头发生了更改,则仅下载该页。为什么你不用它来检索完整的状态页,如果它有新的信息? 另外,如果您每五秒钟进行一次轮询,则会出现问题。您可能应该设置推送通知系统,以避免持续浪费系统资源。 |
![]() |
3
0
每5秒一次。谁在乎。不需要5秒,这是肯定的。我甚至不确定CPU是否会从睡眠模式唤醒来处理这个过程。 它的处理将由网络流量控制,我使用“控制”这个词非常非常轻。 如果您在带有kermit的HP计算器上运行这个程序,您可能需要考虑其他一些潜在的优化。但是,对于真正的系统……只是一个问题。 如果是我,我会找“wget”和grep/sed来查找和清理数据。但我很懒。 |