![]() |
1
3
查找下载部分信息的好地方是 libwww-perl cookbook . 这是一些基本的示例代码。这不一定是最好的方法,但如果您有LWP模块(可从CPAN获得),它应该可以工作。
您可能需要添加更多的铃声和口哨声,以消除文本泄漏、处理错误条件、与多个线程并行执行请求、将用户代理冒充Mozilla等:)
如果您将其保存为titlegrab.pl,并且在sites.list中有一个站点列表(每行一个URL),那么可以将其与
或…重定向到某些输出文件,例如
|
![]() |
2
10
看一看
HTML::HeadParser
的一部分
HTML::Parser
分布。它将解析一个HTML头以便您提取
对于获取HTML内容,有大量可用的CPAN模块。其中一个模块是 LWP::Curl ,属于 libwww-perl 家庭。在此网站上搜索 many discussions of fetching HTML 学习更多。 要通过HTTPS下载,请查看下面的文档 libwww-perl . 当前在libwww-perl下使用ssl的“标准”方法是通过 Crypt::SSLeay . |
![]() |
Manny · 如何比较Perl中的字符串? 3 年前 |
![]() |
BioRod · 我不能用Perl打印键和值 3 年前 |
![]() |
user17227456 · Perl CLI代码无法追加字符串行 3 年前 |
![]() |
LearnToBeBetter · 读取文件,搜索字符串,打印字符串 3 年前 |
![]() |
KJ7LNW · 一些波斯语文本的宽字符印刷,但其他文本则没有 3 年前 |
![]() |
con · 如何搜索大型数据结构并返回一系列给出特定值的键/数组? 3 年前 |
![]() |
Pranay Nanda · 使用regex解析许可证文件 7 年前 |