代码之家  ›  专栏  ›  技术社区  ›  newang

使用NodeJS和Cheerio进行Web抓取

  •  0
  • newang  · 技术社区  · 8 年前

    https://hypebeast.com/footwear ),但我似乎只能得到一些未定义或非常混乱的错误。我做错了什么?以下是我的代码片段:

            const request = require('request');
            const cheerio = require('cheerio');
            
            var titles = [];
    
            request('https://hypebeast.com/footwear', function(err, resp, body) {
                var $ = cheerio.load(body);
                $('.title').each(function(){
                    var title = $(this).attr('span');
                    titles.push(title);
                });
    
                console.log(titles);
    
            });
    

    以下是错误: http://imgur.com/chB9v6h

    1 回复  |  直到 4 年前
        1
  •  0
  •   MadPapo    8 年前

    这不是一个啦啦队阅读问题。 因此,要找到一些东西,你必须使用这样的脚本:

    const request = require('request');
            const cheerio = require('cheerio');
    
            var titles = [];
    
            request('https://hypebeast.com/footwear', function(err, resp, body) {
                var $ = cheerio.load(body);
                $('.title').each(function(){
                    var title = $(this).children("h2").children('span').text();
                    titles.push(title);
                });
    
                console.log(titles);
    
            });