代码之家  ›  专栏  ›  技术社区  ›  pOleander

htmlagilitypack将整个html源代码保存为字符串

  •  0
  • pOleander  · 技术社区  · 7 年前

    所以本质上这就是我要做的,我想把整个html源文本保存成一个字符串,在那里我会检查它是否包含myvar。 我看到很多其他的主题都在说如何做到这一点,但是我试过了,结果出现了错误,我要么在使用.load(“example.com”)时进入了中断状态,要么字符串最终将包含url而不是实际的html代码。

    这是我的代码:

            string myString = "Pastebin";
    
    
            HtmlAgilityPack.HtmlDocument page = new HtmlAgilityPack.HtmlDocument();
            page.Load("https://pastebin.com");
            string text = page.DocumentNode.OuterHtml;
    
    
            if (text.Contains(myString))
            {
                 MessageBox.Show("Yay!\n Match!");
                Instance = this;
                InitializeComponent();
                timer1.Start();
            }
            else
            {
                MessageBox.Show("Error...\nThe Var Doesnt match");
                Application.Exit();
            }
        }
    

    结果:

    使用.load(“example.com”);应用程序进入中断状态。 使用.loadHTML(“example.com”);应用程序存储的是URL而不是HTML

    1 回复  |  直到 7 年前
        1
  •  0
  •   Andrey Kotov    7 年前

    这是 documentation . 使用 HtmlWeb 要按URL加载HTML页面,请执行以下操作:

    using HtmlAgilityPack;
    //...
    
        HtmlWeb htmlWeb = new HtmlWeb();
        HtmlDocument htmlDoc = htmlWeb.Load("https://pastebin.com");
        string text = htmlDoc.Text;