代码之家  ›  专栏  ›  技术社区  ›  Joh

哪种web语言可用于数据挖掘或web爬网

  •  1
  • Joh  · 技术社区  · 14 年前

    如果我想建立一个复杂的网站,比如googlenews,它从其他网站收集数据。 就像数据挖掘,爬行。我应该用哪种语言建立网站。

    2 回复  |  直到 14 年前
        1
  •  2
  •   Cerin    14 年前

    Python是完成这两项任务的优秀语言。我不能简单地说出所有可用的包,但首先想到的是网络爬网 Mechanize BeautifulSoup Orange NLTK 实现了几种数据挖掘算法。

        2
  •  0
  •   BG100    14 年前

    听起来你需要构建两个应用程序,一个是爬网并将数据存储在数据库中的应用程序,另一个是显示收集到的数据的网站。我会使用Perl来爬网,因为它有很好的字符串操作特性。