代码之家  ›  专栏  ›  技术社区  ›  vagabond

什么是文本挖掘中的getText函数?它来自哪里?〔r〕

  •  4
  • vagabond  · 技术社区  · 10 年前

    我遵循的是Nathan Dannerman&理查德·海曼: The Book 。在使用 searchTwitter 函数,作者使用 sapply list 要像这样提取文本部分:

    rstats <- searchTwitter("#rstats", n = 1000)

    rstats_list <- sapply(rstats, function (x) x$getText())

    这巧妙地生成了一个仅包含推文文本部分的字符向量。什么是getText()?我在任何地方都找不到任何东西——作者没有充分解释。我看着 tm 包文档-没有!我在SO上查找与此相关的问题- Getting Text From Tweets 回答者提出了与我相同的问题。在Inside-R上,我发现: http://www.inside-r.org/r-doc/base/gettext 但它与 getText 。有人能解释我缺少什么吗?

    3 回复  |  直到 8 年前
        1
  •  6
  •   Nathan D    10 年前

    getText是“status”类的访问器方法,如下所述: http://www.inside-r.org/howto/mining-twitter-airline-consumer-sentiment .

    很抱歉没有在文本中澄清, 内森·丹尼曼

        2
  •  0
  •   Pruthvi Ustepalle    8 年前

    一旦你创建了列表“rstats”,如果你在环境(在RStudio中)中的值下检查它,它会显示每条推文以及每条推文的所有相关信息,并在每条推文下面显示一些访问方法。你可以在那里检查getText(),只获取每条推文中的文本内容。

        3
  •  -2
  •   Jaydip Jadhav    8 年前

    getText() 用于提取推文文本内容的函数

    到期日:

    rstats <- searchTwitter("#rstats", n = 1000)
    
    rstats[[1]]$$getText()
    

    使用 啁啾 用于处理tweets数据的库。

    有些人使用完整的功能来处理推文:

    getScreenName(), getId(), getCreated()