39
|
Alex Stoddard · 技术社区 · 15 年前 |
![]() |
1
34
有时,当数据位于以制表符分隔的文件中时,我会这样做:
让我们
见
Only read limited number of columns
对于纯R版本,使用
|
![]() |
2
18
一种可能是使用
见
编辑
:
|
![]() |
3
8
我认为德克的方法是直接和快速的。我使用的另一种方法是将数据加载到sqlite中,它的加载速度比read.table()快得多,然后只提取所需的数据。包sqldf()使这一切变得非常简单。 Here's a link 到上一个堆栈溢出答案,给出了sqldf()的代码示例。 |
![]() |
4
3
这可能比你需要的要多,但如果你正在操作 非常大 然后您还可以查看数据集 the HadoopStreaming package 它提供了一个地图减少程序使用 Hadoop . |