![]() |
1
6
步骤1很简单:在MySQL控制台中,只需“createdatabasedbname”。或者在命令行中,使用 mysql管理员 步骤2有点困难,因为必须指定表字段及其类型。这将取决于您的CSV(或其他分隔)文件的内容。一个简单的例子如下:
身份证件 高度 ,这里指定为浮点数(数字类型),共有3位数字,小数点后有2位数字( 100.27). 你明白这一点很重要 data types . 步骤3-有多种方法可以将数据导入表。最简单的方法之一是使用 实用程序。在上面的示例中,假设您的数据位于与表(mydata)同名的文件中,第一列是制表符,第二列是高度变量(没有标题行),这将起作用:
第4步-要求您知道如何运行MySQL查询。再举一个简单的例子:
表示“从高度大于50的表mydata中获取所有行(id+height)”。
然后-您可以转到RMySQL手册。在RMySQL中,设置数据库连接,然后使用SQL查询语法将表中的行作为数据帧返回。因此,获得SQL部分非常重要-RMySQL部分很简单。 网上有很多MySQL和SQL教程,包括“官方的” tutorial
|
![]() |
2
5
我有一个很好的建议。对于80MB,使用SQLite。SQLite是一个超级公共域、轻量级、超快速的基于文件的数据库,它的工作方式(几乎)和SQL数据库一样。 http://www.sqlite.org/index.html 您不必担心运行任何类型的服务器或权限,您的数据库句柄只是一个文件。
其他人提到了sqldf: http://code.google.com/p/sqldf/ http://code.google.com/p/sqldf/#9._How_do_I_examine_the_layout_that_SQLite_uses_for_a_table?_whi 所以您的SQL create语句如下
另外,我也有点惊讶,你的脚本占用了80mb。在R中,不可能在内存中打开所有文件的情况下,成片地查找文件? |
![]() |
3
2
sqldf包可能会为您提供一种更简单的方法来完成所需的工作: http://code.google.com/p/sqldf/ 编辑:以下是我认为它在这种情况下有用的原因(来自网站): 使用sqldf,用户无需执行以下操作,所有这些操作都将自动完成:
另请参见此处: Quickly reading very large tables as dataframes in R |
![]() |
4
1
MySQL本身的文档是非常可靠的,您可以在这里获得很多额外的(具体的)帮助。 我也在macosxsnowleopard上用MySQL工作台运行MySQL。所以这就是帮助我相对容易地完成任务的原因。
如果您能更准确地说明您遇到的问题,您会得到一些更具体的帮助,所以请尽管问;) 我想你得和我一起工作 time series data project (TSMySQL) 在这方面,我们使用R和关系数据库(例如MySQL,但也可用于其他DBMS)来存储时间序列数据。而且你甚至可以把R和 FAME (这在融资商中很受欢迎,但价格昂贵)。最后一段当然不是什么基本的,但我想它可能会帮助你考虑是否值得花时间深入一点。 |
![]() |
5
0
Practical Computing for Biologists 第15章。数据组织和数据库 |
![]() |
Hard_Course · 用另一列中的值替换行的最后一个非NA条目 4 月前 |
![]() |
Mark R · 使用geom_sf()删除地球仪上不需要的网格线 4 月前 |
![]() |
Joe · 根据对工作日和本周早些时候的日期的了解,找到一个日期 4 月前 |
![]() |
Ben · 统计向量中的单词在字符串中出现的频率 4 月前 |
![]() |
TheCodeNovice · R中符号格式的尾随零和其他问题[重复] 4 月前 |
![]() |
dez93_2000 · 在R管道子功能中引用管道对象的当前状态 4 月前 |
![]() |
Mankka · 如何在Ggplot2中绘制均匀的径向图 5 月前 |