代码之家 › 专栏 › 技术社区 › user1631306

在r中高效读取不同格式的文件

user1631306 · 技术社区 · 9 年前

我有以下格式的文件

*NEWRECORD
MH = Public Service Announcements as Topic
AQ = CL EC ES HI LJ SN ST TD UT
MN = L01.143.805
UI = D066308

*NEWRECORD
RECTYPE = D
MH = Public Service Announcements
MN = V02.736
MH_TH = NLM (2016)
ST = T170
DA = 20150701

基本上,我的文件中有上述内容。我的目标是获得MH和MN值。文件很大,主要采用上述格式。

1 回复 | 直到 9 年前

mr.joshuagordon 9 年前

这样的东西行吗?

d <- readLines('mydata.txt') # Read in data
out <- strsplit(d[grep(pattern = "MH|MN", x = d)], ' = ') #Look for those lines
do.call(rbind, out) # Bind it together

如果您想指明它来自哪个记录,则可能需要在将其绑定到一起之前添加一个id列。

推荐文章

Amp · 使用R ggplot2删除geom_radial中axis.line和panel.border之间的空格

4 月前

Hard_Course · 用另一列中的值替换行的最后一个非NA条目

4 月前

Mark R · 使用geom_sf()删除地球仪上不需要的网格线

4 月前

Joe · 根据对工作日和本周早些时候的日期的了解,找到一个日期

4 月前

Ben · 统计向量中的单词在字符串中出现的频率

4 月前

TheCodeNovice · R中符号格式的尾随零和其他问题[重复]

4 月前

katefull06 · 在R中使用terra修改范围时,会为单独的SpatRaster重写范围

4 月前

dez93_2000 · 在R管道子功能中引用管道对象的当前状态

5 月前

accibio · 在ggplot2中为同一变量创建两个连续的颜色渐变比例

5 月前

Mankka · 如何在Ggplot2中绘制均匀的径向图

5 月前