代码之家 › 专栏 › 技术社区 › Sergey Kovalev

使用bash脚本将文本文件一分为二

split awk sed text bash

Sergey Kovalev · 技术社区 · 14 年前

我有一个文本文件,中间有一个标记:

one
two
three
blah-blah *MARKER* blah-blah
four
five
six
...

标记 ,第二个包含后面的所有内容标记 . 它似乎可以在一行与awk或sed一起完成,我只是不知道如何。

csplit ,但csplit不能很好地处理Unicode文本。

4 回复 | 直到 6 年前

ghostdog74 14 年前

你可以用awk轻松地完成它

awk -vRS="MARKER" '{print $0>NR".txt"}' file

Leniel Maccaferri 14 年前

试试这个:

awk '/MARKER/{n++}{print >"out" n ".txt" }' final.txt

它将从final.txt读取输入,并生成out1.txt、out2.txt等。。。

Dennis Williamson 14 年前

sed -n '/MARKER/q;p' inputfile > outputfile1
sed -n '/MARKER/{:a;n;p;ba}' inputfile > outputfile2

或一应俱全:

sed -n -e '/MARKER/! w outputfile1' -e'/MARKER/{:a;n;w outputfile2' -e 'ba}' inputfile

Marcelo Cantos 14 年前

split 命令几乎可以执行您想要的操作:

$ split -p '\*MARKER\*' splitee 
$ cat xaa
one
two
three
$ cat xab
blah-blah *MARKER* blah-blah
four
five
six
$ tail -n+2 xab
four
five
six

也许它足够满足你的需要了。

推荐文章

wqyutv · 当找不到文件时,任何破坏错误的东西都不会出现,我该怎么解决这个问题?

5 月前

user28928120 · 在textarea中选择文本,通过packspace/delete删除它,为另一个元素添加css

7 月前

Earlien · 将解析文本中的加号作为ggplot2运算符进行求值

11 月前

user54097 · 滚动菜单项上的导航栏动画文本徽标

11 月前

Dawken · 从文本中提取字符串表情符号

1 年前

stack programming · 如何将损坏的文本恢复为阿拉伯语

1 年前

user25445882 · ggplot2文本位于上边距,翻转坐标

1 年前

Alexis Mora · 我在python中的reg ex与使用re.serach()不匹配

1 年前

jlklein · 带有geom_textpath()的多层圆环图:如何删除黑色连接线?

1 年前

Taylan Morcol · 替换字符的所有实例,但只能在匹配的字符串中替换

1 年前