代码之家 › 专栏 › 技术社区 › fregante

在终端中使用regex从字符串中提取字符串[重复]

grep bash regex

fregante · 技术社区 · 15 年前

这个问题已经有了答案:

How to extract a value from a string using regex and a shell? 6答

我有一个一串喜欢 first url, second url, third url 只想提取 url 词后 second 在OS X终端中(仅第一次出现)。我该怎么做?

在 我最喜欢的编辑器 我用的是瑞吉丝 /second (url)/ 并使用 $1 要提取它,我只是不知道如何在终端中进行。

记住 网址 是实际的URL,我将使用以下表达式之一进行匹配: Regex to match URL

4 回复 | 直到 8 年前

Sjoerd 15 年前

echo 'first url, second url, third url' | sed 's/.*second//'

编辑:我误解了。更好的:

echo 'first url, second url, third url' | sed 's/.*second \([^ ]*\).*/\1/'

或:

echo 'first url, second url, third url' | perl -nle 'm/second ([^ ]*)/; print $1'

mklement0 8 年前

连接到另一个进程(如上面建议的“sed”和“perl”)的管道可能非常昂贵,特别是当您需要多次运行此操作时。bash支持regexp:

[[ "string" =~ regex ]]

类似于通过使用 $1 , $2 等等,bash填充 $BASH_REMATCH 用所有匹配项数组。

在您的特定示例中:

str="first usr1, second url2, third url3"
if [[ $str =~ (second )([^,]*) ]]; then echo "match: '${BASH_REMATCH[2]}'"; else echo "no match found"; fi

输出:

match: 'url2'

明确地, =~ 支架 扩展的 正则表达式 as defined by POSIX 但是 平台特定扩展 (范围不同,可能不兼容)。
在Linux平台上(gnu userland),请参见 man grep ;在MacOS/BSD平台上,请参见 man re_format .

mhitza Federico Taschin 15 年前

在另一个答案中,如果您仍然保留所需URL之后的所有内容。所以我建议你以下的解决方案。

echo 'first url, second url, third url' | sed 's/.*second \(url\)*.*/\1/'

在sed下,通过转义表达式周围的括号(posix标准)对表达式进行分组。

Yeti 8 年前

尝试这个的时候,你可能忘记了 -E 论证 sed .

从 sed --help :

  -E, -r, --regexp-extended
                 use extended regular expressions in the script
                 (for portability use POSIX -E).

你不必改变你的正则表达式,但是你需要添加 .* 贪婪地在它周围配对,去掉绳子的另一部分。

这对我来说很好:

echo "first url, second url, third url" | sed -E 's/.*second (url).*/\1/'

输出:

url

其中输出“url”实际上是字符串中的第二个实例。但是,如果您已经知道它是在逗号和空格之间格式化的,并且您不允许在URL中使用这些字符,那么regex [^,]* 应该是好的。

可选地:

echo "first http://test.url/1, second ://test.url/with spaces/2, third ftp://test.url/3" \
     | sed -E 's/.*second ([a-zA-Z]*:\/\/[^,]*).*/\1/'

正确输出:

://example.com/with spaces/2

推荐文章

Eric Marceau · Grep:有没有一种特殊的方法可以将“无字符”作为“字符位置”匹配的置换?

1 年前

Michael · 跨越多个git分支[重复]

1 年前

tijko · grep正则表达式用于具有连续相同整数的行?

1 年前

Kiran Kumar CH · 我有70mb.tsv文件,我想删除每行中的“/”,并使用sed或tr或任何基于linux的命令添加空格,而不是“/”[关闭]

1 年前

OM222O · Bash命令替换问题

1 年前

Rohan Nath · 如何使用Bash命令提取具有多行的簇?

2 年前

r01_mage · 如何在通过grep进行管道传输后保持命令的彩色输出

2 年前

Valay Agarawal · 从文件中灰显所有实例,并从所有元素中添加特定位置

2 年前

Nikki Malhotra · 包含一组字母并排除其他字母的Grep命令

2 年前

ShaneF · linux sed错误,前面的正则表达式无效

2 年前