pandas Series 在这里我必须提取括号内的所有子字符串。一个字符串可能包含多个这样的子字符串,也可能不包含这样的子字符串。这样的情况怎么处理
pandas Series
abc(def)ghi(jkl)aaa jklmnopqr(jkl) (ab)cde(ghi) lmnoprst uvwxyz
str.extract ,一次只能从具有 a.str.extract('.*\((.*)\)') . 所以实际上,我错过了子串 def
str.extract
a.str.extract('.*\((.*)\)')
def
期望的结果是
def jkl ab ghi
尝试:
df[0].str.extractall(r'\((\w+)\)')
0 match 0 0 def 1 jkl 1 0 jkl 2 0 ab 1 ghi