代码之家 › 专栏 › 技术社区 › d_kennetz

将元组列表中的对象与dataframe中的对象匹配,如果存在匹配项,则创建新列

tuples pandas string python

d_kennetz · 技术社区 · 6 年前

考虑以下元组列表:

some_strings = [('Name1', 'ABCD', 'DEFG', 'Score=12'),
                ('Name2', 'JKLL', 'RMPQ', 'Score=11')]

以及以下数据帧:

Sequence ID    Left Sequence    Right Sequence
Name1              ABCD             RQLM
Name1              ABCR             PLMT
Name2              JKLL             ZFGQ
Name2              RPLP             FTRD

我试图将tuple中的第二个对象与df列['Left Sequence']进行比较,以检查是否完全匹配(与部分匹配无关),如果匹配发生,请在df末尾的新列中打印dimer。如果不匹配,我将打印NA。以下是我尝试过的代码:

for x in some_strings:
    for y in x:
        df['Dimers'] = df['Left Sequence'].apply(lambda s: 'Dimer' if s == y[1] else 'NA')

我的预期产出:

Sequence ID    Left Sequence    Right Sequence    Dimers
Name1              ABCD             RQLM          Dimer
Name1              ABCR             PLMT           NA
Name2              JKLL             ZFGQ          Dimer
Name2              RPLP             FTRD           NA

我的实际输出(你可能猜得到):

Sequence ID    Left Sequence    Right Sequence    Dimers
Name1              ABCD             RQLM           NA
Name1              ABCR             PLMT           NA
Name2              JKLL             ZFGQ           NA
Name2              RPLP             FTRD           NA

1 回复 | 直到 6 年前

BENY 6 年前

创建布尔掩码:我们使用 isin 创建遮罩

mask=df.iloc[:,:-1].apply(tuple,1).isin([x[:-2] for x in some_strings])    
df['Dimer']='NA'
df.loc[mask,'Dimer']='Dimer'        
df
Out[1120]: 
  SequenceID LeftSequence RightSequence  Dimer
0      Name1         ABCD          RQLM  Dimer
1      Name1         ABCR          PLMT     NA
2      Name2         JKLL          ZFGQ  Dimer
3      Name2         RPLP          FTRD     NA

推荐文章

Paul Jurczak · 这两个Python函数可以被一个接受列表或元组参数的泛型函数替换吗?

11 月前

Konstantin Makarov · 创建现代元组时,新运算符的含义是什么?还是说这是一个雏形?

1 年前

John · 为函数提供列表

1 年前

Jme · 为什么在Python中解包时理解只适用于元组?

1 年前

bers · 如何在std::apply中封装std::make_unique?

1 年前

Jim Fell · 如何在Python中将对象列表合并为元组列表(矩阵样式)?

1 年前

angie · CPLEX CP优化器将数据读入元组后,如何删除数组的参数以实现稀疏性?

1 年前

Michael Davila · 按A1 B1 C1顺序的第一个元素对元组进行排序

1 年前

luna · 我的列表不是元组,为什么错误会说其他的??:(

1 年前

ÐÐ¸ÑÐ¸Ð»Ð» ÐÐµÐ»Ð°ÑÐ²Ð¸Ð»Ð¸ · ==和等于元组<object>

1 年前