在删除副本时,您可以选择不保留任何一个副本,这基本上意味着您只保留唯一的值。如果其中一个数据帧是另一个数据帧的严格子集,这将为您提供更新。
diff_set = pd.concat([old, new]).drop_duplicates(subset=['Name'], keep=False)
看来你的指数不太匹配。如果遇到此问题,可能需要首先设置索引。
diff_set = pd.concat([old.set_index("Org"), new.set_index("Org")]).drop_duplicates(subset=['Name'], keep=False).reset_index(drop=False)
最后一个在哪里
reset_index
ll
Out[101]:
Name Org
0 abc ddc systems
1 sdc ddc systems
2 csc ddd systems
3 rdc kbf org
4 rfc kbf org
ll2
Out[102]:
Name Org
0 abc ddc systems
1 sdc ddc systems
2 csc ddd systems
3 rdc kbf org
4 rfc kbf org
5 Spam ddc systems
6 John ddc systems
7 Foo ddd systems
diff_set = pd.concat([ll.set_index("Org"), ll2.set_index("Org")]).drop_duplicates(subset=['Name'], keep=False).reset_index(drop=False)
diff_set
Out[104]:
Org Name
0 ddc systems Spam
1 ddc systems John
2 ddd systems Foo
我可以添加任意数量的员工,它会继续工作。^^