这里的目标是找到df中不存在的列,并用空值创建它们。
我有一个列名列表,如下所示:
column_list = ('column_1', 'column_2', 'column_3')
当我试图检查该列是否存在时,它只对存在的列给出true,而对缺少的列不给出false。
for column in column_list:
print df.columns.isin(column_list).any()
在pyspark中,我可以通过以下方法实现:
for column in column_list:
if not column in df.columns:
df = df.withColumn(column, lit(''))
我怎样才能用熊猫达到同样的效果呢?