熊猫:处理输入数据框中缺少的列

 收藏

我有一个python代码,可以对数据框的多个列执行数学计算。此输入来自各种来源,因此有时可能缺少同一列。

缺少此列是因为它无关紧要,但是我需要至少有一个空列才能使代码运行而不会出错。

我可以使用if循环添加一个空列,但是大约有120列,我不想放慢代码的速度。代码还有其他方法可以检查原始数据帧中是否存在每一列,然后如果不存在任何列,则添加空列,然后从执行实际代码开始?

回复
  • 如果您知道每个数据框的列名都相同,则可以执行以下操作,而不必遍历列名

    if col_name not in df.columns:
        df[col_name] = '' # or whatever value you want to set it to