代码之家  ›  专栏  ›  技术社区  ›  Pyd

熊猫数据列中的字数计算

  •  -1
  • Pyd  · 技术社区  · 7 年前

    嗨,我有一个数据帧,

    df,

     Name
     Raj
     NaN
     Ravi,kumar
    

    我正在尝试获取df[“Name”]中的字数,

    我试过了, df['count']=df['Names'].str.count(',') + 1

    但我得到了南场的“1”,如何解决这个问题 我正在

     Name        count
     Raj          1
     NaN          1  
     Ravi,kumar   2
    

    但我想要的输出应该是,

     Name        count
     Raj          1
     NaN            
     Ravi,kumar   2
    
    2 回复  |  直到 7 年前
        1
  •  2
  •   cs95 abhishek58g    7 年前

    看起来像 NaN 这里是一个字符串。尝试这样做:

    df['Name'].replace('NaN', np.nan).str.count(',') + 1
    

    你应该从以下几方面入手:

    0    1.0
    1    NaN
    2    2.0
    Name: Name, dtype: float64
    

    然后你可以打电话 .fillna('') 填空。

        2
  •  2
  •   Bharath M Shetty    7 年前

    也许你需要np。其中,即

    df['count'] = np.where(df['Name']!='NaN',df['Name'].str.count(',')+1,'')
    
             Name count
    0         Raj   1.0
    1         NaN      
    2  Ravi,kumar   2.0