代码之家  ›  专栏  ›  技术社区  ›  RustyShackleford

如何根据数据帧中的样本创建虚拟记录?

  •  0
  • RustyShackleford  · 技术社区  · 7 年前

    例子:

    测向

    id   email       phone    first_name ......
    1    a@a.com     123       adam
    2    b@b.com     456       bob
    

    有没有什么方法可以让python根据列中的数据类型来开发示例数据?

    所以代码会自动生成假身份证、电子邮件和电话号码。理想情况下,我可以设置我需要创建的假记录的数量,例如需要200万行,我可以添加单词 fake 像这样的一列 first_name .

    新df

    id   email       phone    first_name ......
    1    a@a.com     123       adam
    2    b@b.com     456       bob
    3    c@c.com     789       fake_carly
    4    c@c.com     789       fake_david
    
    1 回复  |  直到 7 年前
        1
  •  1
  •   user9074332    7 年前

    蟒蛇 faker 图书馆似乎很受欢迎的类型你正在做的事情。

    github.com/joke2k/faker