代码之家 › 专栏 › 技术社区 › Janusz Skonieczny

如何在没有csv.reader迭代器的情况下解析单行csv字符串?

csv python

Janusz Skonieczny · 技术社区 · 15 年前

我有一个csv文件,需要重新排列和重新编码。我想跑步

line = line.decode('windows-1250').encode('utf-8')

在csv阅读器解析和拆分它之前的每一行上。或者,我希望自己对行进行迭代,运行重新编码,使用单行解析表单csv库,但使用相同的阅读器实例。

有什么好办法吗?

3 回复 | 直到 15 年前

Dawid 15 年前

文件上的循环行可以这样做:

with open('path/to/my/file.csv', 'r') as f:
    for line in f:
        puts line # here You can convert encoding and save lines

$ iconv -f Windows-1250 -t UTF8 < file.csv > file.csv

编辑: 那么问题在哪里呢?

with open('path/to/my/file.csv', 'r') as f:
    for line in f:
        line = line.decode('windows-1250').encode('utf-8')
        elements = line.split(",")

Janusz Skonieczny 15 年前

THX,作为答案。包装纸给了我一个想法:

def reencode(file):
    for line in file:
        yield line.decode('windows-1250').encode('utf-8')

csv_writer = csv.writer(open(outfilepath,'w'), delimiter=',',quotechar='"', quoting=csv.QUOTE_MINIMAL)
csv_reader = csv.reader(reencode(open(filepath)), delimiter=";",quotechar='"')
for c in csv_reader:
    l = # rearange columns here
    csv_writer.writerow(l)

这正是我要重新编码的,在csv阅读器解析之前。

Mark Tolonen 15 年前

在最底层 csv documentation 是一组实现对csv的Unicode支持的类(unicodereader和unicodewriter):

rfile = open('input.csv')
wfile = open('output.csv','w')
csv_reader = UnicodeReader(rfile,encoding='windows-1250')
csv_writer = UnicodeWriter(wfile,encoding='utf-8')
for c in csv_reader:
    # process Unicode lines
    csv_writer.writerow(c)
rfile.close()
wfile.close()

推荐文章

SD_ · 使用CLI将由文件分隔符控制字符(FS/ASCII28/UTF-8 0x1C)分隔的csv文件读取到duckdb中

8 月前

ViSa · 如何在python中分隔存储在变量中的文本以创建数据帧?

1 年前

S K · 需要在Powershell中使用2个变量为CSV文件创建foreach循环

1 年前

Kavya shree · 将TSV文件数据转换为可推送到数据库的数据帧

1 年前

Joan Lopez · 从csv中提取的数据获得平均值

1 年前

Chinmaya Tewari · 创建新csv文件时权限被拒绝

1 年前

Parker Clark · 通过Bash操作csv中的特定列?

1 年前

Rasec Malkic · 如何根据第1列和第3列中的条件删除重复项?

1 年前

James Black · 如何基于列删除CSV文件中重复的行

1 年前

James Black · 将json文件转换为具有更多列的csv文件-Python

1 年前