代码之家 › 专栏 › 技术社区 › Hariom Singh

熊猫从excel创建合并报表

pandas python

Hariom Singh · 技术社区 · 8 年前

我有一个excel文件,详细如下。我试着用panda在excel中只得到前5种语言和它们的总和

files   language    blank   comment code
61         Java     1031     533    3959
10         Maven    73        66    1213
12         JSON      0         0    800
32         XML       16       74    421
7          HTML      14       16    161
1      Markdown     23        0      39
1           CSS      0        0      1

下面是我的代码

import pandas as pd
from openpyxl import load_workbook

df = pd.read_csv("myfile_cloc.csv", nrows=20)
#df =  df.iloc[1:]
top_five = df.head(5)

print(top_five)
print(top_five['language'])
print(top_five['code'].sum())

d = {'Languages (CLOC) (Top 5 Only)': "", 'LOC (CLOC)Only Code': 0}
newdf = pd.DataFrame(data=d)

newdf['Languages (CLOC) (Top 5 Only)'] = str(top_five['language'])
newdf['LOC (CLOC)Only Code'] = top_five['code'].sum()

#Load excel to append the consolidated info
writer = newdf.ExcelWriter("myfile_cloc.xlsx", engine='openpyxl')
book = load_workbook('myfile_cloc.xlsx')

writer.book = book
newdf.to_excel(writer, sheet_name='top_five', index=False)
writer.save()

在这方面需要建议

newdf['Languages (CLOC) (Top 5 Only)'] = str(top_five['language'])
newdf['LOC (CLOC)Only Code'] = top_five['code'].sum()

所以预期的产出可以是

Languages (CLOC) (Top 5 Only)  LOC (CLOC)Only Code
Java,Maven,JSON,XML,HTML          6554

正在获取错误

raise ValueError('If using all scalar values, you must pass'
ValueError: If using all scalar values, you must pass an index

2 回复 | 直到 8 年前

Mohamed Thasin ah 8 年前

试试这个,

解决这个问题的方法之一 index 属性

a=df.head()
df=pd.DataFrame({"Languages (CLOC) (Top 5 Only)": ','.join(a['language'].unique()),"LOC (CLOC)Only Code":a['code'].sum()},index=range(1))

另一种解决办法, 使用 from_records 并在数据帧中传递dict列表。

df=pd.DataFrame.from_records([{"Languages (CLOC) (Top 5 Only)": ','.join(a['language'].unique()),"LOC (CLOC)Only Code":a['code'].sum()}])

输出:

    Languages (CLOC) (Top 5 Only)    LOC (CLOC)Only Code
0        Java,Maven,JSON,XML,HTML                   6554

Yog 8 年前

 import pandas as pd
sheet1 = pd.read_csv("/home/mycomputer/Desktop/practise/sorting_practise.csv")
sheet1.head()
sortby_blank=sheet1.sort_values('blank',ascending=False)
sortby_blank['blank'].head(5).sum()
values = sortby_blank['blank'].head(5).sum()

/home/nptel/Desktop/practice/sorting_practice.csv--->文件目录

空白--->要排序的列

如果需要底部值,请使用.tail()。

“values”变量将得到您正在寻找的答案

推荐文章

Google User · Django管理员在`list_display中未显示`creation_date`字段`

1 年前

user29747013 · 如何创建一个新的数据框架,其中包含原始数据框架中列的聚合列?

1 年前

ÎÎÎ½Î· ÎÎ®Î¹Î½Î¿Ï · Python lxml.html语法错误:使用lxml find时XPATH的谓词无效

1 年前

user29715306 · from_users=和chats=电视节目中的差异

1 年前

Redshoe · 当执行numpy.genfromtxt()时,python是否会读取文件的所有行?

1 年前

RASEL MAHMUD · 为什么以及如何在is_even()函数内的IF条件中递归X变量在满足0后递增?[副本]

1 年前

prayner · 更新嵌套字典包含列表中的项

1 年前

Bringo Jr · 我可以在O(n)中解决这个问题吗?

1 年前

Dave · 如何在for循环中修改列表值

1 年前

Shukurullox Komiljonov · 从记录中获得相互和解。使用SQL

1 年前