百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术教程 > 正文

Python其实很简单 第二十三章 全校学生成绩统计的完整实例

csdh11 2025-03-04 11:40 2 浏览

下面是用DataFrame改写第十七章介绍的程序(p23-1.py):

from warnings import simplefilter

simplefilter(action='ignore', category=FutureWarning)

# simplefilter用于忽略第三方警告

import numpy as np

import pandas as pd

from pandas import read_excel


file='d:/student.xlsx'

#Excel文件地址,student.xlsx内容详见表18-1

df=read_excel(file,sheet_name=0,converters={'学号':str})

#将Excel文件读入DataFrame数据框架df中

df['年级']=df['学号'].str.slice(0,2)

#用slice()函数实现切片并赋值给'年级'字段

df['班级']=df['学号'].str.slice(0,4)

#用slice()函数实现切片并赋值给'班级'字段

df.总分=df.语文+df.数学+df.英语

#列求和,列赋值

df['名次']=df['总分'].rank(method='min',ascending=False)

#rank()函数当method='min'时与Excel中完全相同,ascending=False为升序排序

df.to_excel('d:/test1.xlsx',sheet_name='Sheet1',index=False)

#将DataFrame数据框架df中的数据保存到Excel文件中

#至此,完成了新建Excel文件中Sheet1工作表数据的填充工作。


dfpj=df.groupby('班级')['语文','数学','英语','总分'].mean()

#依据'班级'列进行分组,求语文、数学、英语、总分的平均值,保存到数据框架dfpj中

dfrs=df.groupby('班级')['学号'].agg({'人数':np.size})

#依据'班级'列进行分组,对'学号'列计数,并以'人数'为别名保存到数据框架df人数中

jg72=72

#设置以72分为及格分数线,用于语文、数学科目

jg60=60

#设置以60分为及格分数线,用于英语科目

yx96=96

#设置以96分为优秀分数线,用于语文、数学科目

yx80=80

#设置以96分为优秀分数线,用于英语科目

df['语及']=df['语文']

#增加新的列'语及',并将'语文'列的值对应赋给

df['数及']=df['数学']

#增加新的列'数及',并将'数学'列的值对应赋给

df['英及']=df['英语']

#增加新的列'英及',并将'英语'列的值对应赋给

df['语优']=df['语文']

#增加新的列'语优',并将'语文'列的值对应赋给

df['数优']=df['数学']

#增加新的列'数优',并将'数学'列的值对应赋给

df['英优']=df['英语']

#增加新的列'英优',并将'英语'列的值对应赋给

#以上六列目前都为成绩值,后续将用来单科及格率和优秀率

#函数fun(x,y)用于判断x>=y是否成立,成立返回1;不成交返回0

def fun(x,y):

if x>=y:

return 1

else:

return 0


df['语及']=df['语及'].apply(lambda x:fun(x,jg72))

#前面已经给'语及'赋值为'语文'的值,此语句相当于判断语文>=72是否成立

#若成立则'语及'赋值为1,否则赋值为0

df['数及']=df['数及'].apply(lambda x:fun(x,jg72))

#同上,判断数学成绩是否及格

df['英及']=df['英及'].apply(lambda x:fun(x,jg60))

#同上,判断英语成绩是否及格

df['语优']=df['语优'].apply(lambda x:fun(x,yx96))

#同上,判断语文成绩是否优秀

df['数优']=df['数优'].apply(lambda x:fun(x,yx96))

#同上,判断数学成绩是否优秀

df['英优']=df['英优'].apply(lambda x:fun(x,yx80))

#同上,判断英语成绩是否优秀

df['合格']=df['语及']+df['数及']+df['英及']

#'语及'、'数及'、'英及'的值均为0或1,故'合格'的值在0~3之间

df['优秀']=df['语优']+df['数优']+df['英优']

#'语优'、'数优'、'英优'的值均为0或1,故'优秀'的值在0~3之间

df['合格']=df['合格'].apply(lambda x:fun(x,3))

#若'合格'的值>=3(其实不可能大于),给'合格'赋值为1;否则赋值为0

df['优秀']=df['优秀'].apply(lambda x:fun(x,3))

#若'优秀'的值>=3(其实不可能大于),给'优秀'赋值为1;否则赋值为0

dfjgyx=df.groupby('班级')['语及','语优','数及','数优','英及','英优','合格','优秀'].sum()

#按照'班级'分组统计'语及'等项的和,实际上就是各个单科和三科合格、优秀的人数

dftj=pd.merge(dfpj,dfjgyx,on='班级')

#将dfpj(包含有平均分)和dfjgyx(及格、优秀人数)按照'班级'关键字连接,保存到dftj

dftj=pd.merge(dftj,dfrs,on='班级')

#将dfrs连接到dftj

dftj['语文']=round(dftj['语文'],2)

#班级语文平均分保留两位小数

dftj['数学']=round(dftj['数学'],2)

#班级数学平均分保留两位小数

dftj['英语']=round(dftj['英语'],2)

#班级英语平均分保留两位小数

dftj['总分']=round(dftj['总分'],2)

#班级每个学生的三科总分的平均值保留两位小数

dftj['语及']=round((dftj['语及']/dftj['人数'])*100,2)

#语文及格人数/班级人数*100,保留两位小数,即为语文及格率,保存到'语及'列

dftj['语优']=round((dftj['语优']/dftj['人数'])*100,2)

#语文优秀人数/班级人数*100,保留两位小数,即为语文优秀率,保存到'语优'列

dftj['数及']=round((dftj['数及']/dftj['人数'])*100,2)

#数学及格人数/班级人数*100,保留两位小数,即为数学及格率,保存到'数及'列

dftj['数优']=round((dftj['数优']/dftj['人数'])*100,2)

#数学优秀人数/班级人数*100,保留两位小数,即为数学优秀率,保存到'数优'列

dftj['英及']=round((dftj['英及']/dftj['人数'])*100,2)

#英语及格人数/班级人数*100,保留两位小数,即为英语及格率,保存到'英及'列

dftj['英优']=round((dftj['英优']/dftj['人数'])*100,2)

#英语优秀人数/班级人数*100,保留两位小数,即为英语优秀率,保存到'英优'列

dftj['合格']=round((dftj['合格']/dftj['人数'])*100,2)

#三科合格人数/班级人数*100,保留两位小数,即为三科合格率,保存到'合格'列

dftj['优秀']=round((dftj['优秀']/dftj['人数'])*100,2)

#三科优秀人数/班级人数*100,保留两位小数,即为三科优秀率,保存到'优秀'列

dftj=dftj[['人数','语文','语及','语优','数学','数及','数优','英语','英及','英优','总分','合格','优秀']]

#重新调整dftj的各个字段的次序,为输出到Excel做准备

dftj.to_excel('d:/test2.xlsx',sheet_name='Sheet1',index=True)

#将数据框架dftj的数据保存到Excel文件中,索引列'班级'也一并写入


P23-1运行后生成如下两个表格:

解决写入Excel文件的内容不被覆盖的方法

在上面的代码中,to_excel()方法将DataFrame中的数据写入了某个指定的Excel文件的指定工作表中,第二次运行程序时会将Excel中以前保存的内容覆盖掉,若要想写入到新的工作表中,可在程序中添加如下代码,它利用了openpyxl的特点,它会自动新建一个以sheet_name为名后缀序号的新工作表:

# p23-2.py:

import openpyxl

#导入openpyxl模块

#以下为自定义函数add_sheet()

def add_sheet(data, excel_writer, sheet_name):

book = openpyxl.load_workbook(excel_writer.path)

#为openyxl方法指定要打开的Excel文件地址

excel_writer.book = book

#为excel_writer方法指定工作簿

data.to_excel(excel_writer=excel_writer, sheet_name=sheet_name, index=True, header=True)

#将data数据框中的数据写入Excel文件,index为真表示添加索引列,header为真表示添加标题行

excel_writer.close()

excel_writer = pd.ExcelWriter(r"d:\test.xlsx", engine='openpyxl')

#指明用openpyxl操作Excel文件

add_sheet(dftj, excel_writer, 'bjtj')

这样,就可以在test.xlsx文件中每次都新建一个名为“bjtj+n”的工作表,而不覆盖原有的工作表。

在前述的p23-1.py中,为了获取三科成绩全部及格的人数,使用了一个自定义函数fun(x,y),用该函数先判断每一科成绩是否及格,若及格则写入一个标识值为1,若不及格则写入一个标识值为0,然后再用fun(x,y)这个函数判断三科是否全部及格。这个方法显得比较繁琐,下面给出了另一种解决方法,它通过条件筛选出三科全部及格的学生并添加到一个新的数据框架中。如下代码p22-3.py只实现了p23-1.py中的部分功能,没有计算单科及格率、优秀率等。

Py23-3.py代码:

from warnings import simplefilter

simplefilter(action='ignore', category=FutureWarning)

import numpy as np

import pandas as pd

from pandas import read_excel #导入read_execel


file='d:/student.xlsx'

df=read_excel(file,sheet_name=0,converters={'学号':str})

df['年级']=df['学号'].str.slice(0,2)

df['班级']=df['学号'].str.slice(0,4)

df.总分=df.语文+df.数学+df.英语

dfhg=df[(df['语文']>=72) & (df['数学']>=72) & (df['英语']>=60)]

#将df中符合合格标准(三科都及格)的记录保存到dfhg中

dfyx=df[(df['语文']>=96) & (df['数学']>=96) & (df['英语']>=80)]

#将df中符合优秀标准(三科都优秀)的记录保存到dfhg中

dfpj=df.groupby('班级')['语文','数学','英语','总分'].mean()

#求班级单科平均值和总分平均值保存到dfpj中

dfrs=df.groupby('班级')['学号'].agg({'人数':np.size})

#dfrs中保存各班总人数

dfhg=dfhg.groupby('班级')['学号'].agg({'合格':np.size})

#dfhg中保存各班合格人数

dfyx=dfyx.groupby('班级')['学号'].agg({'优秀':np.size})

#dfhg中保存各班优秀人数

dftj=pd.merge(dfpj,dfhg,on='班级',how='left')

#以dfpj为基础,以'班级'为连接键,将dfhg连接到dfpj上,生成dftj

dftj=pd.merge(dftj,dfyx,on='班级',how='left')

#以dftj为基础,以'班级'为连接键,将dfyx连接到dftj上

dftj=pd.merge(dftj,dfrs,on='班级',how='left')

#以dftj为基础,以'班级'为连接键,将dfrs连接到dfpj上

dftj['语文']=round(dftj['语文'],2)

dftj['数学']=round(dftj['数学'],2)

dftj['英语']=round(dftj['英语'],2)

dftj['总分']=round(dftj['总分'],2)

dftj['合格']=round((dftj['合格']/dftj['人数'])*100,2)

dftj['优秀']=round((dftj['优秀']/dftj['人数'])*100,2)

dftj=dftj.fillna(0)

#用0填充NaN值

dftj.to_excel('d:/test3.xlsx',sheet_name='Sheet1',index=True)

#将数据框架dftj的数据保存到Excel文件中,索引列'班级'也一并写入

P23-3.py运行后生成的excel表格(test3.xlsx):

相关推荐

Excel表格技巧—如何保留小数点后两位

在我们日常使用Ofiiceexcel中,经常会用到小数点保留,对此人们习惯性会使用单元格格式设置,不过这种办法并不是真正的四舍五入,而只是改变了excel的显示。我们下面要介绍的这个方式是利用函数做...

小数的意义和性质(十四)

27、在一个两位小数的末尾添上一个0,与原来小数相比,多了1107个计数单位,这个小数原来是多少?举个例子:0.35的末尾添上一个0,就变成了0.350,0.35里有35个0.01,0.350里有35...

必看!文职人员等级标志及有关问题20条!

来源:中国民兵微信公众号大道至简!为了让大家更多了解文职政策、报考文职的粉丝们最快、最直接掌握政策。首先是上独家解读和壁纸。然后,结合独家资料,梳理出20条有关文职的干货,快快收藏吧!1.文职人员的身...

小学数学单元知识体系概述-五年级《小数除法》

一、网络图二、知识点梳理及举例说明1.除数是整数。1)除到被除数的末尾没有余数,能除尽。举例:22.4÷4。...

“分数,小数,百分数 的互化”我这样教学,学生很快就学会了。

这部分知识千万不能忽视,用途可大了。我们在进行分数,小数,百分数四则混合运算时,不会三者之间的转化,很难把题计算准确。那么三者之间怎样转化呢?其实就这么几步:一,分数化小数,用分数的分子除以分数的分...

求小数近似数的最大值和最小值的技巧

例:一个两位小数,四舍五入后的近似数是5.0,这个三位小数最大可能是(),最小可能是()。分析:保留一位小数要看百分位上的数和5比较,若小于5的数舍去;若≥5的数,向前一位进一。四舍是最大,五入是...

实验室检测双乙酰的操作步骤

双乙酰学名是2,3丁二酮,是啤酒发酵过程中酵母自身代谢产生的一种副产物,当双乙酰的含量在浅色啤酒中超过0.15mg/L时,就会使啤酒产生一种令人不愉快的馊饭味,严重影响啤酒的质量和口感,在啤酒中双乙酰...

快来看!玉溪2020年中考分数段出炉

8月7日市教育体育局公布玉溪市2020年初中学业水平考试分数段据介绍,今年,玉溪市普通高中学校招生文化成绩满分为600分(不含照顾加分),由初中学业水平考试的13个学科成绩折算而得,总分累加保留两位小...

截取近似值的方法有几种?在生活中怎样应用这些方法?(21)

根据生活中的实际情况,截取近似值的方法有以下三种:(1)、四舍五入法:...

Excel数值取整及进位

取整数函数907.5;1034.2;1500要改变为908;1035;1500公式为:=CEILING(A1,1)907;1034;1500要改变为910;1040;1500公式为:...

C语言sprintf函数详解:“字符串魔法师”

♂?一句话理解sprintf「将数据按‘魔法咒语’(格式字符串)格式化,并将结果‘封印’到一个字符数组中!」...

sql server 数字四舍五入 保留两位小数

1.使用Round()函数,如Round(@num,2),其中参数2表示保留两位有效数字。缺点:Round()只是负责四舍五入到两位小数,但是不负责去掉后面的0。...

excel表格保留两位小数怎么保留?教您4种设置方法

保留两位小数怎么保留?有4种解决方法,我们来具体演示一下。·方法一:选择需要设置的单元格,然后点击开始菜单,数字功能区,点击增加小数位数或者是减少小数位数,调到保留两位就可以了。·方法二:选择需要设置...

如何对数字进行四舍五入,进一法,去尾法,精度法等不同方式取舍

指定位数取有效位针对数值我们有不同的处理方式,比如保留一位小数位,保留两位小数位,保留整数位等,一般我们都是采用四舍五入...

保留n位小数的函数公式

在日常办公中,Excel和WPS是我们处理数据的得力助手。今天,我们将介绍几个常用的函数,帮助你在数据处理中事半功倍。...