这篇文章给大家分享的是有关python中如何把excel文件读取为df并用SQL查询、分析的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。
下载、导入第三方库
下载:python -m pip install pandasql
导入:from pandasql import sqldf,load_births,load_meat
from pandasql import sqldf,load_births,load_meat
加载内置数据集
df1 = load_births()
df2 = load_meat()
预览数据查看前几行
df1.head()

调用sqldf方法,参数为sql语句
sql = """
select
date,count(*) as n
from df1
group by date
order by n desc;
"""
result = sqldf(sql)
result[result['n']==3]
对比一下,结果是相同的
df1['date'].value_counts().head(12)
1991-12-01 3
1991-10-01 3
1991-06-01 3
1991-08-01 3
1991-09-01 3
1991-04-01 3
1991-02-01 3
1991-01-01 3
1991-03-01 3
1991-07-01 3
1991-11-01 3
1991-05-01 3
Name: date, dtype: int64
![]()
聚合效果
sql2 = """
select max(beef),min(pork),sum(turkey),count(veal)
from df2;
"""
result2 = sqldf(sql2)
result2
多表连接也是可以的哦~
df1.merge(df2,on='date',how = 'inner')
sql3 = """
select df1.*,df2.*
from df1 inner join df2
on df1.date = df2.date;
"""
result3 = sqldf(sql3)
resul
感谢各位的阅读!关于“python中如何把excel文件读取为df并用SQL查询、分析”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!