小明的玩物志
首页
搜索
归档
白色风车
文章
17
分类
4
标签
8
归档
搜索
分类
标签
技术分享
🗒️案例:数据分析
发布于: 2022-3-2
最后更新: 2024-8-21
次查看
AI
工具
开发
type
status
slug
date
summary
tags
category
password
icon

案例:数据分析

我们尝试用chatgpt写pandas来帮我们做数据分析。
为了检验chatgpt的代码,我们参考《joyful-pandas》里的内容进行比对检查。
选取joyful-pandas里第四章 - 分组的内容。见:http://joyfulpandas.datawhale.club/Content/ch4.html

prompt测试

  1. 首先让chatgpt知道文件在哪,以及文件的列名有哪些。
    1. Excel文件在'data/learn_pandas.csv';列名为School、Grade、Name、Gender、Height、Weight、Transfer、Test_Number、Test_Date、Time_Record;分别表示学校、年级、姓名、性别、身高、体重、是否转学、测试组号、测试日期、花费时间。
说明列名和列的意义是为了方便用中文和chatgpt交流。
notion image
Chatgpt表示它已经准备就绪了。
  1. 开始测试:请按照性别分组,统计身高中位数,给出pandas代码
notion image
它很贴心地提示先导入库,并且写了注释。直接拷贝代码看看结果。和教程的代码和结果做比较,完全正确。
notion image
notion image
  1. 测试一个复杂一点的,我希望按照男女分组后,计算身高和体重标准化后的数值。
notion image
结果也是正确的,只不过chatgpt给我们多加了两列标准化之后的数值,并且把所有的列数据都打印出来了。
如果希望像教程中一样只展示这两列数据,只需要多说一句:只打印标准化后的身高和体重数据即可,不用打印其他列。(不再演示)
notion image
notion image
看上去数据分析是Chatgpt的强项,只要把需求说清楚,它就能给出正确答案。

练习题验证

我们试一下练习题,看看直接把练习题拷贝输入chatgpt,是不是可以得到完全一样的答案。
notion image
  1. 先过滤出所属 Country 数超过2个的汽车,即若该汽车的 Country 在总体数据集中出现次数不超过2则剔除,再按 Country 分组计算价格均值、价格变异系数、该 Country 的汽车数量,其中变异系数的计算方法是标准差除以均值,并在结果中把变异系数重命名为 CoV 。
notion image
notion image
notion image
Chatgpt的答案
直接复制代码运行的结果
参考答案
  1. 按照表中位置的前三分之一、中间三分之一和后三分之一分组,统计 Price 的均值。
notion image
notion image
notion image
Chatgpt的答案
直接复制代码运行的结果
参考答案
  1. 对类型 Type 分组,对 Price 和 HP 分别计算最大值和最小值,结果会产生多级索引,请用下划线把多级列索引合并为单层索引。
notion image
notion image
notion image
Chatgpt的答案
直接复制代码运行的结果
参考答案
  1. 对类型 Type 分组,对 HP 进行组内的 min-max 归一化。
notion image
notion image
notion image
Chatgpt的答案
直接复制代码运行的结果
参考答案
  1. 对类型 Type 分组,计算 Disp. 与 HP 的相关系数。
notion image
notion image
notion image
Chatgpt的答案
直接复制代码运行的结果
参考答案
检验结果,完全正确!
  • 作者:白色风车
  • 链接:https://f.appa.me/article/gpt-7
  • 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。
相关文章
陆奇-新范式 新时代 新机会
Android U新特性 - Modern广播队列机制介绍
AIGC持续火爆,生成式AI的应用场景有哪些?
加锁文章2
持续调教prompt(案例)
还有不知道 commit 规范 ?
Android U新特性 - Modern广播队列机制介绍AIGC持续火爆,生成式AI的应用场景有哪些?
Loading...
目录
0%
案例:数据分析prompt测试练习题验证
白色风车
白色风车
为了不折腾而折腾
文章
17
分类
4
标签
8
最新发布
CD/CD
CD/CD
2024-8-21
AIGC持续火爆,生成式AI的应用场景有哪些?
AIGC持续火爆,生成式AI的应用场景有哪些?
2024-8-21
GPT辅助润色论文
GPT辅助润色论文
2024-8-21
基本提示模式
基本提示模式
2024-8-21
陆奇-新范式 新时代 新机会
陆奇-新范式 新时代 新机会
2024-8-21
Android Hilt
Android Hilt
2024-8-21
公告
🏄遥遥领先🏄
为了不折腾而折腾
 
目录
0%
案例:数据分析prompt测试练习题验证
2013-2025 白色风车.