魅力程序猿

  • 首页
  • Java
  • Android
  • APP
    • 扑克计分器
    • Video Wallpaper
  • 联系我
  • 关于我
  • 资助
道子
向阳而生
  1. 首页
  2. AI技术
  3. 正文

没有技术要求,只需5步就能完成数据分析和图表制作,DuckDB可将数据分析门槛铲平。

2026年4月1日 20点热度 0人点赞 0条评论

📰 来源: 博客园


本文介绍如何在本地使用DuckDB进行数据集的分析。零门槛完成数据分析。实践过程以菜鸟级别的步骤拆解,帮助非技术用户快速上手。

整个过程只需5步,每个操作步骤都没有技术要求,只要按照步骤进行即可。

非常适合无编程基础的用户,借助AI完成超大数据集的探索分析过程。当然同样适合有编程基础的技术人员,技术人员可借助DuckDB,翻倍提高效率。

查询每个省份上市企业数量。并使用中国地图展示数据。(数据截至2023-04-21)

直接打开即可:https://tooli.fun/duckdb_shell

step2:导入数据,并确认数据结构

输入命令并回车: .files add

在弹出的文件选择框选择要导入的数据集(csv文件或者parquet文件等)。

查看导入结果: .files list

select * from 'tmp_dim_company_simple.csv' limit 3;

step3:生成SQL,查询数据

你是一个高级数据分析师,精通各种类型数据库的SQL语法,特别是DuckDB的SQL语法。你将会得到一份数据集的前3行数据,你需要根据数据头和数据内容去理解数据结构,同时需要根据上级的需求,生成一条DuckDB的SQL语句来从该数据集查询数据。

    ## 以下是各个数据集的结构说明
    ### 数据集1:
    文件名称:tmp_dim_company_simple.csv
    前3行数据:
duckdb> select * from tmp_dim_company_simple.csv limit 3;
┌───────────┬─────────┬───────────┬─────────────────────┬─────────┬─────────┐
│ column0   ┆ column1 ┆ column2   ┆ column3             ┆ column4 ┆ column5 │
╞═══════════╪═════════╪═══════════╪═════════════════════╪═════════╪═════════╡
│ 000001.SZ ┆ SZSE    ┆ 1940590.0 ┆ 1987-12-22T00:00:00 ┆ 广东      ┆ 深圳市     │
│ 000002.SZ ┆ SZSE    ┆ 1162540.0 ┆ 1984-05-30T00:00:00 ┆ 广东      ┆ 深圳市     │
│ 000003.SZ ┆ SZSE    ┆   40012.0 ┆ 1988-03-10T00:00:00 ┆ 广东      ┆ 深圳市     │
└───────────┴─────────┴───────────┴─────────────────────┴─────────┴─────────┘
    上级的需求:查询各个省份的上市公司数量

SELECT 
    column4 AS province, 
    COUNT(*) AS company_count
FROM 'tmp_dim_company_simple.csv'
GROUP BY column4
ORDER BY company_count DESC;

但此时数据仅仅是文本显示,我们需要将查询结果进行格式化并导出。于是需要调整下生成的SQL;

step4:优化SQL并导出数据


COPY (
  SELECT 
      column4 AS province, 
      COUNT(*) AS company_count
  FROM 'tmp_dim_company_simple.csv'
  GROUP BY column4
  ORDER BY company_count DESC
) TO 'output/company_count_by_province.csv' (HEADER, DELIMITER ',');

执行SQL,查看导出结果并下载文件。

step5:整理并绘制数据图表

打开工具:中国地图数据投影

下载图标示例数据,根据图表数据格式要求,将下载的数据集合的头部无效数据去掉。并将“香港特别行政区”改为“香港”。 保存文件。最终数据格式:

广东,844
浙江,664
江苏,630
北京,460
上海,430
山东,283
四川,176
福建,175
安徽,160
湖


🔗 原文链接: 点击阅读原文

标签: AI 人工智能 技术博客
最后更新:2026年4月1日

daozi

这个人很懒,什么都没留下

点赞
< 上一篇
下一篇 >

文章评论

razz evil exclaim smile redface biggrin eek confused idea lol mad twisted rolleyes wink cool arrow neutral cry mrgreen drooling persevering
取消回复
搜索
联系方式

QQ群:179730949
QQ群:114559024
欢迎您加入Android大家庭
本人QQ:136049925

赐我一丝安慰
给我一点鼓励

COPYRIGHT © 2023 魅力程序猿. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang

豫ICP备15000477号