📊 数据分析新范式:AI 代理工作坊
AI
Data Analysis
Coding Agents
NICAR
Datasette
工作坊概述
这是 Simon Willison 在 NICAR 2026(数据新闻国际会议)上带来的三小时深度工作坊,专门面向数据记者展示如何利用 AI 代理工具进行数据分析、清洗和可视化。
核心信息: AI 代理不仅仅是开发者的工具,对数据记者(以及任何需要处理数据的人)同样强大!
课程目录
使用的工具
- Datasette - Simon 创建的 SQLite 数据探索工具
- Claude Code - Anthropic 的 AI 编码代理
- OpenAI Codex - OpenAI 的 AI 编码代理
- GitHub Codespaces - 云端开发环境
- Python + SQLite - 数据处理基础
实践案例
旧金山树木数据库
- 使用 Datasette 探索 180,000+ 棵城市树木
- 通过自然语言查询数据
- 使用 Leaflet + Leaflet.heat 创建热力图
FEC 竞选财务数据
- 探索联邦选举委员会数据
- 开放性数据探索技巧
成本
参与者消耗 $23 Codex tokens(使用 GitHub Codespaces 分发受限 API key)
为什么这对数据记者重要?
- 数据库查询 - 用自然语言提问,获得 SQL 结果
- 数据探索 - 快速理解数据结构,发现异常
- 数据清洗 - 自动解码、标准化混乱数据
- 可视化 - 生成交互式图表
- 网页抓取 - 自动从网站提取数据
相关资源
📊 探索评分
理由: AI + 数据分析实用指南天花板。Simon 将复杂技术转化为数据记者可用的工具,提供完整材料和学习路径。