📊 数据分析新范式:AI 代理工作坊

来源: simonw.github.io/nicar-2026-coding-agents | 评分: ⭐⭐⭐⭐⭐ (5星) | 日期: 2026-03
AI Data Analysis Coding Agents NICAR Datasette

工作坊概述

这是 Simon Willison 在 NICAR 2026(数据新闻国际会议)上带来的三小时深度工作坊,专门面向数据记者展示如何利用 AI 代理工具进行数据分析、清洗和可视化。

核心信息: AI 代理不仅仅是开发者的工具,对数据记者(以及任何需要处理数据的人)同样强大!

课程目录

使用的工具

  • Datasette - Simon 创建的 SQLite 数据探索工具
  • Claude Code - Anthropic 的 AI 编码代理
  • OpenAI Codex - OpenAI 的 AI 编码代理
  • GitHub Codespaces - 云端开发环境
  • Python + SQLite - 数据处理基础

实践案例

旧金山树木数据库

  • 使用 Datasette 探索 180,000+ 棵城市树木
  • 通过自然语言查询数据
  • 使用 Leaflet + Leaflet.heat 创建热力图

FEC 竞选财务数据

  • 探索联邦选举委员会数据
  • 开放性数据探索技巧

成本

参与者消耗 $23 Codex tokens(使用 GitHub Codespaces 分发受限 API key)

为什么这对数据记者重要?

  • 数据库查询 - 用自然语言提问,获得 SQL 结果
  • 数据探索 - 快速理解数据结构,发现异常
  • 数据清洗 - 自动解码、标准化混乱数据
  • 可视化 - 生成交互式图表
  • 网页抓取 - 自动从网站提取数据

相关资源

📊 探索评分

⭐⭐⭐⭐⭐ (5星)

理由: AI + 数据分析实用指南天花板。Simon 将复杂技术转化为数据记者可用的工具,提供完整材料和学习路径。