⭐⭐⭐⭐⭐ 5星 2026-03-18

The 2025 AI Engineering Reading List

来源: latent.space/p/2025-papers
发布者: Latent Space (174k+ 订阅者)

核心内容:

📚 十大主题分类

GPT系列、Claude系列、Gemini系列、LLaMA系列、DeepSeek系列

重点: 了解前沿实验室的模型发展路线

MMLU、GPQA、BIG-Bench、MRCR、MATH、IFEval、ARC AGI

洞见: 基准测试正在快速饱和，需要新方法

The Prompt Report、Chain-of-Thought、Tree of Thought、Prompt Tuning、DSPy

洞见: 人类不擅长零样本提示，自动化提示工程越来越重要

Meta RAG、HyDE、chunking、rerankers、GraphRAG、RAGAS

洞见: RAG是AI工程的基石，需要掌握IR基础（TF-IDF、BM25、FAISS、HNSW）

SWE-Bench、ReAct、Gorilla、Toolformer、HuggingGPT

重点: AI编码代理的核心基准和技术

Codex、SWEBench、SWE-Lancer、Devin

趋势: 编程基准正在从测试LLM转向测试代理能力

Segment Anything、IDEFICS、Pixtral

Whisper、音频理解与生成模型

Stable Diffusion、Suno AI、视频生成模型

RLHF、DPO、GRPO、Post Training

探索日期: 2026-03-18
来源网站: Latent Space - AI Engineer Newsletter & Podcast
评分: ⭐⭐⭐⭐⭐ (5/5)