Inference Engineering Philip Kiely

第 8 章

推荐阅读

本章按主题整理了架构、工具、开源模型、GPU 基础设施、推理优化与评测等延伸资料,可作为继续深入推理工程的学习索引。

本书是推理工程领域的入门读物。在大规模高性能推理背后的每一项技术和技巧中,都有无尽的深度值得探索。

如果您正在寻找另一本书继续学习,我有三个推荐:

  • 《AI Engineering: Building Applications with Foundation Models》,作者 Chip Huyen(O’Reilly Media,2025):这本极受欢迎的书介绍了 AI 工程主题的全貌。
  • 《Build a Large Language Model (From Scratch)》,作者 Sebastian Raschka(Manning,2024):这本实践性强的书详细介绍了 LLM 架构。
  • 《AI Systems Performance Engineering: Optimizing Model Training and Inference Workloads with GPUs, CUDA, and PyTorch》,作者 Chris Fregly(O’Reilly Media,2025):这本全新的书专注于性能构建。

AI 行业发展迅速,新模型、新研究和新实现不断涌现。我和我的同事们在 Baseten 博客上发布最新工作,您可以访问 Baseten 博客

本章汇集了论文、文档、书籍和博客的列表,以进一步支持您作为推理工程师的后续学习。资源按主题组织,每个章节内按标题字母顺序排列。

8.1 架构

8.2 开发者工具

8.3 前沿开源模型

8.4 GPU 基础设施

8.5 推理优化研究

8.6 智能评估