@jreuben1: Speech and Language Processing(第3版草案)Dan Jurafsky 和 James H. Martin https://web.stanford.edu/~jurafsky/slp3…

X AI KOLs Following 新闻

摘要

2026年1月6日发布的《Speech and Language Processing》第3版草案由Dan Jurafsky和James H. Martin撰写,采用了修订后的结构,重点关注大型语言模型并更新了章节。

Speech and Language Processing(第3版草案) Dan Jurafsky 和 James H. Martin https://t.co/mUQJljpK0x - 看起来第二版的大部分内容现在都放在了附录中! https://t.co/voptdiKCDA
查看原文
查看缓存全文

缓存时间: 2026/06/20 14:37

语音与语言处理(第三版草案)

Dan Jurafsky 和 James H. Martin https://t.co/mUQJljpK0x - 看起来第二版的大部分内容现在都移到了附录中! https://t.co/voptdiKCDA


语音与语言处理

来源:https://web.stanford.edu/~jurafsky/slp3/

语音与语言处理(第三版草案)Dan Jurafsky (http://web.stanford.edu/people/jurafsky/) 和 James H. Martin (http://www.cs.colorado.edu/~martin/)

这是我们的2026年1月6日版本!

本次发布主要是清理和修复bug的版本,并在多个章节中更新了Transformer相关插图。八月份的版本做了更大的改动,包括第9章中的DPO、全新的ASR和TTS章节、重构的LLM章节以及第2章中的Unicode。以下是各独立章节和更新的幻灯片。

这里是2026年1月6日版本的单一PDF文件!(https://web.stanford.edu/~jurafsky/slp3/ed3book_jan26.pdf)

  1. 欢迎在您的课堂上自由使用这些草稿章节和幻灯片,可以打印出来等等,您提供的反馈让这本书变得更好!
  2. 非常欢迎指出拼写错误和提出意见(只需发送邮件至 [email protected],并告知草案的日期)!(无需报告因跨章节交叉引用问题导致的缺失引用,这些在全书草案中已修复)
  3. 感恩! 我们在这里(https://web.stanford.edu/~jurafsky/slp3/thanks.html)列出了一份名单,感谢那些为改进本书提供了许多绝妙建议和bug修复的优秀人士。我们非常感谢大家的帮助,没有你们就不会有这本书!
  4. 如何引用本书:Daniel Jurafsky 和 James H. Martin。2026年。《语音与语言处理:自然语言处理、计算语言学以及基于语言模型的语音识别引论》,第三版。2026年1月6日发布的在线手稿。https://web.stanford.edu/~jurafsky/slp3。
  5. 本书的 BibTeX 条目 在这里(https://web.stanford.edu/~jurafsky/slp3/jm3.bib)。@Book{jm3, author = "Daniel Jurafsky and James H. Martin", title = "Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, with Language Models", year = "2026", url = {https://web.stanford.edu/~jurafsky/slp3/}, note = "Online manuscript released January 6, 2026", edition = "3rd", }
  6. 这本书什么时候完成? 别问了。
  7. 如果您需要之前的2025年8月草案章节,请点击此处(https://web.stanford.edu/~jurafsky/slp3/old_aug25/);如果您需要之前的2025年1月草案章节,请点击此处(https://web.stanford.edu/~jurafsky/slp3/old_jan25/)。

第一卷:大型语言模型 章节 幻灯片 1: 引言 2: 单词与词元 (https://web.stanford.edu/~jurafsky/slp3/2.pdf) 2: 单词与词元 [pptx (https://web.stanford.edu/~jurafsky/slp3/slides/tokens_jan26.pptx)] [pdf (https://web.stanford.edu/~jurafsky/slp3/slides/tokens_jan26.pdf)] 2: 编辑距离 [pptx (https://web.stanford.edu/~jurafsky/slp3/slides/med24.pptx)] [pdf (https://web.stanford.edu/~jurafsky/slp3/slides/med24.pdf)] 3: N-gram 语言模型 (https://web.stanford.edu/~jurafsky/slp3/3.pdf) 3: [pptx (https://web.stanford.edu/~jurafsky/slp3/slides/lm_jan25.pptx)] [pdf (https://web.stanford.edu/~jurafsky/slp3/slides/lm_jan25.pdf)] 4: 逻辑回归与文本分类 (https://web.stanford.edu/~jurafsky/slp3/4.pdf) 4: [pptx (https://web.stanford.edu/~jurafsky/slp3/slides/logreg25aug.pptx)] [pdf (https://web.stanford.edu/~jurafsky/slp3/slides/logreg25aug.pdf)] 5: 嵌入 (https://web.stanford.edu/~jurafsky/slp3/5.pdf) 5: [pptx (https://web.stanford.edu/~jurafsky/slp3/slides/vector25aug.pptx)] [pdf (https://web.stanford.edu/~jurafsky/slp3/slides/vector25aug.pdf)] 6: 神经网络 (https://web.stanford.edu/~jurafsky/slp3/6.pdf) 6: [pptx (https://web.stanford.edu/~jurafsky/slp3/slides/nn25aug.pptx)] [pdf (https://web.stanford.edu/~jurafsky/slp3/slides/nn25aug.pdf)] 7: 大型语言模型 (https://web.stanford.edu/~jurafsky/slp3/7.pdf) 7: [pptx (https://web.stanford.edu/~jurafsky/slp3/slides/llm25aug.pptx)] [pdf (https://web.stanford.edu/~jurafsky/slp3/slides/llm25aug.pdf)] 8: Transformer (https://web.stanford.edu/~jurafsky/slp3/8.pdf) 8: [pptx (https://web.stanford.edu/~jurafsky/slp3/slides/transformer_jan26.pptx)] [pdf (https://web.stanford.edu/~jurafsky/slp3/slides/transformer_jan26.pdf)] 9: 后训练:指令微调、对齐与测试时计算 (https://web.stanford.edu/~jurafsky/slp3/9.pdf) 10: 掩码语言模型 (https://web.stanford.edu/~jurafsky/slp3/10.pdf) 10: [pptx (https://web.stanford.edu/~jurafsky/slp3/slides/mlmjan25.pptx)] [pdf (https://web.stanford.edu/~jurafsky/slp3/slides/mlmjan25.pdf)] 11: 信息检索与检索增强生成 (https://web.stanford.edu/~jurafsky/slp3/11.pdf) 11: [pptx (https://web.stanford.edu/~jurafsky/slp3/slides/ir_nov25.pptx)] [pdf (https://web.stanford.edu/~jurafsky/slp3/slides/ir_nov25.pdf)] 12: 机器翻译 (https://web.stanford.edu/~jurafsky/slp3/12.pdf) 13: RNN 与 LSTM (https://web.stanford.edu/~jurafsky/slp3/13.pdf) 13: [pptx (https://web.stanford.edu/~jurafsky/slp3/slides/rnnjan25.pptx)] [pdf (https://web.stanford.edu/~jurafsky/slp3/slides/rnnjan25.pdf)] 14: 语音学与语音特征提取 (https://web.stanford.edu/~jurafsky/slp3/14.pdf) 15: 自动语音识别 (https://web.stanford.edu/~jurafsky/slp3/15.pdf) 16: 文本转语音 (https://web.stanford.edu/~jurafsky/slp3/16.pdf)

第二卷:标注语言结构 章节 幻灯片 17: 词性与命名实体的序列标注 (https://web.stanford.edu/~jurafsky/slp3/17.pdf) 17: (仅引言) [pptx (https://web.stanford.edu/~jurafsky/slp3/slides/8_POSNER_intro_May_6_2021.pptx)] [pdf (https://web.stanford.edu/~jurafsky/slp3/slides/8_POSNER_intro_May_6_2021.pdf)] 18: 上下文无关文法与成分句法分析 (https://web.stanford.edu/~jurafsky/slp3/18.pdf) 19: 依存句法分析 (https://web.stanford.edu/~jurafsky/slp3/19.pdf) 20: 信息抽取:关系、事件与时间 (https://web.stanford.edu/~jurafsky/slp3/20.pdf) 21: 语义角色标注与论元结构 (https://web.stanford.edu/~jurafsky/slp3/21.pdf) 22: 情感、情感与内涵词典 (https://web.stanford.edu/~jurafsky/slp3/22.pdf) 23: 指代消解与实体链接 (https://web.stanford.edu/~jurafsky/slp3/23.pdf) 24: 篇章连贯性 (https://web.stanford.edu/~jurafsky/slp3/24.pdf) 25: 对话及其结构 (https://web.stanford.edu/~jurafsky/slp3/25.pdf)

附录(将仅放在网上) A: 隐马尔可夫模型 (https://web.stanford.edu/~jurafsky/slp3/A.pdf) B: 朴素贝叶斯分类 (https://web.stanford.edu/~jurafsky/slp3/B.pdf) B: [pptx (https://web.stanford.edu/~jurafsky/slp3/slides/nb24aug.pptx)] [pdf (https://web.stanford.edu/~jurafsky/slp3/slides/nb24aug.pdf)] C: Kneser-Ney 平滑 (https://web.stanford.edu/~jurafsky/slp3/C.pdf) D: 拼写校正与噪声信道 (https://web.stanford.edu/~jurafsky/slp3/D.pdf) E: 统计成分句法分析 (https://web.stanford.edu/~jurafsky/slp3/E.pdf) F: 上下文无关文法 (https://web.stanford.edu/~jurafsky/slp3/F.pdf) G: 组合范畴文法 (https://web.stanford.edu/~jurafsky/slp3/G.pdf) H: 句子意义的逻辑表示 (https://web.stanford.edu/~jurafsky/slp3/H.pdf) I: 词义与WordNet (https://web.stanford.edu/~jurafsky/slp3/I.pdf) J: PPMI (https://web.stanford.edu/~jurafsky/slp3/J.pdf) K: 基于框架的对话系统 (https://web.stanford.edu/~jurafsky/slp3/K.pdf)

相似文章

CS336:从零开始的语言建模

Hacker News Top

斯坦福大学提供一门综合课程CS336,学生将从零开始构建语言模型,涵盖数据收集、Transformer构建、训练和评估。