LanguageModel Posted on 2024-09-05 Word count in article: 300 Reading time ≈ 1 mins. 语言模型给定文本序列 ,语言模型的目标是估计联合概率 应用:预训练模型如 BERT,GPT生成文本,给定前面几个词,不断的使用 来生成后续文本判断多个序列中哪个更常见使用计数建模若序列长度为2 , 预测n为总词数(即为词库中所有词的数量, , 是单个单词和连续单词对 的出现次数序列长度3同理N元语法当序列很长,因为文本量不够大,很可能 使用马尔科夫假设缓解问题 一元语法: 此语法其实有点像各事件相对独立的概率乘积二元语法三元语法同理