Sequence_Models

现实中很多数据其实都有时序结构的

比如预测股价(根据近几年的股价信息),文本的理解(文本和上下文有关系,计算机要理解文本的文字就得结合上下文的信息)……故音乐、语言、文本和视频都是连续的

序列模型

前置知识

条件概率

条件概率表示为,读作“A在B发生的条件下发生的概率”

联合概率表示两个事件共同发生的概率。A与B的联合概率表示为或者

些许统计工具

在时间 观察到 ,那么得到 个不独立的随机变量

其中 为在条件下发生 的概率

模型建立

img

对条件概率建模

马尔可夫假设

img

假设当前数据只和过去 个数据点有关(不然数据量大的话,每一个点都和前面所有点有关联计算量过于庞大,有时候实际情况也是并不一定和很久之前的信息点有关系)

潜变量模型

引入潜变量 来表示过去信息

这样

img

每一个旧的 都会合成一个新的 ,然后旧的 和新合成的 共同合成新的 ,如图所示

PS:感觉很像动态规划,极大减小了计算量