专用加速器

LSTM单元的输入和输出都连接在一起，所以三个输入输出对的大小必须相同。LSTM单元内部有足够的依赖关系，所有输入和输出通常都是相同的大小，假设它们的大小都相同，称为 $Dim_{LSTM}$ 。除此之外，向量矩阵乘法的大小也有不同。因为连接了所有三个输入，用到的参数维度为 $3Dim_{LSTM} × Dim_{LSTM}$ ；因为将输入与短期内存输入连接起来作为向量，输入乘法的向量维度为 $2Dim_{LSTM} × Dim_{LSTM}$ ；最后的按位乘法向量的维度为 $Dim_{LSTM} × Dim_{LSTM}$
现在可以计算权重和操作了：
- 每个单元格的权重数： $3(3Dim_{LSTM}×Dim_{LSTM}) + (2Dim_{LSTM}×Dim_{LSTM}) + (1Dim_{LSTM}×Dim_{LSTM}) = 12Dim_{LSTM}^2$
- 每个单元格的5个向量矩阵乘法的运算次数： $2 ×$ 每个单元格的权重数 $= 24 × Dim_{LSTM}^2$
- 3次按位乘法和1次加法运算次数（向量都是输出的大小）： $4 × Dim_{LSTM}$
- 每个单元格的操作总数： $24 × Dim_{LSTM}^2 + 4 × Dim_{LSTM}$
- 操作数/权重数：2

本章内容