← 算子目录

Softmax

activation

Softmax over attention scores; numerically stable form

公式

FLOPs
5 * batch * heads * seq * seq
Bytes
2 * batch * heads * seq * seq

使用此算子的模型 (0)

尚无模型在算子拆解中引用此算子。