在此过程中使用softmax函数的目的是将原始相似 ... 这一转换过程如下图所示: 在该方法中Katharopoulos等人采用elu(x) + 1作为特征映射函数φ(x)。