MoeTokenPermuteWithEpGrad

产品支持情况

算子功能：aclnnMoeTokenPermuteWithEp的反向传播计算。

计算公式：

s o r t e d I n d i c e s = s o r t e d I n d i c e s [r a n g e O p t i o n a l [0] < = i < r a n g e O p t i o n a l [1]]

t o k e n G r a d O u t = p e r m u t e d T o k e n s O u t p u t G r a d . i n d e x S e l e c t (0, s o r t e d I n d i c e s)

t o k e n G r a d O u t = t o k e n G r a d O u t . r e s h a p e (- 1, n u m T o p k, h i d d e n S i z e)

t o k e n G r a d O u t = t o k e n G r a d O u t . s u m (d i m = 1)

参数名	输入/输出/属性	描述	数据类型	数据格式
permutedTokensOutputGrad	输入	正向输出permutedTokens的梯度，公式中的`permutedTokensOutputGrad`。	BFLOAT16、FLOAT16、FLOAT32	ND
sortedIndices	输入	正向输出的permuteTokensOut和正向输入的tokens的映射关系，公式中的`sortedIndices`。	INT32	ND
permutedProbsOutputGradOptional	输入	可选计算输入，与计算输出probsGradOut对应，传入空则不输出probsGradOut。	BFLOAT16、FLOAT16、FLOAT32	ND
numTopk	属性	被选中的专家个数。	INT64	-
rangeOptional	属性	ep切分的有效范围。	aclIntArray	-
paddedMode	属性	true表示开启paddedMode，false表示关闭paddedMode，目前仅支持false。	BOOL	-
tokenGradOut	输出	输入token的梯度。	BFLOAT16、FLOAT16、FLOAT32	ND
probsGradOut	输出	输入probs的梯度。	FLOAT、FLOAT16、BFLOAT16	ND

numTopk <= 512。
不支持paddedMode为True。
当rangeOptional为空时，忽略permutedProbsOutputGradOptional和probsGradOut，执行逻辑回退到aclnnMoeTokenPermuteGrad。

调用方式	样例代码	说明
aclnn接口	test_aclnn_moe_token_permute_with_ep_grad.cpp	通过aclnnMoeTokenPermuteWithEpGrad接口方式调用MoeTokenPermuteWithEpGrad算子。