MoeFusedTopk

产品支持情况

算子功能：MoE计算中，对输入x做Sigmoid计算，对计算结果分组进行排序，最后根据分组排序的结果选取前k个专家。
计算公式：

对输入做sigmoid：
$s i g m o i d R e s = s i g m o i d (x)$
加上addNum：
$n o r m O u t = s i g m o i d R e s + a d d N u m$
对计算结果按照groupNum进行分组，每组按照topN的sum值对group进行排序，取前groupTopk个组：
$g r o u p O u t, g r o u p I d = T o p K (R e d u c e S u m (T o p K (S p l i t (n o r m O u t, g r o u p C o u n t), k = 2, d i m = - 1), d i m = - 1), k = k G r o u p)$
根据上一步的groupId获取normOut中对应的元素，将数据再做TopK，得到indices的结果：
$n o r m Y, i n d i c e s = T o p K (n o r m O u t [g r o u p I d, :], k = k)$
根据indices从sigmoidRes中选出y:
$y = g a t h e r (s i g m o i d R e s, i n d i c e s)$
如果isNorm为true，对y按照输入的scale参数进行计算，得到y的结果：
$y = y / (R e d u c e S u m (y, d i m = - 1)) * s c a l e$
如果enableExpertMapping为true，再将indices中的物理专家按照输入的mappingNum和mappingTable映射到逻辑专家，得到输出的indices。

参数名	输入/输出/属性	描述	数据类型	数据格式
x	输入	每个token对应各个专家的分数，对应公式中的`x`。	FLOAT16、BFLOAT16、FLOAT32	ND
addNum	输入	与输入x进行计算的偏置值，对应公式中的`addNum`。	FLOAT16、BFLOAT16、FLOAT32	ND
mappingNum	输入	`enableExpertMapping`为false时不启用，每个物理专家被实际映射到的逻辑专家数量。	INT32	ND
mappingTable	输入	`enableExpertMapping`为false时不启用，每个物理专家/逻辑专家映射表。	INT32	ND
groupNum	属性	分组数量。	UINT32	-
groupTopk	属性	被选择的组的数量。	UINT32	-
topN	属性	组内选取的用于求和的专家数量。	UINT32	-
topK	属性	最终选取的专家数量。	UINT32	-
activateType	属性	激活类型，当前只支持0(ACTIVATION_SIGMOID)。	UINT32	-
isNorm	属性	是否对输出进行归一化。	BOOL	-
scale	属性	归一化后的系数乘。	FLOAT	-
enableExpertMapping	属性	是否使能物理专家到逻辑专家的映射。	BOOL	-
y	输出	输出每个token的topK分数，对应公式中的`y`。	FLOAT32	ND
indices	输出	topK个专家和tokens的映射关系，对应公式中的`indices`。	INT32	ND

调用方式	样例代码	说明
aclnn接口	test_aclnn_moe_fused_topk	通过aclnnMoeFusedTopk接口方式调用MoeFusedTopk算子。