算子列表

使用说明：

算子目录：目录名为算子名小写下划线形式，每个目录承载该算子所有交付件，包括代码实现、examples、文档等，目录介绍参见项目目录。

算子执行硬件单元：大部分算子运行在AI Core，少部分算子运行在AI CPU。默认情况下，项目中提到的算子一般指AI Core算子。关于AI Core和AI CPU详细介绍参见《Ascend C算子开发》中“概念原理和术语 > 硬件架构与数据处理原理”。

算子接口列表：为方便调用算子，CANN提供一套C API执行算子，一般以aclnn为前缀，全量接口参见aclnn列表。

V版本演进说明：部分算子存在多个V版本，使用时选择最高V版本即可（高版本算子已兼容低版本算子的所有能力）。

项目提供的所有算子分类和算子列表如下：

算子分类	算子目录	算子实现		aclnn调用	图模式调用	算子执行硬件单元	说明
算子分类	算子目录	op_kernel	op_host	op_api	op_graph	算子执行硬件单元	说明
math	abs	√	√	√	√	AI Core	为输入张量的每一个元素取绝对值。
math	accumulate_nv2	√	√	√	√	AI Core	对多个相同形状、相同数据类型的输入张量进行逐元素累加，输出累加后的张量。
math	acos	√	√	√	√	AI CORE/AI CPU	该算子对输入的每个元素进行反余弦操作后输出。
math	acosh	×	×	×	×	AI CORE/AI CPU	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
math	acos_grad	√	√	×	√	AI CORE	计算Acos算子的反向梯度，公式 z = -dy / sqrt(1 - y²)。
math	add	√	√	√	√	AI CORE/AI CPU	该算子用于完成加法计算。
math	add_lora	√	√	×	√	AI Core	将输入x根据输入索引indices，分别和对应的weightA，weightB相乘，然后将结果累加到输入y上并输出。
math	add_mat_mat_elements	√	√	×	√	AI Core	对输入张量a、b进行逐元素相乘后，与输入张量c按标量alpha、beta进行加权求和，并输出结果张量cOut。
math	add_n	√	√	√	√	AI Core/AI CPU	对输入进行主元素相加求和操作。
math	addcdiv	√	√	√	√	AI Core/AI CPU	张量运算函数，用于执行乘除加组合操作，将张量除法（带缩放）+ 张量加法合并为单个操作。
math	addcmul	√	√	√	√	AI Core	张量运算函数，用于执行乘除加组合操作，将张量乘法（带缩放）+ 张量加法合并为单个操作。
math	addr	√	√	√	√	AI Core	求一维向量vec1和vec2的外积得到一个二维矩阵，并将外积结果矩阵乘一个系数后和自身乘系数相加后输出。
math	adjacent_difference	√	√	×	√	AI Core	比较输入张量相邻元素的差异，若相邻元素相同，返回0，否则返回1。
math	affine_grid
math	angle_v2	√	√	×	√	AI Core	为输入张量的每一个元素取角度（单位：弧度）。
math	arg_max_v2	√	√	√	√	AI Core	返回张量在指定维度（dim）上的最大值的索引，并保存到out张量中。
math	arg_max_with_value	√	√	√	√	AI Core	返回Tensor指定维度的最大值及其索引位置。最大值保存到out中，最大值的索引保存到indices中。如果keepdim为false，则不保留对应的轴；如果为true，则保留指定轴的维度值为1。
math	arg_min	√	√	√	√	AI Core	返回tensor中指定轴的最小值索引，并保存到out中。如果keepdim为false，则不保留对应的轴；如果为true，则保留指定轴的维度值为1。
math	arg_min_with_value	√	√	√	√	AI Core	返回self中指定维度的最小值及其索引位置。最小值保存到out中，最小值的索引保存到indices中。如果keepdim为false，则不保留对应的轴；如果为true，则保留指定轴的维度值为1。
math	asin	√	√	√	√	AI Core/AI CPU	该算子对输入的每个元素进行反正弦操作后输出。
math	asinh	√	√	√	√	AI Core/AI CPU	该算子对输入Tensor中的每个元素进行反双曲正弦操作后输出。
math	asin_grad	√	√	×	√	AI Core	Asin（反正弦）算子的反向计算，根据正向输入x和上游梯度dy，计算输入梯度dx。
math	asinh_grad	√	√	×	√	AI Core	Asinh（反双曲正弦）算子的反向计算，根据正向输入y和上游梯度dy，计算输入梯度dx。
math	assign_add	√	√	×	√	AI CPU	该算子完成在原有tensor上的加法计算。
math	assign_sub	√	√	×	√	AI CPU	该算子完成在原有tensor上的减法计算。
math	atan	√	√	√	√	AI Core/AI CPU	该算子对输入的每个元素进行反正切操作后输出。
math	atan2	×	×	×	×	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
math	atanh	√	√	√	√	AI Core/AI CPU	计算逆双曲正切（inverse hyperbolic tangent），支持FLOAT、FLOAT16、BF16数据类型。
math	atan_grad	√	√	×	√	AI Core	Atan（反正切）算子的反向计算，根据正向输入x和上游梯度dy，计算输入梯度dx，用于神经网络反向传播。
math	axpy	√	√	√	√	AI Core	源操作数中每个元素与标量求积后和目的操作数中的对应元素相加。
math	axpy_v2	√	√	√	√	AI Core	源操作数中每个元素与张量求积后和目的操作数中的对应元素相加。
math	bias_add	√	√	√	√	AI Core	偏置加法。
math	bias_add_grad	√	√	×	√	AI Core	计算偏置的梯度。
math	bincount	√	√	√	√	AI Core	计算非负整数数组中每个数的频率。
math	bitwise_and	√	√	√	√	AI Core	计算输入tensor中每个元素和输入标量的按位与结果。输入的tensor与other必须是整型或者BOOL型变量。当输入为BOOL时，计算逻辑与的结果。
math	bitwise_not	×	×	×	×	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
math	bitwise_or	√	√	√	√	AI Core	计算输入张量self中每个元素和输入标量other的按位或。输入self和other必须是整数或布尔类型，对于布尔类型，计算逻辑或。
math	bitwise_xor	×	×	×	×	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
math	cast	√	√	√	√	AI Core/AI CPU	将输入tensor转换为指定的dtype类型。
math	cdist						该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
math	cdist_grad						该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
math	ceil	√	√	√	√	AI CPU	该算子用于返回输入Tensor中每个元素向上取整的结果。
math	cholesky
math	complex	×	×	×	×	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
math	complex_abs
math	cos	√	√	√	√	AI Core	返回输入张量元素进行余弦操作后的结果。
math	cosh	√	√	√	√	AI Core/AI CPU	返回输入张量元素进行的双曲余弦值结果。
math	cross	√	√	×	√	AI CPU	该算子对输入Tensor完成linear_cross运算。
math	cummax	×	×	√	√	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
math	cummin	×	×	×	×	AI Core	计算Tensor（A）中每个元素和Tensor（B）中对应位置的元素的按位或。
math	cumprod	×	×	×	×	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
math	cumsum	√	√	√	√	AI CPU	该算子对输入张量self的元素，按照指定维度dim依次进行累加。
math	cumsum_cube	×	×	×	×	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
math	diag_part	√	√	×	√	AI Core	获取输入张量对角线元素。
math	digamma
math	div	×	×	×	×	AI Core	张量除法计算。
math	truncate_div	√	√	√	√	AI Core	完成截断除法计算，结果向零取整。
math	div_no_nan	√	√	×	√	AI Core	张量除法计算, 在分母可能为0的情况下，可以帮助避免由于分母为0导致的NaN值问题。
math	dot	√	√	√	√	AI Core	计算两个输入一维张量的点积结果。
math	eltwise	√	√	×	√	AI Core	对1~32个同shape、同dtype的输入张量执行逐元素操作，支持PRODUCT（逐元素乘积）、SUM（逐元素加权求和）、MAX（逐元素取最大值）三种计算模式。
math	equal	√	√	√	√	AI CPU	该算子计算两个Tensor是否有相同的大小和元素。
math	erf	√	√	√	×	AI Core	返回输入张量中每个元素对应的误差函数的值。
math	erfc	×	×	×	×	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
math	exp	√	√	√	√	AI CORE/AI CPU	返回一个新的张量，该张量的每个元素都是输入张量对应元素的指数。
math	exp_segsum_grad	√	√	√	×	AI Core	Segsum的反向计算。
math	expand	√	√	×	√	AI CORE/AI CPU	将输入tensor广播到指定的shape。
math	expm1	√	√	√	×	AI Core	以输入张量为指数，计算自然常数e的幂，并对指数计算结果进行减1计算。对于输入张量取值较小的场景，提供比直接用公式计算结果更高的精度。
math	eye	√	√	√	√	AI Core	返回一个对角线值为1其余位置为0的二维张量。
math	floor	√	√	√	√	AI Core	返回输入Tensor中每个元素向下取整，并将结果回填到输入Tensor中。
math	floor_div	√	√	√	√	AI Core	完成除法计算，对结果向下取整。
math	floor_mod	√	√	√	√	AI Core	计算两个输入张量的逐元素模运算。
math	fused_mul_add	√	√	×	√	AI Core	三元逐元素融合算子，将Mul、Add融合为单次计算，公式 y = x1 * x2 + x3。
math	fused_mul_add_add	√	√	×	√	AI Core	四元逐元素融合算子，将Mul、Add、Add融合为单次计算，公式 y = x1 * x2 + x3 + x4。
math	fused_mul_add_n	√	√	×	√	AI Core	将mul和addn算子进行融合，要求addn的n为2，mul的其中一个输入必须是scalar或者只包含一个数的tensor。
math	gcd	×	×	×	×	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
math	ger	×	×	×	×	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
math	greater	√	√	√	√	AI CPU	该算子用于判断输入Tensor中的每个元素是否大于other Scalar的值。
math	greater_equal	√	√	√	√	AI Core/AI CPU	返回一个BOOL类型的张量，里面每一个值代表输入张量对应位置值是否大于等于另一个张量值或者scalar值。
math	approximate_equal	√	√	×	√	AI Core	逐元素近似相等校验算子，用于判断两个张量的对应元素是否在允许的误差范围内近似相等，输出布尔类型结果。
math	grouped_bias_add_grad	√	√	×	√	AI Core	分组偏置加法（GroupedBiasAdd）的反向计算。
math	hans_decode	√	√	×	√	AI Core	对压缩后的张量基于PDF进行解码，同时基于mantissa重组恢复张量。
math	hans_encode	√	√	×	√	AI Core	对输入张量指数位所在字节实现PDF统计，按PDF分布统计进行无损压缩。
math	histogram_v2	√	√	×	√	AI Core	计算张量直方图。
math	inv	√	√	x	√	AI Core	对输入张量的每一个元素计算其倒数。
math	inv_grad	√	√	×	√	AI Core	Inv（取倒数）算子的反向梯度，计算 y = -grad * x * x。
math	invert	√	√	×	√	AI Core	为输入张量的每一个元素取反。
math	is_close	√	√	√	√	AI Core	返回一个带有布尔元素的新张量，判断给定的self和other是否彼此接近，如果值接近，则返回True，否则返回False。
math	is_finite	√	√	√	√	AI Core	判断输入张量哪些元素是有限数值，即不是inf、-inf或nan。
math	is_inf	√	√	√	√	AI Core	判断张量中哪些元素是无限大值，即为inf、-inf。
math	is_nan	√	√	×	√	AI Core	判断张量中哪些元素是nan。
math	is_neg_inf	√	√	√	√	AI Core	判断输入张量的元素是否为负无穷。
math	is_pos_inf	√	√	√	√	AI Core	判断输入张量的元素是否为正无穷。
math	kl_div_v2	√	√	√	√	AI Core	计算KL散度。
math	left_shift	×	×	√	×	AI CPU	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
math	lerp	√	√	√	√	AI Core	根据给定的权重，在起始和结束Tensor之间进行线性插值，返回插值后的Tensor。
math	less	√	√	√	√	AI CPU	该算子用于判断输入self中的每个元素是否小于输入other的值。
math	less_equal	√	√	√	√	AI Core	判断输入self中的元素值是否小于等于other的值，并将self的每个元素的值与other值的比较结果写入out中。
math	lgamma
math	lin_space	√	√	×	√	AI Core/AI CPU	生成一个等间隔数值序列。创建一个大小为steps的1维向量，其值从start起始到stop结束（包含）线性均匀分布。
math	linalg_qr
math	log	√	√	√	√	AI CPU	该算子对输入张量x的元素，逐元素进行对数计算。
math	log1p	√	√	√	√	AI Core	对输入Tensor完成log1p运算。
math	log_add_exp	×	×	×	×	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
math	logdet
math	logical_and	√	√	√	√	AI Core	对两个输入张量的对应元素执行「与逻辑」判断，输出布尔型张量（True/False）。
math	logical_not	√	√	√	√	AI Core	计算给定输入Tensor的逐元素逻辑非。如果未指定输出类型，输出Tensor是bool类型。如果输入Tensor不是bool类型，则将零视为False，非零视为True。
math	logical_or	√	√	√	√	AI Core	完成给定输入张量元素的逻辑或运算。当两个输入张量为非bool类型时，0被视为False，非0被视为True。
math	logspace
math	masked_scale	×	×	×	×	AI Core	完成elementwise计算。
math	maximum	√	√	√	√	AI Core	返回两个输入张量中的最大值组成的新张量。
math	minimum	√	√	√	√	AI Core	返回两个输入张量中的最小值组成的新张量。
math	mod	√	√	√	√	AI Core	张量取余计算。
math	mul	√	√	√	√	AI Core	返回两个张量元素之间的乘积结果组成的新张量。
math	mul_addn	√	√	×	√	AI Core	实现N>=2个mul和addn融合计算，减少搬运时间和内存的占用。
math	mul_no_nan	√	√	×	√	AI Core	二元逐元素安全乘法，当乘数x2为0时结果返回0，避免0inf、0nan产生NaN污染。
math	muls	√	√	√	√	AI Core	返回输入张量元素与指定scalar值乘积组成的新张量。
math	nan_to_num	√	√	√	×	AI Core	将输入中的NaN、正无穷大和负无穷大值分别替换为nan、posinf、neginf指定的值。
math	ndtri	√	√	×	√	AI Core	逆标准正态累积分布函数（probit），对输入概率张量逐元素计算标准正态分位点。
math	neg	√	√	√	√	AI Core/AI CPU	计算每个元素的相反数。
math	non_finite_check	√	√	×	√	AI Core	检测输入tensor_list中是否存在非有限数值（NaN、Inf、-Inf）。
math	not_equal	√	√	√	√	AI CPU	该算子逐元素比较两个输入张量是否不相等。
math	one_hot	√	√	√	√	AI Core	将离散标签进行二进制编码转换。
math	ones_like	√	√	√	√	AI Core/AI CPU	返回形状和类型相同的张量，所有元素都设置为1。
math	pdist	×	×	×	×	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
math	polar	√	√	√	√	AI Core	构建一个复数张量，其元素为对应于极坐标的笛卡尔坐标，其中绝对值为abs，角度为angle。
math	pow	√	√	√	√	AI Core/AI CPU	根据输入指数和幂张量进行指数计算。
math	pows	√	√	×	√	AI Core	对input中的每个元素应用指数为exponent的幂运算。
math	precision_compare
math	q_r
math	range	√	√	√	√	AI Core	从start到end，按照step间隔长度生成等差数列组成的张量。
math	rank	×	√	×	√	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
math	real	√	√	√	√	AI CORE	返回复数张量的实部，若输入为实数张量则按原值返回。
math	real_div	√	√	×	√	AI CPU	该算子按元素逐个返回x1/x2的结果。
math	reciprocal	√	√	√	√	AI Core	返回一个具有每个输入元素倒数的新张量。
math	reduce_all	×	×	×	×	AI Core/AI CPU	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
math	reduce_any	×	×	×	×	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
math	reduce_log_sum	×	×	×	×	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
math	reduce_log_sum_exp	×	×	×	×	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
math	reduce_max	×	×	×	×	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
math	reduce_mean	√	√	×	√	AI CPU	该算子对一个多维向量按照指定的维度求平均值。
math	reduce_min	×	×	×	×	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
math	reduce_nansum	×	×	×	×	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
math	reduce_prod	×	×	×	×	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
math	reduce_std_v2	√	√	√	√	AI Core	计算指定维度的标准差。
math	reduce_std_v2_update	×	×	×	×	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
math	reduce_std_with_mean	×	×	×	×	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
math	reduce_sum	√	√	√	√	AI Core/AI CPU	返回给定维度中输入张量每行的和。
math	reduce_var	√	√	√	√	AI Core	返回指定维度的方差。
math	rfft1_d	√	√	×	×	AI Core	对输入张量self进行RFFT（傅里叶变换）计算，输出是一个包含非负频率的复数张量。
math	right_shift	√	√	√	√	AI Core/AI CPU	该算子按元素计算输入张量 x 与 y 的按位右移操作。
math	round	√	√	√	√	AI CPU	该算子将输入张量的值舍入到最接近的整数，若该值与两个整数距离一样则向偶数取整。
math	rsqrt	√	√	√	√	AI Core	求input(Tensor)每个元素的平方根的倒数。
math	rsqrt_grad	√	√	×	√	AI Core	rsqrt的反向计算。
math	scale	×	×	×	×	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
math	search_sorted	√	√	√	√	AI CPU	该算子用于在一个已排序的张量 sorted_sequence 中查找给定张量 values 应该插入的位置。
math	segsum	√	√	√	×	AI Core	进行分段和计算。生成对角线为0的半可分矩阵，且上三角为-inf。
math	select	√	√	√	√	AI Core	根据条件选取self或other中元素并返回（支持广播）。
math	select_v2	√	√	×	√	AI Core/AI CPU	根据条件选取self或other中元素并返回（支持广播）。
math	shape	×	√	×	√	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
math	shape_n	×	√	×	√	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
math	sign	√	√	√	√	AI Core	对输入的tensor逐元素进行Sign符号函数的运算并输出结果tensor。
math	sign_bits_pack	×	×	×	×	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
math	sign_bits_unpack	×	×	×	×	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
math	signbit
math	silent_check	×	×	×	×	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
math	silent_check_v2
math	sin	√	√	√	√	AI Core	对输入Tensor完成sin运算
math	sinc	√	√	√	√	AI Core	对输入Tensor完成sinc运算
math	sinh	√	√	√	√	AI CPU	该算子对输入的每个元素进行正弦后输出。
math	sinkhorn	√	√	×	×	AI Core	计算Sinkhorn距离，可以用于MoE模型中的专家路由。
math	slogdet
math	sort	√	√	√	√	AI Core	将输入tensor中的元素根据指定维度进行升序/降序，并且返回对应的index值。
math	sort_with_index	√	√	×	√	AI Core	将输入tensor按照元素值大小进行排序，index值跟随对应元素值进行排序。
math	sqrt	√	√	√	√	AI Core	完成非负数平方根计算，负数情况返回nan。
math	sqrt_grad	√	√	×	√	AI CPU	该算子用于完成梯度平方根计算。
math	square	√	√	√	√	AI CPU	该算子对输入Tensor逐元素计算平方值。
math	square_sum_v1	√	√	×	√	AI CPU	用于计算输入张量在指定轴上的平方和。
math	squared_difference	√	√	×	√	AI CPU	为第一个输入张量减去第二个输入张量，并计算其平方值。
math	stft	√	√	√	√	AI Core	计算输入在滑动窗口内的傅里叶变换。
math	sub	√	√	√	√	AI Core/AI CPU	完成减法计算，被减数按alpha进行缩放。
math	svd
math	tan	√	√	√	√	AI Core/AI CPU	正切三角函数。
math	tanh	√	√	√	√	AI Core	激活函数。返回与输入tensor shape相同的tensor，对输入tensor进行elementwise的计算。
math	tanh_grad	√	√	√	√	AI Core/AI CPU	Tanh的反向计算。
math	tensor_equal	√	√	√	√	AI Core	计算两个Tensor是否有相同的大小和元素，返回一个Bool类型。
math	tile	√	√	√	√	AI Core/AI CPU	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
math	top_k_v2
math	topk
math	trace
math	transform_bias_rescale_qkv	√	√	×	√	AI Core	一个用于处理多头注意力机制中查询（Query）、键（Key）、值（Value）向量的接口，用于调整这些向量的偏置（Bias）和缩放（Rescale）因子。
math	tria ngular_solve	√	√	√	√	AI Core	对输入Tensor截取整数部分。
math	trunc	×	×	×	×	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
math	truncate_mod	√	√	×	√	AI Core	张量取余计算。
math	x_log_y	×	×	×	×	AI Core	将输入的张量沿指定轴重复多次，但不进行广播。
math	zeros_like	√	√	√	√	AI Core	将张量填充为全零。
conversion	chunk_cat	√	√	×	×	AI Core	将tensors中所有tensor先按照维度dim切分为numChunks块，再按照dim后一维进行级联，最后转换为out的数据类型。
conversion	circular_pad	√	√	×	×	AI Core	使用输入循环填充输入tensor的最后两维。
conversion	circular_pad_grad	√	√	√	×	AI Core	circular_pad的反向传播。
conversion	coalesce_sparse	√	√	×	×	AI Core	实现对Coo_Tensor优化的方法coalesce()方法。
conversion	coordinates_1d_to_2d	×	×	×	√	AI CPU	将1D坐标转换为2D坐标，根据shape信息计算行列索引。
conversion	depth_to_space	√	√	×	√	AI Core	该算子通过对输入张量的深度（通道）维度进行重新排列，将其转换为空间维度（高度和宽度）。具体来说，它将输入张量的深度维度按照指定的块大小（block_size）进行划分，并将这些深度块重新排列到空间维度中，从而增加空间维度的大小，同时减少通道维度的深度。
conversion	diag	√	√	×	√	AI Core	创建一个以小于等于4维的输入张量为对角线元素的对角矩阵。
conversion	diag_flat	√	√	×	√	AI Core	创建一个以输入数组为对角线元素的平铺对角矩阵。
math	diag_v2	√	√	×	√	AI Core	根据输入的二维张量，提取由diagonal指定的对角线元素。
conversion	feeds_repeat	√	√	×	√	AI Core	对于输入feeds，根据输入feeds_repeat_times，将对应的feeds的第0维上的数据复制对应的次数，并将输出y的第0维padding到output_feeds_size的大小。
conversion	fill_diagonal_v2	√	√	×	√	AI Core	将指定值填充到矩阵的主对角线上。
conversion	masked_select_v3	√	√	×	×	AI Core	根据mask是否为True，选出input中对应位置的值，input和mask满足广播规则，结果为一维Tensor。
conversion	mem_set_v2	√	√	×	×	AI Core	给输入tensor赋指定的值。
conversion	pad_v3_grad_replicate	√	√	×	×	AI Core	padv3 2D的反向传播。
conversion	pad_v3_grad_replication	√	√	×	×	AI Core	padv3 3D的反向传播。
conversion	pad_v4_grad	√	√	×	×	AI Core	pad之后的输入的反向传播。
conversion	reflection_pad3d_grad	√	√	×	×	AI Core	计算aclnnReflectionPad3d api的反向传播。
conversion	stack_ball_query	√	√	×	√	AI Core	Stack Ball Query 是KNN的替代方案，用于查找点p1指定半径范围内的所有点（在实现中设置了K的上限）。
conversion	slice_write	×	×	×	√	AI CPU	将 value tensor 写入 x tensor 的指定位置（由 begin 指定偏移）。这是一个原地操作，输出与输入 x 共用同一块内存。
conversion	strided_slice_assign_v2	√	√	×	√	AI Core	StridedSliceAssign是一种张量切片赋值操作，它可以将张量inputValue的内容，赋值给目标张量varRef中的指定位置。
conversion	transpose_v2	√	√	×	×	AI Core	实现张量的维度置换（Permutation）操作，按照指定的顺序重新排列输入张量的维度。
conversion	unfold_grad	√	√	×	×	AI Core	实现Unfold算子的反向功能，计算相应的梯度。
conversion	concat_d	√	√	√	√	AI Core	将tensors中所有tensor按照维度dim进行级联，除了dim对应的维度以外的维度必须一致。
conversion	concat_dv2	√	√	×	×	AI Core	将tensors中所有tensor按照维度concat_dim进行级联，除了dim对应的维度以外的维度必须一致。
conversion	concat_v2	√	√	×	√	AI CPU	该算子沿指定维度将多个输入张量进行拼接。
conversion	clip_by_value	√	√	√	√	AI CPU	该算子将输入的所有元素限制在[clipValueMin,clipValueMax]范围内。
conversion	clip_by_value_v2	√	√	√	√	AI CPU	该算子将输入的所有元素限制在[clipValueMin,clipValueMax]范围内。
conversion	invert_permutation	√	√	×	√	AI CPU	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
conversion	unpack	√	√	×	√	AI Core	将张量沿着某一维度拆分为多个子张量。
conversion	as_strided	√	√	×	√	AI Core	允许用户通过制定新的形状和步长来创建一个与原张量共享相同数据内存的张量视图。
conversion	assign	√	√	×	√	AI Core	将一个输入tensor的值填充到另一个输入tensor中。
conversion	broadcast_to	×	×	×	√	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
conversion	batch_to_space_nd	√	√	×	√	AI Core	将批次维度的数据重新排列到空间维度，并裁剪空间维度。
conversion	concat	√	√	×	√	AI Core	用于沿指定维度将多个输入 Tensor 进行拼接，输出包含所有输入数据按顺序拼接后的 Tensor。
conversion	confusion_transpose_d	√	√	√	√	AI Core	融合reshape和transpose运算。
conversion	contiguous	×	×	×	×	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
conversion	dynamic_partition	√	√	×	√	AI Core	用于根据分区索引将输入数据动态分割成多个张量。
conversion	fill	√	√	√	√	AI Core	对输入张量填充指定标量值。
conversion	flatten	×	×	×	×	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
conversion	im2col	√	√	√	√	AI Core	图像到列，滑动局部窗口数据转为列向量，拼接为大张量。
conversion	masked_fill	√	√	√	√	AI Core	将输入Tensor`x`中mask位置为`True`的元素填充指定的值。`mask`必须与`x`的shape相同或可广播。
conversion	mirror_pad	√	√	√	√	AI Core	以镜像方式填充输入tensor的边界。
conversion	npu_format_cast	×	×	×	×	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
conversion	pack	√	√	√	√	AI Core	通过沿轴维度打包，将值中的张量列表打包成一个比值中的每个张量高一维度的张量。
conversion	pad	×	×	√	×	AI Core	对输入Tensor做填充。
conversion	pad_v2	×	×	√	×	AI Core	对输入 tensor 进行指定值的常量填充。
conversion	pad_v3	√	√	√	√	AI Core	对输入Tensor做填充。
conversion	pad_v3_grad	√	√	×	√	AI Core	pad_v3之后的输入的反向传播。
conversion	reshape	√	√	×	√	AI CPU	将输入张量重解释为目标形状。
conversion	roll	×	×	×	×	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
conversion	slice	√	√	×	√	AI Core	根据给定的范围和步长，从输入张量中提取子张量。
conversion	split	√	√	×	√	AI Core	将张量沿指定维度split_dim平均拆分为num_split份更小的张量。
conversion	split_v	√	√	√	√	AI Core/AI CPU	将输入tensor指定维度按照指定长度进行切分，最后一块长度可能不足。
conversion	squeeze	×	×	×	√	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
conversion	strided_slice	√	√	×	√	AI Core	按照指定的起始、结束位置和步长，从输入张量中提取一个子张量。
conversion	strided_slice_grad	√	√	×	×	AI Core	将子张量的梯度映射回原始张量的对应位置。
conversion	strided_slice_v3	×	×	×	×	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
conversion	tensor_move	√	√	√	√	AI Core	将输入tensor的值搬运到输出tensor中。
conversion	trans_data	×	×	×	×	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
conversion	transpose	√	√	√	√	AI Core	完成张量转置。
conversion	tril	√	√	√	√	AI Core	将输入的self张量的最后二维（按shape从左向右数）沿对角线的右上部分置零。
conversion	triu	√	√	√	√	AI Core	完成张量转置。
conversion	unsqueeze	×	×	×	√	AI Core	对输入Tensor做填充。
conversion	view_copy	√	√	√	√	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
conversion	identity	√	√	×	√	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
conversion	identity_n	×	√	×	√	AI Core	该算子暂无Ascend C代码实现，欢迎开发者补充贡献，贡献方式参考贡献指南。
conversion	matrix_set_diag	√	√	×	√	AI Core	将输入tensor的对角线元素替换为对角线tensor的值。
conversion	matrix_diag	√	√	×	√	AI Core	返回一个给定批量对角值的批量对角Tensor。
conversion	matrix_diag_v3	√	×	×	√	AI CPU	根据输入的单条或多条对角线值生成矩阵，对角线带之外的位置使用padding_value填充。
conversion	matrix_diag_part_v3	√	×	×	√	AI CPU	从输入矩阵或批量矩阵的最后两维中提取一条或多条对角线。
conversion	split_d	√	×	×	√	AI CPU	将张量沿指定维度split_dim平均拆分为num_split份更小的张量。与Split算子不同，split_dim作为属性而非输入提供。
random	drop_out_do_mask	√	√	√	√	AI Core	根据mask中对应bit位的值，将输入中的元素置零，并按照scale放大或者置零。
random	drop_out_do_mask_v3
random	drop_out_do_mask_v3_d
random	drop_out_v3	√	√	√	√	AI Core	按照概率p随机将输入中的元素置零，并将输出按照1/(1-p)的比例缩放。
random	dsa_gen_bit_mask
random	dsa_random_normal
random	dsa_random_uniform
random	random_standard_normal_v2	√	√	×	√	AI Core	生成标准正态分布的随机数列。
random	random_uniform_int_v2	√	√	×	√	AI Core	生成均匀分布的随机整数数列。
random	random_uniform_v2	√	√	×	√	AI Core	生成均匀分布的随机浮点数数列。
random	sim_thread_exponential
random	stateless_bernoulli	√	√	√	√	AI Core	从伯努利分布中提取二进制随机数。
random	stateless_drop_out_gen_mask	√	√	√	√	AI Core	根据随机种子和随机便宜量和保活系数生成随机掩码mask。
random	stateless_random	√	√	√	√	AI Core	返回从[from, to - 1]范围中抽取离散均匀分布的随机数。
random	stateless_random_choice_with_mask	√	√	x	√	AI Core	根据输入x中值为true，选择出对应索引列表，其次根据seed, offset调用philox_random生成索引列表长度个随机数，利用随机数对索引列表做洗牌算法，得到随机交换后得索引列表，返回count个。
random	stateless_random_normal_v2	√	√	√	√	AI Core	生成正态分布随机数。
random	stateless_random_normal_v3	√	√	√	×	AI Core	生成正态分布随机数。
random	stateless_normal	√	√	√	×	AI Core	生成正态分布随机数(与H20 GPU比特对齐)。
random	stateless_random_uniform_v2	√	√	×	√	AI Core	生成均匀分布随机数。
random	stateless_uniform	√	√	√	√	AI Core	生成均匀分布随机数。
random	stateless_random_uniform_v3	√	√	√	×	AI Core	生成均匀分布随机数。
random	stateless_randperm
random	truncated_normal_v2