文件最后提交记录最后更新时间
[fix][ops] cleancode 算子代码修改 develop2 个月前
[chore] refresh copyright7 个月前
【fix】【ops】对齐cuda边界情况,在输入为空tensor时,complete输出[0],inclusice\exclusive输出空张量2 个月前
[fix][A5][ops]修复block_bucketize_sparse_features算子 Simplified Kernel 快速除法精度问题修复2 个月前
[FIX]norm测试用例修改3 个月前
[feat]concat_2d_jagged前反向支持n_prefix16 天前
[FIX]去掉空tesnsor用例2 个月前
[FIX]去掉空tesnsor用例2 个月前
[FIX]rename disentangle_attention name1 个月前
【FEAT】【ops】新增expand_into_jagged_permute算子,适配层&测试代码4 个月前
[FEAT] torch2.7.1升级适配6 个月前
[ops][A5]修复测试脚本silu_scale问题12 天前
[chore] refresh copyright7 个月前
[FEAT] torch2.7.1升级适配6 个月前
[fix] hstu_v2 add dtype check15 天前
[fix][ops][a5]catlass_change_arch_del_fp322 个月前
【fix】in_linear_silu去掉fp322 个月前
[test][ops][a5]添加init_address_lookup的测试文件2 个月前
【FEAT】【ops】增加int_nbit_split_embedding_codegen_lookup_function算子,适配层&测试代码5 个月前
[FIX][ops][A5]hstu_backward_fuxi 适配新cann3 个月前
【FIX】【ops】jagged_to_padded_dense max_lengths = 0 场景对齐3 个月前
[feat][ops][a5]keyed_jagged_index_select_dim1_adapt_torchrec23 天前
[fix] lccl, pcie_through 适配最新cann包,修复测试用例动态链接库配置1 个月前
[FEAT]适配c310 ln_mul算子脚本与增加同步操作5 个月前
[fix][ops][A5/A2]解决multislice_concat算子在某些维度下校验异常的问题2 个月前
[feat] norm_mul算子适配A51 个月前
[test][ops][A2/A5]offsets_range测试用例2 个月前
[chore] refresh copyright7 个月前
[fix] lccl, pcie_through 适配最新cann包,修复测试用例动态链接库配置1 个月前
【fix】【ops】补充permute2d/1d npu不支持的数据类型和多列weights功能,和fbgemm对齐2 个月前
【fix】【ops】补充permute2d/1d npu不支持的数据类型和多列weights功能,和fbgemm对齐2 个月前
【fix】【ops】补充permute2d/1d npu不支持的数据类型和多列weights功能,和fbgemm对齐2 个月前
【FEAT】【ops】新增permute_pooled_embs_auto_grad算子测试脚本3 个月前
[fix][ops][a2/a5] fix_relative_attn_bias_pos_intarround4 个月前
[FEAT][DOC]逆序算子测试和部分资料修改4 个月前
【FIX】【反合】segment_sum_csr算子values参数支持整数类型16 天前
[FIX]ln_mul,segment_sum_csr,lazy_adam,cust_op_by_addr,pcie_through,sgd_test README修改1 个月前
【FEAT】【ops】同步v220修改,为backward_codegen_adagrad_unweighted_exact算子增加对SGD优化器的unique分支支持4 个月前
[fix]add_sync_and_adapt_c3105 个月前
双标杆精度对比3 个月前