| [fix][ops] cleancode 算子代码修改 develop | 2 个月前 |
| [chore] refresh copyright | 7 个月前 |
| 【fix】【ops】对齐cuda边界情况,在输入为空tensor时,complete输出[0],inclusice\exclusive输出空张量 | 2 个月前 |
| [fix][A5][ops]修复block_bucketize_sparse_features算子 Simplified Kernel 快速除法精度问题修复 | 2 个月前 |
| [FIX]norm测试用例修改 | 3 个月前 |
| [feat]concat_2d_jagged前反向支持n_prefix | 16 天前 |
| [FIX]去掉空tesnsor用例 | 2 个月前 |
| [FIX]去掉空tesnsor用例 | 2 个月前 |
| [FIX]rename disentangle_attention name | 1 个月前 |
| 【FEAT】【ops】新增expand_into_jagged_permute算子,适配层&测试代码 | 4 个月前 |
| [FEAT] torch2.7.1升级适配 | 6 个月前 |
| [ops][A5]修复测试脚本silu_scale问题 | 12 天前 |
| [chore] refresh copyright | 7 个月前 |
| [FEAT] torch2.7.1升级适配 | 6 个月前 |
| [fix] hstu_v2 add dtype check | 15 天前 |
| [fix][ops][a5]catlass_change_arch_del_fp32 | 2 个月前 |
| 【fix】in_linear_silu去掉fp32 | 2 个月前 |
| [test][ops][a5]添加init_address_lookup的测试文件 | 2 个月前 |
| 【FEAT】【ops】增加int_nbit_split_embedding_codegen_lookup_function算子,适配层&测试代码 | 5 个月前 |
| [FIX][ops][A5]hstu_backward_fuxi 适配新cann | 3 个月前 |
| 【FIX】【ops】jagged_to_padded_dense max_lengths = 0 场景对齐 | 3 个月前 |
| [feat][ops][a5]keyed_jagged_index_select_dim1_adapt_torchrec | 23 天前 |
| [fix] lccl, pcie_through 适配最新cann包,修复测试用例动态链接库配置 | 1 个月前 |
| [FEAT]适配c310 ln_mul算子脚本与增加同步操作 | 5 个月前 |
| [fix][ops][A5/A2]解决multislice_concat算子在某些维度下校验异常的问题 | 2 个月前 |
| [feat] norm_mul算子适配A5 | 1 个月前 |
| [test][ops][A2/A5]offsets_range测试用例 | 2 个月前 |
| [chore] refresh copyright | 7 个月前 |
| [fix] lccl, pcie_through 适配最新cann包,修复测试用例动态链接库配置 | 1 个月前 |
| 【fix】【ops】补充permute2d/1d npu不支持的数据类型和多列weights功能,和fbgemm对齐 | 2 个月前 |
| 【fix】【ops】补充permute2d/1d npu不支持的数据类型和多列weights功能,和fbgemm对齐 | 2 个月前 |
| 【fix】【ops】补充permute2d/1d npu不支持的数据类型和多列weights功能,和fbgemm对齐 | 2 个月前 |
| 【FEAT】【ops】新增permute_pooled_embs_auto_grad算子测试脚本 | 3 个月前 |
| [fix][ops][a2/a5] fix_relative_attn_bias_pos_intarround | 4 个月前 |
| [FEAT][DOC]逆序算子测试和部分资料修改 | 4 个月前 |
| 【FIX】【反合】segment_sum_csr算子values参数支持整数类型 | 16 天前 |
| [FIX]ln_mul,segment_sum_csr,lazy_adam,cust_op_by_addr,pcie_through,sgd_test README修改 | 1 个月前 |
| 【FEAT】【ops】同步v220修改,为backward_codegen_adagrad_unweighted_exact算子增加对SGD优化器的unique分支支持 | 4 个月前 |
| [fix]add_sync_and_adapt_c310 | 5 个月前 |
| 双标杆精度对比 | 3 个月前 |