MindSpeed/mindspeed/features_manager/fusions/grouped_matmul.py-代码预览-MindSpeed:基于昇腾设备的大模型加速库项目 - AtomGit

Ii-robot!2112 MindSpeed L0 reconstruction

8bfd51c2创建于 2025年3月28日历史提交

from mindspeed.features_manager.feature import MindSpeedFeature


class GroupedMatmulFeature(MindSpeedFeature):
    def __init__(self):
        super().__init__('grouped-matmul', optimization_level=0)

    def register_patches(self, patch_manager, args):
        from mindspeed.core.fusions.grouped_matmul import Ops, grouped_gemm_is_available, \
            assert_grouped_gemm_is_available, get_device_capability
        patch_manager.register_patch('megatron.core.transformer.moe.grouped_gemm_util.ops', Ops)
        patch_manager.register_patch('megatron.core.transformer.moe.grouped_gemm_util.grouped_gemm_is_available',
                                     grouped_gemm_is_available)
        patch_manager.register_patch('megatron.core.transformer.moe.grouped_gemm_util.assert_grouped_gemm_is_available',
                                     assert_grouped_gemm_is_available)
        patch_manager.register_patch('torch.cuda.get_device_capability', get_device_capability)