MindSpeed/mindspeed/features_manager/fusions/fused_softmax.py-代码预览-MindSpeed:基于昇腾设备的大模型加速库项目 - AtomGit

Ii-robot!2228 add MindSpeedFeaturesManager

6e6ae807创建于 2025年4月23日历史提交

from mindspeed.features_manager.feature import MindSpeedFeature


class FusedSoftmaxFeature(MindSpeedFeature):
    def __init__(self):
        super().__init__('fused-softmax', optimization_level=0)

    def register_patches(self, pm, args):
        from mindspeed.core.fusions.fused_softmax import is_kernel_available, ScaledUpperTriangMaskedSoftmax, \
            ScaledMaskedSoftmax, ScaledSoftmax, forward_fused_softmax
        pm.register_patch('megatron.core.fusions.fused_softmax.ScaledUpperTriangMaskedSoftmax',
                          ScaledUpperTriangMaskedSoftmax)
        pm.register_patch('megatron.core.fusions.fused_softmax.ScaledMaskedSoftmax', ScaledMaskedSoftmax)
        pm.register_patch('megatron.core.fusions.fused_softmax.ScaledSoftmax', ScaledSoftmax)
        pm.register_patch('megatron.core.fusions.fused_softmax.FusedScaleMaskSoftmax.is_kernel_available',
                          is_kernel_available)
        pm.register_patch('megatron.core.fusions.fused_softmax.FusedScaleMaskSoftmax.forward_fused_softmax',
                          forward_fused_softmax)