MindSpeed/mindspeed/features_manager/custom_fsdp/custom_fsdp_feature.py-代码预览-MindSpeed:基于昇腾设备的大模型加速库项目 - AtomGit

Ii-robot!2738 【feat.】支持Megatron Custom FSDP特性

467559eb创建于 2025年8月19日历史提交

# Copyright (c) Huawei Technologies Co., Ltd. 2025. All rights reserved.
from mindspeed.features_manager.feature import MindSpeedFeature


class CustomFSDPFeature(MindSpeedFeature):
    def __init__(self):
        super(CustomFSDPFeature, self).__init__('use-custom-fsdp')

    def register_patches(self, patch_manager, args):
        from mindspeed.core.distributed.custom_fsdp.param_and_grad_buffer import gradient_reduce_preprocessing, mark_bucket_ready
        from mindspeed.moe.router import gating

        patch_manager.register_patch('megatron.core.distributed.custom_fsdp.param_and_grad_buffer.gradient_reduce_preprocessing', 
                                        gradient_reduce_preprocessing)
        patch_manager.register_patch('megatron.core.distributed.custom_fsdp.param_and_grad_buffer.GradReducePipeline.mark_bucket_ready', 
                                        mark_bucket_ready)
        patch_manager.register_patch('megatron.core.transformer.moe.router.Router.gating', gating)