文件最后提交记录最后更新时间
fix:fix code/documentation formatting issues using pre-commit Co-authored-by: xiaohuizhu1037<zhuxiaohui13@huawei.com> # message auto-generated for no-merge-commit merge: !2043 merge master into master fix:fix code/documentation formatting issues using pre-commit Created-by: xiaohuizhu1037 Commit-by: xiaohuizhu1037 Merged-by: ascend-robot Description: ## What this PR does / why we need it? 使用pre-commit扫描仓库的全量代码/文档并进行格式修复。 ## Does this PR introduce any user-facing change? 会对代码/文档做格式修改。 ## How was this patch tested? 工具自动修复和人工审视。 See merge request: Ascend/DrivingSDK!20438 天前
feat:add torch2.7.1 support for VGGT Co-authored-by: gitdzy<dingziyuan@huawei.com> # message auto-generated for no-merge-commit merge: !2058 merge vggt_readme into master feat:add torch2.7.1 support for VGGT Created-by: gitdzy Commit-by: gitdzy Merged-by: ascend-robot Description: ## What this PR does / why we need it? feat:add torch2.7.1 support for VGGT ## Does this PR introduce any user-facing change? no ## How was this patch tested? no See merge request: Ascend/DrivingSDK!20582 天前
update VGGT Co-authored-by: zhangchenrui<zhangchenrui2@huawei.com> # message auto-generated for no-merge-commit merge: !1697 merge master into master update VGGT Created-by: zhangchenrui2 Commit-by: zhangchenrui Merged-by: ascend-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 更新vggt模型脚本 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #123--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [x] 其他,请描述: See merge request: Ascend/DrivingSDK!16977 个月前
README.md

VGGT

目录

简介

模型介绍

VGGT是一个大型前馈Transformer,具有最小的3D感应偏差,在大量3D注释数据上进行训练。它接受多达数百张图像,并在不到一秒的时间内一次性预测所有图像的相机、点图、深度图和点轨迹,这通常优于基于优化的替代方案,无需进一步处理。

支持任务列表

本仓已经支持以下模型任务类型

模型 任务列表 是否支持
VGGT 训练

代码实现

  • 参考实现:

    url=https://github.com/facebookresearch/vggt
    commit_id=97bbde571faddde3ace3cfa7724a20448026c4c8
    
  • 适配昇腾 AI 处理器的实现:

    url=https://gitcode.com/Ascend/DrivingSDK.git
    code_path=model_examples/VGGT
    

准备训练环境

安装环境

表 1 三方库版本支持表

三方库 支持版本
PyTorch 2.1.0
PyTorch 2.7.1

安装昇腾环境

请参考昇腾社区中《Pytorch框架训练环境准备》文档搭建昇腾环境,本仓已支持表2中软件版本,python使用3.10版本。

表 2 昇腾软件版本支持表

软件类型 支持版本
FrameworkPTAdapter 26.0.0
CANN 9.0.0
  • 克隆代码仓到当前目录并使用patch文件

    git clone https://github.com/facebookresearch/vggt.git
    cd vggt
    git checkout 97bbde571faddde3ace3cfa7724a20448026c4c8
    cp -f ../VGGT_npu.patch .
    git apply --reject --whitespace=fix VGGT_npu.patch
    cp -r ../test training/
    
  • 安装环境依赖

    • 在应用过patch的模型根目录下,安装需要的依赖

      • 如果使用PyTorch 2.1.0,执行以下命令:

        pip install -r requirements.txt
        
      • 注意:如果使用PyTorch 2.7.1,需要将requirements.txt中的torchvision==0.18.0修改为torchvision==0.22.1,可使用以下命令:

        sed -i 's/torchvision==[0-9.]+/torchvision==0.22.1/' requirements.txt
        pip install -r requirements.txt
        
    • 在应用过patch的模型根目录下,安装vggt

      pip install -e .
      

准备数据集

  • 根据源仓readme中下载数据集co3D, 完整数据集5.5T,本仓中为实现快速验证,仅使用'tv'场景进行训练,如果使用其他场景,需要修改代码中对应部分,数据集分为co3D和co3D_annotations文件夹, 放在training文件夹下,数据集文件名称命名为co3D, 文件夹下为co3D和co3D_annotations,排列如下:
vggt
├── training/
│   ├── co3D/
│   │     ├── co3D
│   │     ├── co3D_annotations

准备预训练权重

  • 参照源仓下载模型权重,可以放到应用过patch的模型根目录下
vggt
├── model.pt

快速开始

训练任务

执行训练

  1. 在应用过patch的模型根目录下,执行以下指令进行训练。

    • 进入training文件夹
    cd training
    
    • 单机八卡性能
    bash test/train_8p_vggt_perf.sh --max-epochs 1
    
    • 单机八卡长跑
    bash test/train_8p_vggt_full.sh --max-epochs 7
    

单机八卡训练性能和loss,以tv场景,固定随机性,random_aspect_ratio为1,random_image_num为2,batch_size为15

芯片 卡数 global batchsize Loss iteration time FPS
竞品A 8p 120 0.0164 7.841 15.30
Atlas 800T A2 8p 120 0.0165 4.792 25.04

变更说明

2025.06.29:首次发布

2025.08.11: 支持训练,性能优化

FAQ