tencent_hunyuan

tencent_hunyuan

腾讯混元

公告
热门项目
134

HunyuanImage-3.0 统一多模态理解与生成,基于自回归框架,实现文本生成图像,性能媲美或超越领先闭源模型

82

混元3D世界重建模型,支持多模态先验注入和多任务统一输出

56

HunyuanVideo-1.5作为一款轻量级视频生成模型,仅需83亿参数即可提供顶级画质,大幅降低使用门槛。该模型在消费级显卡上运行流畅,让每位开发者和创作者都能轻松使用。本代码库提供生成创意视频所需的实现方案与工具集。

54

HunyuanOCR 是基于混元原生多模态架构打造的领先端到端 OCR 专家级视觉语言模型。它采用仅 10 亿参数的轻量化设计,在业界多项基准测试中取得了当前最佳性能。该模型不仅精通复杂多语言文档解析,还在文本检测与识别、开放域信息抽取、视频字幕提取及图片翻译等实际应用场景中表现卓越。

50

腾讯混元3D-Omni:3D版ControlNet突破多模态控制,实现高精度3D资产生成

  • 暂无简介

    Python
    0
    0
    NOASSERTION
    更新于 1月13日
    Star
  • 暂无简介

    Python
    1
    0
    NOASSERTION
    更新于 5 小时前
    Star
  • 暂无简介

    0
    0
    NOASSERTION
    更新于 6 小时前
    Like
  • 暂无简介

    Python
    0
    0
    更新于 7 小时前
    Like
  • Hunyuan3D-2mv是由腾讯开源的先进3D生成模型,基于Hunyuan3D-2优化,支持多视角图像控制的高质量3D资产生成。它采用扩散模型技术,能够根据用户提供的正面、侧面、背面等多视角图片,自动生成高分辨率带纹理的3D网格模型。该模型支持GPU加速,通过简单的Python接口即可快速生成精细的3D内容,为游戏开发、影视制作、虚拟现实等领域提供强大的创作工具

    0
    0
    更新于 2025年9月4日
    Like
  • SongPrep-7B是腾讯混元推出的开源70亿参数模型,基于百万歌曲数据集训练,支持全歌曲结构解析与歌词转录,提供端到端音频处理能力,适用于音乐分析、歌词生成等场景,助力开发者构建高效音频理解应用

    2
    0
    NOASSERTION
    更新于 7 小时前
    Like
  • 腾讯开源混元0.5B指令微调模型,专为高效部署设计,支持4位整数量化,显著降低计算资源需求。模型具备双思维推理模式,可灵活适配不同任务复杂度,并原生支持超长上下文理解。在数学推理、代码生成与智能体任务中表现优异,兼顾轻量化与高性能,适合端侧及资源受限场景应用

    Jinja
    1
    0
    更新于 2025年9月4日
    Like
  • 暂无简介

    0
    0
    更新于 7 小时前
    Like
  • HunyuanWorld-Voyager是腾讯开源的视频扩散框架,能从单张图像出发,结合用户自定义相机路径,生成具有世界一致性的3D点云序列。它可按自定义相机轨迹生成3D一致的场景视频用于世界探索,还能联合生成对齐的深度和RGB视频,实现高效直接的3D重建

    2
    0
    NOASSERTION
    更新于 7 小时前
    Like
  • 暂无简介

    2
    0
    更新于 8 小时前
    Like
查看全部项目 >
公告
成就
631
Star
0
Fork
75.15 K
Download
常用语言
Python
Jinja
Shell