meituan-longcat

meituan-longcat

欢迎关注「龙猫LongCat」大模型! 🌟 快速体验 🌟 https://longcat.chat 探索开源和AI,我们期待与你一起开启技术创新的无限可能~

公告
暂无公告
热门项目
75

LongCat-AudioDiT 是一款基于扩散模型的文本转语音(TTS)模型,代表了当前该领域的最高水平(SOTA),它直接在波形潜空间中进行操作。

75
0
1

用户可用于文本转视频、图像转视频及视频续播等任务,实现高效高质量长视频生成。项目采用统一架构支持多任务,具备原生长视频生成能力,通过粗细生成策略和稀疏注意力提升推理效率,经多奖励RLHF优化性能。【此简介由AI生成】

Python
1
1
  • 暂无简介

    Python
    0
    0
    Apache-2.0
    更新于 22 小时前
    Star
  • 暂无简介

    Python
    0
    0
    MIT_License
    更新于 18 小时前
    Like
  • 暂无简介

    Python
    2
    0
    MIT_License
    更新于 18 小时前
    Like
  • 暂无简介

    Python
    0
    0
    MIT
    更新于 22 小时前
    Star
  • 用户可利用该项目进行文本、视觉、音频的统一处理与生成。它采用离散原生自回归范式,整合语言、视觉和音频于单一离散空间,支持视觉理解与生成、语音交互及定制化语音克隆,性能强劲。【此简介由AI生成】

    0
    1
    MIT
    更新于 22 小时前
    Star
  • 暂无简介

    1
    0
    MIT_License
    更新于 21 小时前
    Like
  • 暂无简介

    Python
    0
    0
    更新于 21 小时前
    Star
  • 用户可用于文本转视频、图像转视频及视频续播等任务,实现高效高质量长视频生成。项目采用统一架构支持多任务,具备原生长视频生成能力,通过粗细生成策略和稀疏注意力提升推理效率,经多奖励RLHF优化性能。【此简介由AI生成】

    Python
    1
    1
    MIT
    更新于 21 小时前
    Star
  • 暂无简介

    Python
    0
    0
    Apache-2.0
    更新于 21 小时前
    Star
  • 暂无简介

    Python
    0
    0
    更新于 21 小时前
    Star
查看全部项目 >
公告
暂无公告
成就
85
Star
4
Fork
2.59k
Download
常用语言
Python
C++
Cuda
C
Shell