公告
暂无公告
热门项目
75
LongCat-AudioDiT 是一款基于扩散模型的文本转语音(TTS)模型,代表了当前该领域的最高水平(SOTA),它直接在波形潜空间中进行操作。
2
暂无简介
2
暂无简介
2
暂无简介
2
暂无简介
1
用户可用于文本转视频、图像转视频及视频续播等任务,实现高效高质量长视频生成。项目采用统一架构支持多任务,具备原生长视频生成能力,通过粗细生成策略和稀疏注意力提升推理效率,经多奖励RLHF优化性能。【此简介由AI生成】

欢迎关注「龙猫LongCat」大模型! 🌟 快速体验 🌟 https://longcat.chat 探索开源和AI,我们期待与你一起开启技术创新的无限可能~
LongCat-AudioDiT 是一款基于扩散模型的文本转语音(TTS)模型,代表了当前该领域的最高水平(SOTA),它直接在波形潜空间中进行操作。
暂无简介
暂无简介
暂无简介
暂无简介
用户可用于文本转视频、图像转视频及视频续播等任务,实现高效高质量长视频生成。项目采用统一架构支持多任务,具备原生长视频生成能力,通过粗细生成策略和稀疏注意力提升推理效率,经多奖励RLHF优化性能。【此简介由AI生成】