DeepSeek-R1-Distill-Llama-8B
测试模型库描述
openPangu-Ultra-MoE-718B-V1.1 是基于昇腾 NPU 训练的大规模混合专家语言模型,总参数量为718B,激活参数量为39B,同一个模型具备快思考和慢思考两种能力。 相较 [openPangu-Ultra-MoE-718B-V1.0] 版本,V1.1版本主要提升了Agent工具调用能力,降低了幻觉率,其他综合能力也进一步增强。
This repository contains model weights and configuration files for the post-trained model in the Hugging Face Transformers format. These artifacts are compatible with Hugging Face Transformers, vLLM, SGLang, KTransformers, etc.
This repository contains model weights and configuration files for the post-trained model in the Hugging Face Transformers format. These artifacts are compatible with Hugging Face Transformers, vLLM, SGLang, KTransformers, etc.
这是 Qwen 系列中的一个图像生成基础模型,在 复杂文本渲染 和 精确图像编辑 方面取得了显著进展。实验显示,该模型在图像生成和编辑方面具有强大的通用能力,特别是在文本渲染方面表现出色,尤其是在中文上。
项目展示
查看全部项目 >openPangu-VL-7B 是基于昇腾 NPU ,基于openPangu-Embedded-7B-V1.1语言基模和openPangu-ViT-600M视觉编码器训练的高效多模态模型。openPangu-VL-7B 训练了约 3T tokens,具备通用视觉对话、文档理解、目标定位与计数、视频理解、视觉高阶推理等能力。该模型为快思考模型。
LikeQwen25-7B-Instruct
LikeQwen3-8B
LikeQwen3-4B
LikeDeepSeek-R1-Distill-Qwen-7B
LikeDeepSeek-R1-Distill-Qwen-1.5B
Likebge-m3 embedding model
LikeQwen2.5-Coder-7B-Instruct
LikeQwen3-1.7B
Like验证码识别模型 ocr-captcha专门识别常见验证码的模型
Like