Vicuna是通过在ShareGPT对话数据上微调LLaMA得到的聊天助手,主要用于大语言模型和聊天机器人研究,面向AI领域研究者与爱好者。【此简介由AI生成】
以下内容由 AI 翻译,如有问题请 点此提交 issue 反馈
inference: false
注意:新版权重已发布
请查看此处获取新版权重。
注意:此"增量模型"无法直接使用
用户需将其应用于原始LLaMA权重之上才能获得实际Vicuna权重。具体操作请参阅说明指南。
Vicuna 模型卡片
模型详情
Vicuna是通过基于ShareGPT收集的用户共享对话对LLaMA进行微调训练的聊天助手。
模型资源
- 代码库: https://github.com/lm-sys/FastChat
- 博客: https://lmsys.org/blog/2023-03-30-vicuna/
- 论文: https://arxiv.org/abs/2306.05685
- 演示平台: https://chat.lmsys.org/
用途
Vicuna主要应用于大语言模型和聊天机器人的学术研究。 模型的主要目标用户是自然语言处理、机器学习和人工智能领域的研究人员及爱好者。
快速开始
命令行界面:https://github.com/lm-sys/FastChat#vicuna-weights
API接口(OpenAI API, Huggingface API):https://github.com/lm-sys/FastChat/tree/main#api
训练详情
Vicuna v1.1通过监督指令微调从LLaMA训练而来。 训练数据包含从ShareGPT.com收集的约7万条对话记录。 更多细节请参阅本论文附录中的"Vicuna模型训练详情"章节。
性能评估
Vicuna通过标准基准测试、人类偏好评估和LLM-as-a-judge方法进行综合评估。详见本论文及排行榜。