vicuna-13b-delta-v1.1:基于LLaMA的开源聊天助手,需叠加原始权重使用

Vicuna是通过在ShareGPT对话数据上微调LLaMA得到的聊天助手,主要用于大语言模型和聊天机器人研究,面向AI领域研究者与爱好者。【此简介由AI生成】

分支1Tags0

inference: false

注意:新版权重已发布
请查看此处获取新版权重。

注意:此"增量模型"无法直接使用
用户需将其应用于原始LLaMA权重之上才能获得实际Vicuna权重。具体操作请参阅说明指南



Vicuna 模型卡片

模型详情

Vicuna是通过基于ShareGPT收集的用户共享对话对LLaMA进行微调训练的聊天助手。

  • 开发团队: LMSYS
  • 模型类型: 基于Transformer架构的自回归语言模型
  • 许可协议: 非商业许可
  • 基础模型: LLaMA

模型资源

用途

Vicuna主要应用于大语言模型和聊天机器人的学术研究。 模型的主要目标用户是自然语言处理、机器学习和人工智能领域的研究人员及爱好者。

快速开始

命令行界面:https://github.com/lm-sys/FastChat#vicuna-weights
API接口(OpenAI API, Huggingface API):https://github.com/lm-sys/FastChat/tree/main#api

训练详情

Vicuna v1.1通过监督指令微调从LLaMA训练而来。 训练数据包含从ShareGPT.com收集的约7万条对话记录。 更多细节请参阅本论文附录中的"Vicuna模型训练详情"章节。

性能评估

Vicuna通过标准基准测试、人类偏好评估和LLM-as-a-judge方法进行综合评估。详见本论文排行榜

Vicuna 各版本间的差异

详见 vicuna_weights_version.md

项目介绍

Vicuna是通过在ShareGPT对话数据上微调LLaMA得到的聊天助手,主要用于大语言模型和聊天机器人研究,面向AI领域研究者与爱好者。【此简介由AI生成】

定制我的领域

下载使用量

0

项目总下载次数(含Clone、Pull、 zip 包及 release 下载),每日凌晨更新