vicuna-13b-delta-v1.1:基于LLaMA的开源聊天助手，需叠加原始权重使用

0

0

Vicuna是通过在ShareGPT对话数据上微调LLaMA得到的聊天助手，主要用于大语言模型和聊天机器人研究，面向AI领域研究者与爱好者。【此简介由AI生成】

Hhuggingface-webUpdate README.md

ffed4c7c创建于 2023年8月2日13次提交

文件	最后提交记录	最后更新时间
.gitattributes	initial commit	3 年前
README.md	Update README.md	2 年前
config.json	Upload LlamaForCausalLM	3 年前
generation_config.json	Upload LlamaForCausalLM	3 年前
pytorch_model-00001-of-00003.binLFS	Upload LlamaForCausalLM	3 年前
pytorch_model-00002-of-00003.binLFS	Upload LlamaForCausalLM	3 年前
pytorch_model-00003-of-00003.binLFS	Upload LlamaForCausalLM	3 年前
pytorch_model.bin.index.json	Upload LlamaForCausalLM	3 年前
special_tokens_map.json	upload tokenizer files	3 年前
tokenizer.modelLFS	Upload tokenizer.model	3 年前
tokenizer_config.json	upload tokenizer files	3 年前

自动翻译

inference: false

注意：新版权重已发布
请查看此处获取新版权重。

注意：此"增量模型"无法直接使用
用户需将其应用于原始LLaMA权重之上才能获得实际Vicuna权重。具体操作请参阅说明指南。

Vicuna 模型卡片

模型详情

Vicuna是通过基于ShareGPT收集的用户共享对话对LLaMA进行微调训练的聊天助手。

开发团队： LMSYS
模型类型： 基于Transformer架构的自回归语言模型
许可协议： 非商业许可
基础模型： LLaMA

模型资源

代码库： https://github.com/lm-sys/FastChat
博客： https://lmsys.org/blog/2023-03-30-vicuna/
论文： https://arxiv.org/abs/2306.05685
演示平台： https://chat.lmsys.org/

用途

Vicuna主要应用于大语言模型和聊天机器人的学术研究。模型的主要目标用户是自然语言处理、机器学习和人工智能领域的研究人员及爱好者。

快速开始

命令行界面：https://github.com/lm-sys/FastChat#vicuna-weights
API接口（OpenAI API, Huggingface API）：https://github.com/lm-sys/FastChat/tree/main#api

训练详情

Vicuna v1.1通过监督指令微调从LLaMA训练而来。训练数据包含从ShareGPT.com收集的约7万条对话记录。更多细节请参阅本论文附录中的"Vicuna模型训练详情"章节。

性能评估

Vicuna通过标准基准测试、人类偏好评估和LLM-as-a-judge方法进行综合评估。详见本论文及排行榜。

Vicuna 各版本间的差异

详见 vicuna_weights_version.md

项目介绍

Vicuna是通过在ShareGPT对话数据上微调LLaMA得到的聊天助手，主要用于大语言模型和聊天机器人研究，面向AI领域研究者与爱好者。【此简介由AI生成】

定制我的领域

下载使用量

0

项目总下载次数（含Clone、Pull、 zip 包及 release 下载），每日凌晨更新

目录

inference: false

Vicuna 模型卡片

Vicuna 各版本间的差异