Yi-1.5-6B-Chat:基于 PyTorch 与 OpenMind 的文本生成项目

可用于文本生成任务,支持对话交互。该项目是 Yi 的升级版,经500B高质量语料预训练及3M样本微调,在编码、数学、推理和指令遵循能力上有提升,同时保持语言理解等基础能力。【此简介由AI生成】

分支1Tags0

license: apache-2.0 pipeline_tag: text-generation frameworks:


🐙 GitHub👾 Discord🐤 Twitter💬 WeChat
📝 论文💪 技术博客🙌 常见问题📗 学习中心

简介

Yi-1.5 是 Yi 的升级版本。它在 Yi 的基础上,使用 5000 亿 tokens 的高质量语料进行持续预训练,并在 300 万多样化的微调样本上进行了微调。

与 Yi 相比,Yi-1.5 在代码生成、数学能力、推理能力和指令遵循能力方面表现更强,同时在语言理解、常识推理和阅读理解方面仍保持出色能力。

模型 上下文长度 预训练 tokens
Yi-1.5 4K, 16K, 32K 3.6T
## 使用 openMind

环境变量

# source environment variable
source /usr/local/Ascend/ascend-toolkit/set_env.sh
export OPENMIND_FRAMEWORK=pt

pip install openMind Library

OpenMind Library 可通过 pip 进行安装,请根据实际环境选择相应命令进行安装。

需要注意的是,由于 torch npu 依赖 torch,在 aarch64 环境下可直接通过 pip 安装,但在 x86 环境下需要通过特定 URL 下载 CPU 版本,因此两种环境下的安装命令有所不同。具体安装代码已在下文进行区分呈现。

# aarch64
pip install openmind[all]
# x86
pip install openmind[all] --extra-index-url https://download.pytorch.org/whl/cpu

推理

from openmind import AutoTokenizer, AutoModelForCausalLM
import torch
import torch_npu

model_dir = "HangZhou_Ascend/Yi-1.5-6B-Chat"
tokenizer = AutoTokenizer.from_pretrained(model_dir, device_map="auto", trust_remote_code=True)
# Set `torch_dtype=torch.float16` to load model in float16, otherwise it will be loaded as float32 and might cause OOM Error.
model = AutoModelForCausalLM.from_pretrained(model_dir, device_map="auto",  trust_remote_code=True, torch_dtype=torch.float16)
model = model.eval()
response, history = model.chat(tokenizer, "1+1=", history=[], meta_instruction="")
print(response)

项目介绍

可用于文本生成任务,支持对话交互。该项目是 Yi 的升级版,经500B高质量语料预训练及3M样本微调,在编码、数学、推理和指令遵循能力上有提升,同时保持语言理解等基础能力。【此简介由AI生成】

定制我的领域

下载使用量

0

项目总下载次数(含Clone、Pull、 zip 包及 release 下载),每日凌晨更新