motarjem_tokenizer由abdeljalilELmajjodi开发，是基于🤗 transformers的开源多语言分词工具。它专为机器翻译任务优化，能高效处理多种语言的文本预处理。项目结构清晰，支持灵活配置，适用于自然语言处理的研究和应用开发。开发者可轻松集成到现有流程中，提升翻译模型的数据处理效率与一致性。【此简介由AI生成】

SsystemUpload tokenizer

2844ac3a创建于 2025年1月20日2次提交

文件	最后提交记录	最后更新时间
.gitattributes	initial commit	1 年前
README.md	Upload tokenizer	1 年前
added_tokens.json	Upload tokenizer	1 年前
source.spm	Upload tokenizer	1 年前
special_tokens_map.json	Upload tokenizer	1 年前
target.spm	Upload tokenizer	1 年前
tokenizer_config.json	Upload tokenizer	1 年前
vocab.json	Upload tokenizer	1 年前

自动翻译

library_name: transformers tags: []

模型卡片：模型标识符

模型详情

模型描述

这是一个托管在Hub上的🤗 transformers模型卡片。本模型卡片为自动生成内容。

开发方： [需补充信息]
资助方[可选]： [需补充信息]
共享方[可选]： [需补充信息]
模型类型： [需补充信息]
支持语言（自然语言处理）： [需补充信息]
许可证： [需补充信息]
基础模型[可选]： [需补充信息]

模型来源[可选]

代码库： [需补充信息]
论文[可选]： [需补充信息]
演示[可选]： [需补充信息]

用途

直接使用

[需补充信息]

下游应用[可选]

[需补充信息]

超范围使用

[需补充信息]

偏差、风险与局限性

[需补充信息]

使用建议

应确保用户（包括直接使用者和下游使用者）知悉模型存在的风险、偏差和局限性。需要更多信息以提供进一步建议。

如何开始使用该模型

使用以下代码开始使用该模型。

[需要补充更多信息]

训练详情

训练数据

[需要补充更多信息]

训练流程

预处理 [可选]

[需要补充更多信息]

训练超参数

训练方案: [需要补充更多信息]

速度、规模与时间 [可选]

[需要补充更多信息]

评估

测试数据、因素与指标

测试数据

[需要补充更多信息]

因素

[需要补充更多信息]

指标

[需要补充更多信息]

结果

[需要补充更多信息]

总结

模型检验 [可选]

[需要补充更多信息]

环境影响

碳排放量可使用 Lacoste等人（2019）提出的机器学习影响计算器进行估算。

硬件类型: [需要补充更多信息]
使用时长: [需要补充更多信息]
云服务提供商: [需要补充更多信息]
计算区域: [需要补充更多信息]
碳排放量: [需要补充更多信息]

技术规格 [可选]

模型架构与目标

[需补充更多信息]

计算基础设施

[需补充更多信息]

硬件

[需补充更多信息]

软件

[需补充更多信息]

引用文献 [可选]

BibTeX格式：

[需补充更多信息]

APA格式：

[需补充更多信息]

术语表 [可选]

[需补充更多信息]

扩展信息 [可选]

[需补充更多信息]

模型卡作者 [可选]

[需补充更多信息]

模型卡联系方式

[需补充更多信息]

项目介绍

下载使用量

项目总下载次数（含Clone、Pull、 zip 包及 release 下载），每日凌晨更新

library_name: transformers tags: []

模型卡片：模型标识符

模型详情

模型描述

模型来源[可选]

用途

直接使用

下游应用[可选]

超范围使用

偏差、风险与局限性

使用建议

如何开始使用该模型

训练详情

训练数据

训练流程

预处理 [可选]

训练超参数

速度、规模与时间 [可选]

评估

测试数据、因素与指标

测试数据

因素

指标

结果

总结

模型检验 [可选]

环境影响

技术规格 [可选]

模型架构与目标

计算基础设施

硬件

软件

引用文献 [可选]

术语表 [可选]

扩展信息 [可选]

模型卡作者 [可选]

模型卡联系方式

项目介绍

下载使用量

目录