dd6fe347创建于 4月9日历史提交

文件	最后提交记录	最后更新时间
data	!4797 [built-in] [pytorch] t2vec 提交 * fix code * clean code * fix code * t2vec first commit for poc	2 年前
experiment	!4797 [built-in] [pytorch] t2vec 提交 * fix code * clean code * fix code * t2vec first commit for poc	2 年前
preprocessing	!4797 [built-in] [pytorch] t2vec 提交 * fix code * clean code * fix code * t2vec first commit for poc	2 年前
test	!5952 [fix][PyTorch]Adapt to Python 3.8 Merge pull request !5952 from LRJ/master	2 年前
LICENSE	!4797 [built-in] [pytorch] t2vec 提交 * fix code * clean code * fix code * t2vec first commit for poc	2 年前
README.md	fix link validity Co-authored-by: frozenleaves<914814442@qq.com> # message auto-generated for no-merge-commit merge: !7517 merge master into master fix link validity Created-by: frozenn Commit-by: frozenleaves Merged-by: ascend-robot Description: ## Motivation Please describe the motivation of this PR and the goal you want to achieve through this PR. ## Modification Please briefly describe what modification is made in this PR. ## Self-test (Optional) If modifications to this PR may cause/fix function/accuracy/performance DTSs/issues, a self-inspection record needs to be attached. ## BC-breaking (Optional) If there are compatibility issues, such as dependencies on cann/torch_npu versions, they need to be explained in the PR. ## Checklist Before PR: - [ ] The new code needs to comply with the Clean Code specification. - [ ] The PR content is self-checked, and the expression can be clear and the writing standardized After PR: - [ ] CLA has been signed and all committers have signed the CLA in this PR. - [ ] The ci-pipeline is passed, Code Check is passed. See merge request: Ascend/ModelZoo-PyTorch!7517	1 个月前
constants.py	!4797 [built-in] [pytorch] t2vec 提交 * fix code * clean code * fix code * t2vec first commit for poc	2 年前
data_utils.py	!4797 [built-in] [pytorch] t2vec 提交 * fix code * clean code * fix code * t2vec first commit for poc	2 年前
evales.jl	!4986 [built-in] [bugfix] 修改评估脚本bug * fix code spell error	2 年前
evaluate.py	!4797 [built-in] [pytorch] t2vec 提交 * fix code * clean code * fix code * t2vec first commit for poc	2 年前
hyper-parameters.json	!4797 [built-in] [pytorch] t2vec 提交 * fix code * clean code * fix code * t2vec first commit for poc	2 年前
models.py	!4797 [built-in] [pytorch] t2vec 提交 * fix code * clean code * fix code * t2vec first commit for poc	2 年前
pkg-install.jl	!4797 [built-in] [pytorch] t2vec 提交 * fix code * clean code * fix code * t2vec first commit for poc	2 年前
public_address_statement.md	!5846 Network address of models to be rectified: 21 Merge pull request !5846 from longyw/network21	2 年前
qidong.sh	!4797 [built-in] [pytorch] t2vec 提交 * fix code * clean code * fix code * t2vec first commit for poc	2 年前
requirements.txt	!4797 [built-in] [pytorch] t2vec 提交 * fix code * clean code * fix code * t2vec first commit for poc	2 年前
t2vec.py	!4797 [built-in] [pytorch] t2vec 提交 * fix code * clean code * fix code * t2vec first commit for poc	2 年前
test.py	!4797 [built-in] [pytorch] t2vec 提交 * fix code * clean code * fix code * t2vec first commit for poc	2 年前
train.py	!5025 [built-in][auto prof] t2vec添加自动化profiler * add auto profiler	2 年前
viz.py	!4797 [built-in] [pytorch] t2vec 提交 * fix code * clean code * fix code * t2vec first commit for poc	2 年前

T2vec for PyTorch

概述

简述

t2vec提出了一种基于深度学习的轨迹相似性计算方法，通过学习轨迹的表示向量来缓解轨迹数据中不一致采样率和噪声的影响。

参考实现：

url=https://github.com/boathit/t2vec
commit_id=942d2faca5c9b79d806f458524bb197e7516751

适配昇腾AI 处理器的实现：

url=https://gitcode.com/ascend/ModelZoo-PyTorch.git
code_path=PyTorch/built-in/others

准备训练环境

该模型为不随版本演进模型（随版本演进模型范围可在此处查看），未在最新昇腾配套软件中适配验证，您可以：

根据下面提供PyTorch版本在软件版本配套表中选择匹配的CANN等软件下载使用。
查看软件版本配套表后确认对该模型有新版本PyTorch和CANN中的适配需求，请在modelzoo/issues中提出您的需求。自行适配不保证精度和性能达标。

准备环境

当前模型支持的 PyTorch 历史版本和已知三方库依赖如下表所示。

表 1 版本支持表

Torch_Version 三方库依赖版本

PyTorch 1.5

PyTorch 1.8

PyTorch 1.11

PyTorch 2.1
环境准备指导。

请参考《Pytorch框架训练环境准备》。需配套二进制包使用。
安装依赖。

在模型源码包根目录下执行命令，安装模型对应PyTorch版本需要的依赖。
```
pip install -r requirements.txt
```

Torch_Version	三方库依赖版本
PyTorch 1.5
PyTorch 1.8
PyTorch 1.11
PyTorch 2.1

安装julia及其相关依赖。

wget https://julialang-s3.julialang.org/bin/linux/x64/1.6/julia-1.6.1-linux-x86_64.tar.gz # 根据实际架构获取

tar xvfz julia-1.6.1-linux-x86_64.tar.gz

sudo ln -s `realpath ./julia-1.6.1/bin/julia` /usr/local/bin/julia # 根据实际情况建立软链

安装必要依赖


julia pkg-install.jl # 确保此步在t2vec目录下

准备数据集

获取数据集。

用户自行下载 Porto 开源数据集，并参考源码仓对数据进行处理。

把数据放置项目根目录/data下。

数据集目录结构参考如下所示。

├─项目根目录/data
       |-- exp-trj.h5
       |-- exp-trj.t
       |-- porto-param-cell100
       |-- porto-vocab-dist-cell100.h5
       |-- porto.csv
       |-- porto.h5
       |-- train.mta
       |-- train.src
       |-- train.trg
       |-- training.log
       |-- trj.t
       |-- val.mta
       |-- val.src
       |-- val.trg

说明： 该数据集的训练过程脚本只作为一种参考示例。

开始训练

训练模型

进入解压后的源码包根目录。
```
cd /${模型文件夹名称}
```

运行训练脚本。

该模型支持单机单卡训练

单机单卡训练

启动单卡训练。

bash ./test/train_performance_1p.sh --data_path=/data/xxx/  # 单卡性能

bash ./test/train_full_1p.sh --data_path=/data/xxx/  # 单卡精度

单机单卡评测

启动单卡评测。

julia evales.jl --data_path 数据集路径 --pth_path 模型权重文件路径  # 单卡评测

--data_path参数填写数据集路径，需写到数据集的一级目录。

--pth_path参数填写模型权重文件路径，需写到权重文件的一级目录。

模型训练脚本参数说明如下。

公共参数：
--vocab_size                        //词汇大小
--data                              //数据集路径
--criterion_name                    //使用损失函数名
--batch_size                        //训练批次大小
--steps                             //训练迭代次数
--local_rank                        //使用卡号

训练完成后，权重文件保存在data下，日志信息保存在test/output并输出模型训练精度和性能信息。

训练结果展示

表 2 训练结果展示表

NAME	MR(dbsize:2k)	FPS	AMP_Type	Torch_Version
1p-竞品V	2.421	982	O1	1.8
1p-NPU	2.382	997	O1	1.8

版本说明

变更

2023.6.1：首次发布。

FAQ

无。

公网地址说明

代码涉及公网地址参考 public_address_statement.md