huaweicloud-regionless-dataset:面向计算资源编排调度的标准数据集

huaweicloud-regionless-dataset

Branch3Tags0

无地域编排数据集

概览

无地域编排数据集由华为集团发布。通过提供计算资源编排与调度的标准数据集,能够帮助研究人员更有效地研究和训练调度算法。本数据集基于Apache License V2.0开源。使用数据集时,请遵循开源协议。

该数据集包含了20个租户在17个区域122天内的使用数据。每个租户拥有独立的表格。每张表格包含四个字段:日期、区域ID、租户使用的虚拟机类型ID,以及租户在当前时间使用的虚拟机核心数。

例如:

日期 区域ID 虚拟机类型ID 使用虚拟机核心数
1 00:00:00 r8 v3 272
1 00:00:00 r1 v1 30
1 00:10:00 r1 v3 32
1 00:10:00 r4 v5 1568

以下是对数据集的一些说明,以避免用户产生混淆。

  1. 某个租户可能使用的数据中心或虚拟机类型可能未包含在追踪数据中。
  2. 对于特定租户的数据,如果某一天没有记录的区域和虚拟机类型,代表该租户当天没有使用这些资源。
  3. 对于特定租户的数据,如果某一天没有任何记录,意味着该租户当天没有使用虚拟机。

我们鼓励任何人出于研究或学术目的使用这些数据集,如果您在使用过程中有任何问题,请提交一个issue。提交issue是推荐的做法,因为这有助于社区的讨论。请注意,您的问题描述越清晰,得到明确答案的可能性越高。

我们基于Apache License V2.0开源。使用数据集时,请遵循开源协议,并引用我们的论文。

@inproceedings{shi2022characterizing,
  title={Characterizing and orchestrating VM reservation in geo-distributed clouds to improve the resource efficiency},
  author={Shi, Jiuchen and Fu, Kaihua and Chen, Quan and Yang, Changpeng and Huang, Pengfei and Zhou, Mosong and Zhao, Jieru and Chen, Chen and Guo, Minyi},
  booktitle={Proceedings of the 13th Symposium on Cloud Computing},
  pages={94--109},
  year={2022}
}

使用无地域编排数据集的论文

石九臣、傅凯华、陈泉、杨长鹏、黄鹏飞、周莫松、赵洁儒、陈晨、郭明怡。在地域分布式云中对虚拟机预留进行特征化与编排以提高资源效率[C]//第13届云计算研讨会论文集。2022:94-109。

论文链接:https://dl.acm.org/doi/abs/10.1145/3542929.3563490

许可

根据Apache许可协议V2.0。

未来工作

未来将发布更多数据集。

Introduction

huaweicloud-regionless-dataset

Customize my domain