vNPU Release Notes

v0.1.0

Features

  • 支持NPU软切分,一张NPU卡最多可切分为20个vNPU。
  • 支持AICore和显存隔离。
  • NPU资源调度策略支持binpack。
  • 支持只限制显存,不限制AICore。
  • 支持采集vNPU相关监控指标上报对接Prometheus。
  • 支持整卡调度。
  • 支持硬切分。