deallocate_cache

产品支持情况

产品 是否支持
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 推理系列产品
Atlas A2 训练系列产品 x

函数功能

释放Cache。

如果该Cache在Allocate时关联了CacheKey,则实际的释放会延后到所有的CacheKey被拉取或执行了remove_cache_key

函数原型

deallocate_cache(cache: KvCache)

参数说明

参数名称 数据类型 取值说明
cache KvCache 要释放的KV Cache。

调用示例

kv_cache_manager.deallocate_cache(kv_cache)

返回值

正常情况下无返回值。

参数错误可能抛出TypeError或ValueError。

执行时间超过sync_kv_timeout配置会抛出LLMException异常。

约束说明

  • 如果KvCache不存在或已释放,该操作为空操作。
  • 本接口不支持并发调用。