aclblasGemvEx
产品支持情况
产品
|
是否支持
|
Atlas A3 训练系列产品/Atlas A3 推理系列产品
|
√
|
Atlas A2 训练系列产品/Atlas A2 推理系列产品
|
√
|
功能说明
执行矩阵-向量的乘法,y = αAx + βy,输入数据、输出数据的数据类型通过入参设置。异步接口。
A、x、y的数据类型仅支持以下组合, α和β的数据类型与y一致。
A的数据类型
|
x的数据类型
|
y的数据类型
|
aclFloat16
|
aclFloat16
|
aclFloat16
|
aclFloat16
|
aclFloat16
|
float(float32)
|
int8_t
|
int8_t
|
float(float32)
|
int8_t
|
int8_t
|
int32_t
|
函数原型
aclError aclblasGemvEx(aclTransType transA,
int m,
int n,
const void *alpha,
const void *a,
int lda,
aclDataType dataTypeA,
const void *x,
int incx,
aclDataType dataTypeX,
const void *beta,
void *y,
int incy,
aclDataType dataTypeY,
aclComputeType type,
aclrtStream stream)
参数说明
参数名
|
输入/输出
|
说明
|
transA
|
输入
|
A矩阵是否转置的标记。
|
m
|
输入
|
矩阵A的行数,存储矩阵乘数据时,行优先。
|
n
|
输入
|
矩阵A的列数。
|
alpha
|
输入
|
用于执行乘操作的标量α的指针。
|
a
|
输入
|
矩阵A的指针。
|
lda
|
输入
|
A矩阵的主维,此时选择转置,按行优先,则lda为A的列数。预留参数,当前只能设置为-1。
|
dataTypeA
|
输入
|
矩阵A的数据类型。
|
x
|
输入
|
向量x的指针。
|
incx
|
输入
|
x连续元素之间的步长。
预留参数,当前只能设置为-1。
|
dataTypeX
|
输入
|
向量x的数据类型。
|
beta
|
输入
|
用于执行乘操作的标量β的指针。
|
y
|
输入&输出
|
向量y的指针。
|
incy
|
输入
|
y连续元素之间的步长。
预留参数,当前只能设置为-1。
|
dataTypeY
|
输入
|
向量y的数据类型。
|
type
|
输入
|
计算精度,默认高精度。
|
stream
|
输入
|
执行算子所在的Stream。
|
返回值说明
返回0表示成功,返回其他值表示失败,请参见aclError。