support double quant in BesTLA #60

zhewang1-intc · 2024-01-18T00:55:16Z

Type of Change

feature or bug fix or documentation or others: feature
API changed or not: Yes
how to enable double-quant:
auto packw=kernel.createStorage(n, k, blocksize, qtype, BTLA_DTYPE::DQ8_BNB);
double_quant blocksize will be same as blocksize,
if user want to reset double_quant blocksize just need to call
kernel.setDoubleQuantBlkSize(&packw, BTLA_DTYPE::DQ8_BNB, dq_blksize);

Description

detail description
JIRA:https://jira.devtools.intel.com/browse/NLPTOOLKIU-1102
support double-quant feature in BesTLA(scale using dynamic-tree-quantization which def from bisandbytes, for more details pls refer (8-Bit Approximations for Parallelism in Deep Learning)[https://arxiv.org/abs/1511.04561])
Supported Launcher: LauncerBase(ref getweight impl), LauncherIntKblock(avx512/avx2 getscale impl)

Expected Behavior & Potential Risk

the expected behavior that triggered by this PR

How has this PR been tested?

how to reproduce the test (including hardware information)

Dependency Change?

any library dependency introduced or removed

.gitignore

bestla/bestla/ut/bestla_ut.h

zhewang1-intc added 3 commits January 18, 2024 08:46

gitignore

1d5ce71

kernel impl

b9d6e6f

ut

e2eec50

zhewang1-intc requested review from luoyu-intel and airMeng January 18, 2024 00:55

zhewang1-intc changed the title ~~Double quant main~~ support double quant in BesTLA Jan 18, 2024

zhewang1-intc added the BesTLA label Jan 18, 2024

airMeng reviewed Jan 18, 2024

View reviewed changes

.gitignore Outdated Show resolved Hide resolved

airMeng approved these changes Jan 18, 2024

View reviewed changes

perfect ut

579c2e1

zhewang1-intc force-pushed the double_quant_main branch from 757d136 to 579c2e1 Compare January 18, 2024 01:07

airMeng reviewed Jan 18, 2024

View reviewed changes

bestla/bestla/ut/bestla_ut.h Show resolved Hide resolved

VincyZhang merged commit d9bce93 into main Jan 18, 2024
9 checks passed

zhewang1-intc deleted the double_quant_main branch January 18, 2024 04:34

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

support double quant in BesTLA #60

support double quant in BesTLA #60

zhewang1-intc commented Jan 18, 2024

support double quant in BesTLA #60

support double quant in BesTLA #60

Conversation

zhewang1-intc commented Jan 18, 2024

Type of Change

Description

Expected Behavior & Potential Risk

How has this PR been tested?

Dependency Change?