Releases · huggingface/optimum-quanto

19 Jan 15:21

dacorvo

0.0.11

283080a

release: 0.0.11

New features:

support int2 and int4 weights.

New contributors:

@younesbelkada
@a-r-r-o-w

Contributors

younesbelkada and a-r-r-o-w

Assets 2

19 Jan 15:13

dacorvo

0.0.10

5ab7e6a

release: 0.0.10

New features:

calibration streamline option to remove spurious quantize/dequantize,
calibration debug mode.

Assets 2

15 Dec 14:52

dacorvo

0.0.9

8acbefc

release: 0.0.9

New features:

quantize weights and activations parameters
float8 activations

Assets 2

08 Dec 15:31

dacorvo

0.0.8

63041a4

release: 0.0.8

New features:

weight-only quantization,
integer matmul acceleration on CUDA.

Bug fixes:

actually use float16 weights,
avoid float16 overflows,
correct device placement,
robust serialization.

Assets 2

01 Dec 15:23

dacorvo

0.0.7

93b20c7

release: 0.0.7

New features:

per-axis quantization

Assets 2

27 Oct 14:48

dacorvo

0.0.6

fe330f0

release: 0.0.6

New features:

support opt models,
support gpt-neox models,
support codegen models.

Assets 2

19 Oct 07:40

dacorvo

0.0.5

e0dd893

release: 0.0.5

New features:

support MPS devices,
support Transformer models

Assets 2

09 Oct 09:06

dacorvo

0.0.4

abfd2bc

release: 0.0.4

Fix release to add correct package metadata.

Assets 2

02 Oct 09:54

dacorvo

0.0.1

84d6cec

release: 0.0.1 Pre-release

Pre-release

Initial import of the sources.

Assets 2

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

New features:

Contributors

New features:

New features:

Bug fixes:

New features:

New features:

New features:

Releases: huggingface/optimum-quanto

release: 0.0.11

New features:

Contributors

release: 0.0.10

release: 0.0.9

New features:

release: 0.0.8

New features:

Bug fixes:

release: 0.0.7

New features:

release: 0.0.6

New features:

release: 0.0.5

New features:

release: 0.0.4

release: 0.0.1