From caf1832526e4ad54ae8fe8e947f19ed690f35a40 Mon Sep 17 00:00:00 2001
From: Tim Dettmers <tim.dettmers@gmail.com>
Date: Sun, 6 Nov 2022 11:47:54 -0800
Subject: Added k-bit linear quantization.

---
 tests/test_functional.py | 50 ++++++++++++++++++++++++++++++++++++++++++++++++
 1 file changed, 50 insertions(+)

(limited to 'tests/test_functional.py')

diff --git a/tests/test_functional.py b/tests/test_functional.py
index 329b270..494bf51 100644
--- a/tests/test_functional.py
+++ b/tests/test_functional.py
@@ -2091,3 +2091,53 @@ def test_fp8_quant():
         print(3, sum(abserr)/len(abserr))
         print(3, sum(relerr)/len(relerr))
 
+
+def test_few_bit_quant():
+
+    for bits in range(2, 9):
+        code = F.create_linear_map(True, bits=bits).cuda()
+        assert code.numel() == 256
+        print(bits)
+        for i in range(100):
+
+            values = torch.randn(1, 24, device='cuda')
+            values /= values.abs().max()
+            #values[values.abs() < 1e-6] += 1e-5
+
+            q1 = []
+            v1 = []
+            for v in values[0]:
+                idx = torch.abs(v-code).argmin()
+                q1.append(idx.item())
+                v1.append(code[idx].item())
+
+            q1 = torch.Tensor(q1).cuda()
+            v1 = torch.Tensor(v1).cuda()
+
+            q2, S2 = F.quantize(values, code=code)
+            v2 = F.dequantize(q2, S2)
+
+            idx = torch.isclose(q1.int(), q2.int())
+            if idx.sum():
+                # some weird cases
+                err1 = torch.abs(v1-values).mean()
+                err2 = torch.abs(v2-values).mean()
+                assert err2 <= err1
+
+            else:
+                torch.testing.assert_allclose(q1, q2)
+
+    #print(e_bits, p_bits)
+    #abserr = []
+    #relerr = []
+    #for i in range(100):
+    #    A1 = torch.randn(1024, 1024, device="cuda")
+    #    C, SC = F.quantize_blockwise(A1, code=code)
+    #    A2 = F.dequantize_blockwise(C, SC)
+    #    diff = torch.abs(A1 - A2)
+    #    reldiff = diff/torch.abs(A1+1e-8)
+    #    abserr.append(diff.mean().item())
+    #    relerr.append(reldiff.mean().item())
+    #    #assert diff < 0.0075
+    #print(sum(abserr)/len(abserr))
+    #print(sum(relerr)/len(relerr))
-- 
cgit v1.2.3