fix bug

2023-04-22 17:23:24 +08:00 · 2023-04-22 17:23:24 +08:00 · 9fe5ab3642
parent 4e42965c0d
commit 9fe5ab3642
2 changed files with 50 additions and 20 deletions
--- a/model_attn_mlp_patch.py
+++ b/model_attn_mlp_patch.py
@ -209,6 +209,26 @@ class CustomLoraLayerMerged(torch.nn.Module):
        return q, v
 class LoraInjectionWrapper:
    def __init__(self, module, lora_layer):
        self.module = module
        self.lora_layer = lora_layer
    def apply(self):
        self.module.forward_before_lora = self.module.forward
        self.module.forward = self.forward_with_lora
        self.module.is_lora_injected = True
    def forward_with_lora(self, x):
        result = self.module.forward_before_lora(x)
        q, v = self.lora_layer(x)
        dim = self.module.out_features // 3
        result[:, :, :dim] += q
        result[:, :, -dim:] += v
        return result
 def inject_lora_layers(model, lora_path, device='cuda', dtype=torch.float16):
    print('Device: {}, dtype: {}'.format(device, dtype))
@ -263,6 +283,7 @@ def inject_lora_layers(model, lora_path, device='cuda', dtype=torch.float16):
        lora_layers[prefix] = lora_layer
    # Injection
    wrappers = []
    for n, m in model.named_modules():
        if 'qkv_proj' in n and isinstance(m, Autograd4bitQuantLinear):
            # restoring forward
@ -270,16 +291,10 @@ def inject_lora_layers(model, lora_path, device='cuda', dtype=torch.float16):
                m.forward = m.forward_before_lora
            prefix = re.findall('^model\.layers\.\d+\.', n)[0]
            lora_layer = lora_layers[prefix]
-            m.forward_before_lora = m.forward
+            wrapper = LoraInjectionWrapper(m, lora_layer)
-            def forward_with_lora(self, x):
+            wrapper.apply()
-                result = self.forward_before_lora(x)
+            wrappers.append(wrapper)
                q, v = lora_layer(x)
                dim = self.out_features // 3
                result[:, :, :dim] += q
                result[:, :, -dim:] += v
                return result
            m.forward = types.MethodType(forward_with_lora, m)
            m.is_lora_injected = True
    print('Lora Injected.')
    return wrappers
--- a/monkeypatch/gptq_for_llala_lora_monkey_patch.py
+++ b/monkeypatch/gptq_for_llala_lora_monkey_patch.py
@ -21,6 +21,26 @@ class CustomLoraLayerMerged(torch.nn.Module):
        return q, v
 class LoraInjectionWrapper:
    def __init__(self, module, lora_layer):
        self.module = module
        self.lora_layer = lora_layer
    def apply(self):
        self.module.forward_before_lora = self.module.forward
        self.module.forward = self.forward_with_lora
        self.module.is_lora_injected = True
    def forward_with_lora(self, x):
        result = self.module.forward_before_lora(x)
        q, v = self.lora_layer(x)
        dim = self.module.outfeatures // 3
        result[:, :, :dim] += q
        result[:, :, -dim:] += v
        return result
 def inject_lora_layers(model, lora_path, device='cuda', dtype=torch.float16):
    print('Device: {}, dtype: {}'.format(device, dtype))
@ -75,6 +95,7 @@ def inject_lora_layers(model, lora_path, device='cuda', dtype=torch.float16):
        lora_layers[prefix] = lora_layer
    # Injection
    wrappers = []
    for n, m in model.named_modules():
        if 'qkv_proj' in n and isinstance(m, QuantLinear):
            # restoring forward
@ -82,15 +103,9 @@ def inject_lora_layers(model, lora_path, device='cuda', dtype=torch.float16):
                m.forward = m.forward_before_lora
            prefix = re.findall('^model\.layers\.\d+\.', n)[0]
            lora_layer = lora_layers[prefix]
-            m.forward_before_lora = m.forward
+            wrapper = LoraInjectionWrapper(m, lora_layer)
-            def forward_with_lora(self, x):
+            wrapper.apply()
-                result = self.forward_before_lora(x)
+            wrappers.append(wrapper)
                q, v = lora_layer(x)
                dim = self.outfeatures // 3
                result[:, :, :dim] += q
                result[:, :, -dim:] += v
                return result
            m.forward = types.MethodType(forward_with_lora, m)
            m.is_lora_injected = True
    print('Lora Injected.')
    return wrappers