refactai
/

Refact-1_6B-fim

Text Generation

Model card Files Files and versions

svakhreev commited on Nov 9, 2023

Commit

fa166e1

·

1 Parent(s): c5d31de

Update modeling_gpt_refact.py

Files changed (1) hide show

modeling_gpt_refact.py +12 -0

modeling_gpt_refact.py CHANGED Viewed

@@ -503,6 +503,18 @@ class GPTRefactForCausalLM(GPTRefactPreTrainedModel):
         # Initialize weights and apply final processing
         self.post_init()
     def prepare_inputs_for_generation(self, input_ids, past_key_values=None, inputs_embeds=None, **kwargs):
         if inputs_embeds is not None and past_key_values is None:

         # Initialize weights and apply final processing
         self.post_init()
+        # gradient checkpointing support for lower versions of transformers
+        import transformers
+        from packaging import version
+        def _set_gradient_checkpointing(module, enable=False):
+            if isinstance(module, GPTRefactModel):
+                module.gradient_checkpointing = enable
+        v = version.parse(transformers.__version__)
+        if v.major <= 4 and v.minor < 35:
+            self._set_gradient_checkpointing = _set_gradient_checkpointing
     def prepare_inputs_for_generation(self, input_ids, past_key_values=None, inputs_embeds=None, **kwargs):
         if inputs_embeds is not None and past_key_values is None: