zai-org
/

chatglm-6b

Model card Files Files and versions

YiKaiNan commited on Jun 6, 2024

Commit

cf91ae9

·

verified ·

1 Parent(s): 8b7d335

Update tokenization_chatglm.py

Files changed (1) hide show

tokenization_chatglm.py +2 -1

tokenization_chatglm.py CHANGED Viewed

@@ -193,6 +193,7 @@ class ChatGLMTokenizer(PreTrainedTokenizer):
             num_image_tokens=20000,
             **kwargs
     ) -> None:
         super().__init__(
             do_lower_case=do_lower_case,
             remove_space=remove_space,
@@ -218,7 +219,7 @@ class ChatGLMTokenizer(PreTrainedTokenizer):
         self.mask_token = mask_token
         self.gmask_token = gmask_token
-        self.sp_tokenizer = SPTokenizer(vocab_file, num_image_tokens=num_image_tokens)
         """ Initialisation """

             num_image_tokens=20000,
             **kwargs
     ) -> None:
+        self.sp_tokenizer = SPTokenizer(vocab_file, num_image_tokens=num_image_tokens)
         super().__init__(
             do_lower_case=do_lower_case,
             remove_space=remove_space,
         self.mask_token = mask_token
         self.gmask_token = gmask_token
         """ Initialisation """