AstraMindAI
/

xtts2-gpt

Model card Files Files and versions

mlinmg commited on Dec 4, 2024

Commit

604db92

·

verified ·

1 Parent(s): aebdb64

Update tokenizer.py

Files changed (1) hide show

tokenizer.py +1 -1

tokenizer.py CHANGED Viewed

@@ -773,7 +773,7 @@ class XTTSTokenizerFast(PreTrainedTokenizerFast):
             char_limit = self.char_limits.get(base_lang, 250)
             # Clean and preprocess
-            text = self.preprocess_text(text, text_lang)
             # Split text into sentences/chunks based on language
             chunk_list = split_sentence(text, base_lang, text_split_length=char_limit)

             char_limit = self.char_limits.get(base_lang, 250)
             # Clean and preprocess
+            #text = self.preprocess_text(text, text_lang) we do this in the hidden function
             # Split text into sentences/chunks based on language
             chunk_list = split_sentence(text, base_lang, text_split_length=char_limit)