kykim
/

bertshared-kor-base

encoder-decoder

text2text-generation

Model card Files Files and versions

kykim commited on Feb 23, 2021

Commit

8ea2767

·

1 Parent(s): abc96ec

Create README.md

Files changed (1) hide show

README.md +16 -0

README.md ADDED Viewed

	@@ -0,0 +1,16 @@

+---
+language: ko
+---
+# Bert base model for Korean
+* 70GB Korean text dataset and 42000 lower-cased subwords are used
+* Check the model performance and other language models for Korean in [github](https://github.com/kiyoungkim1/LM-kor)
+```python
+# only for pytorch in transformers
+from transformers import BertTokenizerFast, EncoderDecoderModel
+tokenizer = BertTokenizerFast.from_pretrained("kykim/bertshared-kor-base")
+model = EncoderDecoderModel.from_pretrained("kykim/bertshared-kor-base")
+```