ltg
/

norbert4-large

Model card Files Files and versions

davda54 commited on May 23

Commit

790a5cc

·

verified ·

1 Parent(s): 3e445a9

updated MLM predictions

Files changed (1) hide show

modeling_gptbert.py +4 -0

modeling_gptbert.py CHANGED Viewed

@@ -778,6 +778,10 @@ class GptBertForMaskedLM(GptBertModel):
             subword_prediction_flatten = subword_prediction[:, :-1].flatten(0, 1)
             masked_lm_loss = F.cross_entropy(subword_prediction_flatten, labels_flatten)
         if not return_dict:
             output = (
                 subword_prediction,

             subword_prediction_flatten = subword_prediction[:, :-1].flatten(0, 1)
             masked_lm_loss = F.cross_entropy(subword_prediction_flatten, labels_flatten)
+        bos_logits = torch.zeros(subword_prediction.size(0), 1, self.config.vocab_size, dtype=subword_prediction.dtype, device=subword_prediction.device)
+        bos_logits[:, :, self.config.bos_token_id] = 1.0
+        subword_prediction = torch.cat([bos_logits, subword_prediction[:, :-1]], dim=1)
         if not return_dict:
             output = (
                 subword_prediction,