ltg
/

norbert4-large

Model card Files Files and versions

davda54 commited on Jun 5

Commit

30fd0e7

·

verified ·

1 Parent(s): 39265fc

fix

Files changed (1) hide show

modeling_gptbert.py +0 -3

modeling_gptbert.py CHANGED Viewed

@@ -243,9 +243,6 @@ class UnpaddedRotaryEmbedding(RotaryEmbedding):
         super().__init__(dim=dim, base=base, pos_idx_in_fp32=True, device=None, interleaved=False)
         self.max_seqlen = max_seqlen
-        if max_seqlen is not None and device is not None and dtype is not None:
-            self._update_cos_sin_cache(max_seqlen, device=device, dtype=None)
     def forward(self, qkv: torch.Tensor, cu_seqlens: torch.Tensor, max_seqlen: Optional[int] = None) -> Union[torch.Tensor, Tuple[torch.Tensor, torch.Tensor]]:
         if max_seqlen is not None:
             self._update_cos_sin_cache(max_seqlen, device=qkv.device, dtype=qkv.dtype)

         super().__init__(dim=dim, base=base, pos_idx_in_fp32=True, device=None, interleaved=False)
         self.max_seqlen = max_seqlen
     def forward(self, qkv: torch.Tensor, cu_seqlens: torch.Tensor, max_seqlen: Optional[int] = None) -> Union[torch.Tensor, Tuple[torch.Tensor, torch.Tensor]]:
         if max_seqlen is not None:
             self._update_cos_sin_cache(max_seqlen, device=qkv.device, dtype=qkv.dtype)