qnguyen3
/

nanoLLaVA

Text Generation

Model card Files Files and versions

qnguyen3 commited on Jun 29, 2024

Commit

01bc78e

·

verified ·

1 Parent(s): 4a1bd2e

Update modeling_llava_qwen2.py

Files changed (1) hide show

modeling_llava_qwen2.py +2 -2

modeling_llava_qwen2.py CHANGED Viewed

@@ -538,13 +538,13 @@ class SigLipVisionTower(nn.Module):
                 image_forward_out = self.vision_tower(image.to(device=self.device, dtype=self.dtype).unsqueeze(0),
                                                       output_hidden_states=True)
                 image_feature = image_forward_out.hidden_states[-1].to(image.dtype)
-                assert image_features.shape[-2] == 729
                 image_features.append(image_feature)
         else:
             image_forward_outs = self.vision_tower(images.to(device=self.device, dtype=self.dtype),
                                                    output_hidden_states=True)
             image_features = image_forward_outs.hidden_states[-1].to(images.dtype)
-            assert image_features.shape[-2] == 729
         return image_features

                 image_forward_out = self.vision_tower(image.to(device=self.device, dtype=self.dtype).unsqueeze(0),
                                                       output_hidden_states=True)
                 image_feature = image_forward_out.hidden_states[-1].to(image.dtype)
+                # assert image_features.shape[-2] == 729
                 image_features.append(image_feature)
         else:
             image_forward_outs = self.vision_tower(images.to(device=self.device, dtype=self.dtype),
                                                    output_hidden_states=True)
             image_features = image_forward_outs.hidden_states[-1].to(images.dtype)
+            # assert image_features.shape[-2] == 729
         return image_features