bhheo (Byeongho Heo)

upvoted 3 papers about 1 month ago

upvoted a paper 5 months ago

Token Bottleneck: One Token to Remember Dynamics

Paper • 2507.06543 • Published Jul 9 • 20

upvoted 2 collections 7 months ago

HyperCLOVA X SEED

Collection

HyperCLOVA X SEED is NAVER's lightweight open-source lineup with a strong focus on Korean language performance • 4 items • Updated Jul 22 • 28

ProLIP

Collection

Official ProLIP weights, Probabilistic Language-Image Pre-Training (ICLR 2025) • 7 items • Updated Apr 18 • 10

upvoted a paper about 1 year ago

MaskRIS: Semantic Distortion-aware Data Augmentation for Referring Image Segmentation

Paper • 2411.19067 • Published Nov 28, 2024 • 8

upvoted a collection about 1 year ago

Cosmos-Tokenizer

Collection

A suite of image and video tokenizers • 13 items • Updated about 13 hours ago • 42

upvoted 2 papers about 1 year ago

Unified Speech-Text Pretraining for Spoken Dialog Modeling

Paper • 2402.05706 • Published Feb 8, 2024 • 7

Rethinking Spatial Dimensions of Vision Transformers

Paper • 2103.16302 • Published Mar 30, 2021 • 1

upvoted 2 collections about 1 year ago

RDNet

Collection

DenseNets Reloaded: Paradigm Shift Beyond ResNets and ViTs [ECCV 2024] • 9 items • Updated Oct 16, 2024 • 3

rope-vit

Collection

Rotary Position Embedding for Vision Transformer [ECCV 2024] • 22 items • Updated Oct 16, 2024 • 4

upvoted a paper about 1 year ago

DenseNets Reloaded: Paradigm Shift Beyond ResNets and ViTs

Paper • 2403.19588 • Published Mar 28, 2024 • 4

upvoted a paper over 1 year ago

Rotary Position Embedding for Vision Transformer

Paper • 2403.13298 • Published Mar 20, 2024 • 6

Byeongho Heo

AI & ML interests

Organizations

Exploring Conditions for Diffusion models in Robotic Control

Map the Flow: Revealing Hidden Pathways of Information in VideoLLMs

RL makes MLLMs see better than SFT

Token Bottleneck: One Token to Remember Dynamics

HyperCLOVA X SEED

ProLIP

MaskRIS: Semantic Distortion-aware Data Augmentation for Referring Image Segmentation

Cosmos-Tokenizer

Unified Speech-Text Pretraining for Spoken Dialog Modeling

Rethinking Spatial Dimensions of Vision Transformers

RDNet

rope-vit

DenseNets Reloaded: Paradigm Shift Beyond ResNets and ViTs

Rotary Position Embedding for Vision Transformer

Byeongho Heo

AI & ML interests

Organizations

bhheo's activity