ielabgroup
/

Starbucks-msmarco

Model card Files Files and versions

ArvinZhuang commited on Oct 18, 2024

Commit

18da06d

·

verified ·

1 Parent(s): 86d1e5b

Update README.md

Files changed (1) hide show

README.md +2 -0

README.md CHANGED Viewed

@@ -8,6 +8,8 @@ base_model:
 - ielabgroup/bert-base-uncased-fineweb100bt-smae
 ---
 This model is a bert-baase-uncased size model initialized with [ielabgroup/bert-base-uncased-fineweb100bt-smae](https://huggingface.co/ielabgroup/bert-base-uncased-fineweb100bt-smae) fine-tuned on MS MARCO dataset with Starbucks Representation Learning (SRL) method. SRL enables elastic layer-dimension embedding generation for search.
 The following layer-dimension pairs are involved during fine-tuning: [(2, 32), (4, 64), (6, 128), (8, 256), (10, 512), (12, 768)]

 - ielabgroup/bert-base-uncased-fineweb100bt-smae
 ---
+Model used in [Starbucks: Improved Training for 2D Matryoshka Embeddings](https://arxiv.org/pdf/2410.13230)
 This model is a bert-baase-uncased size model initialized with [ielabgroup/bert-base-uncased-fineweb100bt-smae](https://huggingface.co/ielabgroup/bert-base-uncased-fineweb100bt-smae) fine-tuned on MS MARCO dataset with Starbucks Representation Learning (SRL) method. SRL enables elastic layer-dimension embedding generation for search.
 The following layer-dimension pairs are involved during fine-tuning: [(2, 32), (4, 64), (6, 128), (8, 256), (10, 512), (12, 768)]