SentenceTransformer based on BAAI/bge-m3
This is a sentence-transformers model finetuned from BAAI/bge-m3 on the cl_legal_ver2 dataset. It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
Model Details
Model Description
- Model Type: Sentence Transformer
- Base model: BAAI/bge-m3
- Maximum Sequence Length: 512 tokens
- Output Dimensionality: 1024 dimensions
- Similarity Function: Cosine Similarity
- Training Dataset:
Model Sources
- Documentation: Sentence Transformers Documentation
- Repository: Sentence Transformers on GitHub
- Hugging Face: Sentence Transformers on Hugging Face
Full Model Architecture
SentenceTransformer(
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False, 'architecture': 'XLMRobertaModel'})
(1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Normalize()
)
Usage
Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("zerostratos/monolingual-vietnamese-bge")
# Run inference
sentences = [
'Represent this sentence for searching relevant passages: thời hiệu xử phạt vi phạm hành chính đối với người giới thiệu sai lệch giá trị di tích lịch sử văn hóa việt nam là bao lâu',
'2. cục trưởng cục quản lý thị trường cấp tỉnh, cục trưởng cục nghiệp vụ quản lý thị trường thuộc tổng cục quản lý thị trường có quyền: a) phạt cảnh cáo; b) phạt tiền đến 50.000.000 đồng; c) tịch thu tang vật, phương tiện vi phạm hành chính; d) tước quyền sử dụng giấy phép, chứng chỉ hành nghề có thời hạn hoặc đình chỉ hoạt động có thời hạn; đ) áp dụng các biện pháp khắc phục hậu quả quy định tại các điểm a, đ, e, i và k khoản 1 điều 28 luật xử lý vi phạm hành chính.',
'điều 3. hình thức xử phạt\n1. hình thức xử phạt chính: a) cảnh cáo; b) phạt tiền.\n2. hình thức xử phạt bổ sung: a) tước quyền sử dụng giấy phép có thời hạn; b) tịch thu tang vật, phương tiện vi phạm hành chính.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 1024]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities)
# tensor([[1.0000, 1.0000, 1.0000],
# [1.0000, 1.0000, 1.0000],
# [1.0000, 1.0000, 1.0000]])
Training Details
Training Dataset
cl_legal_ver2
- Dataset: cl_legal_ver2 at 3fbd3d0
- Size: 1,000,325 training samples
- Columns:
anchor,positive, andnegative - Approximate statistics based on the first 1000 samples:
anchor positive negative type string string string details - min: 17 tokens
- mean: 35.58 tokens
- max: 99 tokens
- min: 5 tokens
- mean: 177.08 tokens
- max: 370 tokens
- min: 4 tokens
- mean: 143.65 tokens
- max: 365 tokens
- Samples:
anchor positive negative Represent this sentence for searching relevant passages: thời hiệu xử phạt vi phạm hành chính đối với đấu giá viên không truất quyền tham dự cuộc đấu giá tài sản khi người tham gia đấu giá có hành vi cung cấp thông tin, tài liệu sai sự thật là bao lâu7. sửa đổi, bổ sung khoản 3 điều 18 như sau:
“3. trong phạm vi nhiệm vụ, quyền hạn của mình, bộ trưởng, thủ trưởng cơ quan ngang bộ, chủ tịch ủy ban nhân dân các cấp, thủ trưởng cơ quan, đơn vị của người có thẩm quyền xử lý vi phạm hành chính có trách nhiệm phát hiện quyết định về xử lý vi phạm hành chính do mình hoặc cấp dưới ban hành có sai sót và kịp thời đính chính, sửa đổi, bổ sung hoặc hủy bỏ, ban hành quyết định mới theo thẩm quyền. chính phủ quy định chi tiết khoản này.”.
8. sửa đổi, bổ sung khoản 3 điều 21 như sau:
“3. mỗi vi phạm hành chính được quy định một hình thức xử phạt chính, có thể quy định một hoặc nhiều hình thức xử phạt bổ sung kèm theo. hình thức xử phạt bổ sung được áp dụng kèm theo hình thức xử phạt chính, trừ trường hợp quy định tại khoản 2 điều 65 của luật này.”.
9. sửa đổi, bổ sung khoản 3 và khoản 4 điều 23 như sau:điều 5. thời hiệu và thời điểm xác định thời hiệu xử phạt vi phạm hành chính
1. thời hiệu xử phạt vi phạm hành chính đối với lĩnh vực đầu tư, đấu thầu, đăng ký doanh nghiệp là 01 năm; đối với lĩnh vực quy hoạch là 02 năm.Represent this sentence for searching relevant passages: quảng cáo hàng hóa bằng việc so sánh chất lượng hàng hóa với công ty đối thủ nhưng không chứng minh được nội dung thì bị xử phạt như thế nàotế thu được từ bảo hiểm cháy, nổ bắt buộc của các doanh nghiệp bảo hiểm trong năm tài chính. d) hỗ trợ khen thưởng thành tích của tổ chức, cá nhân trực tiếp tham gia, phối hợp trong công tác phòng cháy, chữa cháy. chi cho nội dung này không vượt quá 10% số tiền thực tế thu được từ bảo hiểm cháy, nổ bắt buộc của các doanh nghiệp bảo hiểm trong năm tài chính.4. số tiền thực tế thu được từ bảo hiểm cháy, nổ bắt buộc cho hoạt động phòng cháy, chữa cháy cuối năm chưa sử dụng hết cho từng nội dung quy định tại khoản 3 điều này được chuyển sang năm sau để tiếp tục sử dụng.của pháp luật về quản lý, sử dụng và quyết toán kinh phí bảo đảm cho công tác phổ biến, giáo dục pháp luật;c) chi hỗ trợ lực lượng cảnh sát phòng cháy, chữa cháy và cứu nạn, cứu hộ trong hoạt động tập huấn, bồi dưỡng nghiệp vụ tuyên truyền, kiểm tra về phòng cháy, chữa cháy, điều tra, xử lý vụ cháy, huấn luyện nghiệp vụ về chữa cháy, cứu nạn, cứu hộ; thực hiện kiểm tra, giám sát việc tham gia bảo hiểm cháy, nổ bắt buộc của các cơ sở: tối đa không quá 15% số tiền thực tế thu được từ bảo hiểm cháy, nổ bắt buộc của các doanh nghiệp bảo hiểm trong năm tài chính. nội dung chi, mức chi thực hiện theo chế độ chi tiêu tài chính hiện hành; d) chi hỗ trợ khen thưởng thành tích của tổ chức, cá nhân trực tiếp tham gia, phối hợp trong công tác phòng cháy, chữa cháy, cứu nạn, cứu hộ: tối đa không quá 5% số tiền thực tế thu được từ bảo hiểm cháy, nổ bắt buộc của các doanh nghiệp bảo hiểm trong năm tài chính.Represent this sentence for searching relevant passages: có bao nhiêu loại hợp đồng xây dựng theo quy định hiện nayphép xây dựng theo quy định của luật này; h) nhà ở riêng lẻ có quy mô dưới 07 tầng thuộc dự án đầu tư xây dựng khu đô thị, dự án đầu tư xây dựng nhà ở có quy hoạch chi tiết 1/500 đã được cơ quan nhà nước có thẩm quyền phê duyệt;i) công trình xây dựng cấp iv, nhà ở riêng lẻ ở nông thôn có quy mô dưới 07 tầng và thuộc khu vực không có quy hoạch đô thị, quy hoạch xây dựng khu chức năng hoặc quy hoạch chi tiết xây dựng điểm dân cư nông thôn đã được cơ quan nhà nước có thẩm quyền phê duyệt; công trình xây dựng cấp iv, nhà ở riêng lẻ ở miền núi, hải đảo thuộc khu vực không có quy hoạch đô thị, quy hoạch xây dựng khu chức năng; trừ công trình, nhà ở riêng lẻ được xây dựng trong khu bảo tồn, khu di tích lịch sử - văn hóa; k) chủ đầu tư xây dựng công trình quy định tại các điểm b, e, g, h và i khoản này, trừ nhà ở riêng lẻ quy định tại điểm i khoản này có trách nhiệm gửi thông báo thời điểm khởi công xây dựng, hồ sơ thiết kế xây dựng theo quy định đến cơ quan quản lý nhà nước về xây dựng tại đị...04/2017/tt-bxd ngày 30 tháng 3 năm 2017 của bộ trưởng bộ xây dựng quy định về quản lý an toàn lao động trong thi công xây dựng công trình.2. trong quá trình thực hiện nếu có vướng mắc, tổ chức, cá nhân gửi ý kiến về bộ xây dựng để xem xét, giải quyết./. - Loss:
TripletLosswith these parameters:{ "distance_metric": "TripletDistanceMetric.EUCLIDEAN", "triplet_margin": 5 }
Evaluation Dataset
cl_legal_ver2
- Dataset: cl_legal_ver2 at 3fbd3d0
- Size: 285,822 evaluation samples
- Columns:
anchor,positive, andnegative - Approximate statistics based on the first 1000 samples:
anchor positive negative type string string string details - min: 16 tokens
- mean: 35.79 tokens
- max: 79 tokens
- min: 3 tokens
- mean: 179.51 tokens
- max: 390 tokens
- min: 6 tokens
- mean: 151.24 tokens
- max: 361 tokens
- Samples:
anchor positive negative Represent this sentence for searching relevant passages: thời hiệu xử phạt vi phạm hành chính đối với đấu giá viên tẩy xoá, sửa chữa làm sai lệch nội dung thẻ đấu giá viên là bao lâu3. việc sử dụng, bảo quản kết quả thu thập được bằng phương tiện, thiết bị kỹ thuật nghiệp vụ phải bảo đảm các yêu cầu, điều kiện sau đây:a) kết quả thu thập được bằng phương tiện, thiết bị kỹ thuật nghiệp vụ là bản ảnh, hình ảnh, phiếu in, chỉ số đo, dữ liệu lưu trong bộ nhớ của phương tiện, thiết bị kỹ thuật nghiệp vụ theo quy định của luật này; b) kết quả thu thập được bằng phương tiện, thiết bị kỹ thuật nghiệp vụ chỉ được sử dụng để xử phạt vi phạm hành chính khi bảo đảm các yêu cầu, điều kiện quy định tại khoản 2 điều này; c) khi có kết quả thu được bằng phương tiện, thiết bị kỹ thuật nghiệp vụ, người có thẩm quyền xử phạt vi phạm hành chính phải nhanh chóng xác định tổ chức, cá nhân vi phạm hành chính và thông báo bằng văn bản đến tổ chức, cá nhân vi phạm. trường hợp xác định được tổ chức, cá nhân vi phạm, người có thẩm quyền phải tiến hành lập biên bản vi phạm hành chính theo quy định tại điều 58 của luật này và kết quả thu được bằng phương tiện, thiết bị kỹ thuật nghiệp vụ được...điều 26. thời hiệu xử lý vi phạm thời hiệu xử lý vi phạm đối với người trúng đấu giá quy định tại điều 25 nghị định này là 01 năm kể từ ngày ban hành quyết định hủy quyết định công nhận kết quả đấu giá.Represent this sentence for searching relevant passages: tôi nghe nói có trường hợp hợp tác liên kết giáo dục với nước ngoài, vậy cần phải làm những gì để được phê duyệthợp chương trình giáo dục; e) giấy chứng nhận kiểm định chất lượng giáo dục của chương trình giáo dục nước ngoài hoặc giấy tờ phê duyệt chương trình giáo dục nước ngoài của cơ quan, tổ chức có thẩm quyền (bản sao có chứng thực hoặc bản sao kèm bản chính để đối chiếu);g) đề án thực hiện liên kết giáo dục với nước ngoài do các bên liên kết xây dựng theo mẫu số 02 tại phụ lục ban hành kèm theo nghị định này, bao gồm các nội dung chủ yếu: sự cần thiết; giới thiệu các bên liên kết; nội dung liên kết; cơ sở vật chất, thiết bị; danh sách giáo viên dự kiến kèm theo lý lịch chuyên môn; đối tượng, tiêu chí và quy mô tuyển sinh; văn bằng, chứng chỉ sẽ cấp, tính tương đương của văn bằng, chứng chỉ của nước ngoài đối với văn bằng, chứng chỉ của hệ thống giáo dục quốc dân việt nam (nếu có); biện pháp bảo đảm quyền lợi của người học và người lao động; bộ phận phụ trách liên kết, lý lịch cá nhân của người đại diện cơ sở giáo dục việt nam và cơ sở giáo dục nước ngoài tham gia quản lý chương trình; mức ...hợp tác về giáo dục với nước ngoài
1. nhà nước khuyến khích và tạo điều kiện cho cơ sở giáo dục của việt nam hợp tác với tổ chức, cá nhân nước ngoài, người việt nam định cư ở nước ngoài trong giảng dạy, học tập và nghiên cứu khoa học.
2. nhà nước khuyến khích và tạo điều kiện cho công dân việt nam ra nước ngoài giảng dạy, học tập, nghiên cứu khoa học và trao đổi học thuật theo hình thức tự túc hoặc bằng kinh phí do tổ chức, cá nhân trong nước cấp hoặc do tổ chức, cá nhân nước ngoài tài trợ.
3. nhà nước dành ngân sách cử người đủ tiêu chuẩn về phẩm chất, đạo đức và trình độ đi học tập, nghiên cứu ở nước ngoài về những ngành, nghề và lĩnh vực then chốt để phục vụ cho sự nghiệp xây dựng và bảo vệ tổ quốc.
4. chính phủ quy định việc công dân việt nam ra nước ngoài giảng dạy, học tập, nghiên cứu khoa học và trao đổi học thuật; việc hợp tác về giáo dục với tổ chức, cá nhân nước ngoài và người việt nam định cư ở nước ngoài.Represent this sentence for searching relevant passages: không mang bảo hiểm xe ô tô, xe máy khi tham gia giao thông thì bị xử phạt như thế nào“5. phạt tiền từ 1.000.000 đồng đến 2.000.000 đồng đối với người điều khiển xe thực hiện một trong các hành vi vi phạm sau đây: a) đi ngược chiều của đường một chiều, đi ngược chiều trên đường có biển “cấm đi ngược chiều”, trừ hành vi vi phạm quy định tại điểm b khoản 6 điều này và các trường hợp xe ưu tiên đang đi làm nhiệm vụ khẩn cấp theo quy định;b) không nhường đường hoặc gây cản trở xe được quyền ưu tiên đang phát tín hiệu ưu tiên đi làm nhiệm vụ.”; d) sửa đổi điểm c khoản 10 điều 6 như sau:1. việc xác định hành vi vi phạm hành chính đã kết thúc, hành vi vi phạm hành chính đang được thực hiện để tính thời hiệu xử phạt vi phạm hành chính thực hiện theo nguyên tắc sau đây: a) hành vi vi phạm hành chính đã kết thúc là hành vi được thực hiện một lần hoặc nhiều lần và có căn cứ xác định hành vi đã thực hiện xong trước thời điểm cơ quan, người có thẩm quyền phát hiện vi phạm hành chính; b) hành vi vi phạm hành chính đang thực hiện là hành vi đang diễn ra tại thời điểm cơ quan, người có thẩm quyền phát hiện vi phạm hành chính và hành vi đó vẫn đang xâm hại trật tự quản lý nhà nước.2. các hình thức xử phạt vi phạm hành chính và biện pháp khắc phục hậu quả chỉ được áp dụng khi nghị định quy định về xử phạt vi phạm hành chính trong các lĩnh vực quản lý nhà nước có quy định các hình thức xử phạt, biện pháp khắc phục hậu quả này đối với hành vi vi phạm hành chính cụ thể, trừ trường hợp quy định tại khoản 2 điều 65 luật xử lý vi phạm hành chính.3. đối với trường hợp hành vi vi phạm hà... - Loss:
TripletLosswith these parameters:{ "distance_metric": "TripletDistanceMetric.EUCLIDEAN", "triplet_margin": 5 }
Training Hyperparameters
Non-Default Hyperparameters
eval_strategy: stepsper_device_train_batch_size: 4per_device_eval_batch_size: 16gradient_accumulation_steps: 4learning_rate: 2e-05num_train_epochs: 5warmup_ratio: 0.1fp16: Trueload_best_model_at_end: True
All Hyperparameters
Click to expand
overwrite_output_dir: Falsedo_predict: Falseeval_strategy: stepsprediction_loss_only: Trueper_device_train_batch_size: 4per_device_eval_batch_size: 16per_gpu_train_batch_size: Noneper_gpu_eval_batch_size: Nonegradient_accumulation_steps: 4eval_accumulation_steps: Nonetorch_empty_cache_steps: Nonelearning_rate: 2e-05weight_decay: 0.0adam_beta1: 0.9adam_beta2: 0.999adam_epsilon: 1e-08max_grad_norm: 1.0num_train_epochs: 5max_steps: -1lr_scheduler_type: linearlr_scheduler_kwargs: {}warmup_ratio: 0.1warmup_steps: 0log_level: passivelog_level_replica: warninglog_on_each_node: Truelogging_nan_inf_filter: Truesave_safetensors: Truesave_on_each_node: Falsesave_only_model: Falserestore_callback_states_from_checkpoint: Falseno_cuda: Falseuse_cpu: Falseuse_mps_device: Falseseed: 42data_seed: Nonejit_mode_eval: Falsebf16: Falsefp16: Truefp16_opt_level: O1half_precision_backend: autobf16_full_eval: Falsefp16_full_eval: Falsetf32: Nonelocal_rank: 0ddp_backend: Nonetpu_num_cores: Nonetpu_metrics_debug: Falsedebug: []dataloader_drop_last: Falsedataloader_num_workers: 0dataloader_prefetch_factor: Nonepast_index: -1disable_tqdm: Falseremove_unused_columns: Truelabel_names: Noneload_best_model_at_end: Trueignore_data_skip: Falsefsdp: []fsdp_min_num_params: 0fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap: Noneaccelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}parallelism_config: Nonedeepspeed: Nonelabel_smoothing_factor: 0.0optim: adamw_torch_fusedoptim_args: Noneadafactor: Falsegroup_by_length: Falselength_column_name: lengthproject: huggingfacetrackio_space_id: trackioddp_find_unused_parameters: Noneddp_bucket_cap_mb: Noneddp_broadcast_buffers: Falsedataloader_pin_memory: Truedataloader_persistent_workers: Falseskip_memory_metrics: Trueuse_legacy_prediction_loop: Falsepush_to_hub: Falseresume_from_checkpoint: Nonehub_model_id: Nonehub_strategy: every_savehub_private_repo: Nonehub_always_push: Falsehub_revision: Nonegradient_checkpointing: Falsegradient_checkpointing_kwargs: Noneinclude_inputs_for_metrics: Falseinclude_for_metrics: []eval_do_concat_batches: Truefp16_backend: autopush_to_hub_model_id: Nonepush_to_hub_organization: Nonemp_parameters:auto_find_batch_size: Falsefull_determinism: Falsetorchdynamo: Noneray_scope: lastddp_timeout: 1800torch_compile: Falsetorch_compile_backend: Nonetorch_compile_mode: Noneinclude_tokens_per_second: Falseinclude_num_input_tokens_seen: noneftune_noise_alpha: Noneoptim_target_modules: Nonebatch_eval_metrics: Falseeval_on_start: Falseuse_liger_kernel: Falseliger_kernel_config: Noneeval_use_gather_object: Falseaverage_tokens_across_devices: Trueprompts: Nonebatch_sampler: batch_samplermulti_dataset_batch_sampler: proportionalrouter_mapping: {}learning_rate_mapping: {}
Training Logs
Click to expand
| Epoch | Step | Training Loss | Validation Loss |
|---|---|---|---|
| 0.0080 | 500 | 4.9727 | - |
| 0.0160 | 1000 | 4.9091 | - |
| 0.0240 | 1500 | 4.5511 | - |
| 0.0320 | 2000 | 4.3971 | 4.2937 |
| 0.0400 | 2500 | 4.3534 | - |
| 0.0480 | 3000 | 4.3183 | - |
| 0.0560 | 3500 | 4.3039 | - |
| 0.0640 | 4000 | 4.3075 | 4.2731 |
| 0.0720 | 4500 | 4.3032 | - |
| 0.0800 | 5000 | 4.2759 | - |
| 0.0880 | 5500 | 4.2705 | - |
| 0.0960 | 6000 | 4.279 | 4.2947 |
| 0.1040 | 6500 | 4.359 | - |
| 0.1120 | 7000 | 4.2458 | - |
| 0.1200 | 7500 | 4.2706 | - |
| 0.1280 | 8000 | 4.281 | 4.2669 |
| 0.1360 | 8500 | 4.2534 | - |
| 0.1440 | 9000 | 4.2571 | - |
| 0.1520 | 9500 | 4.2694 | - |
| 0.1599 | 10000 | 4.272 | 4.2605 |
| 0.1679 | 10500 | 4.2552 | - |
| 0.1759 | 11000 | 4.2748 | - |
| 0.1839 | 11500 | 4.2731 | - |
| 0.1919 | 12000 | 4.253 | 4.2702 |
| 0.1999 | 12500 | 4.2558 | - |
| 0.2079 | 13000 | 4.2917 | - |
| 0.2159 | 13500 | 4.2784 | - |
| 0.2239 | 14000 | 4.2766 | 4.2873 |
| 0.2319 | 14500 | 4.3058 | - |
| 0.2399 | 15000 | 4.2489 | - |
| 0.2479 | 15500 | 4.292 | - |
| 0.2559 | 16000 | 4.3352 | 4.2688 |
| 0.2639 | 16500 | 4.266 | - |
| 0.2719 | 17000 | 4.2745 | - |
| 0.2799 | 17500 | 4.2766 | - |
| 0.2879 | 18000 | 4.2863 | 4.3652 |
| 0.2959 | 18500 | 4.2969 | - |
| 0.3039 | 19000 | 4.296 | - |
| 0.3119 | 19500 | 4.2487 | - |
| 0.3199 | 20000 | 4.2977 | 4.2731 |
| 0.3279 | 20500 | 4.2661 | - |
| 0.3359 | 21000 | 4.2549 | - |
| 0.3439 | 21500 | 4.3082 | - |
| 0.3519 | 22000 | 4.6615 | 5.0000 |
| 0.3599 | 22500 | 4.7174 | - |
| 0.3679 | 23000 | 5.0013 | - |
| 0.3759 | 23500 | 5.0008 | - |
| 0.3839 | 24000 | 5.0 | 5.0000 |
| 0.3919 | 24500 | 5.0014 | - |
| 0.3999 | 25000 | 4.9959 | - |
| 0.4079 | 25500 | 4.9581 | - |
| 0.4159 | 26000 | 4.8906 | 5.0 |
| 0.4239 | 26500 | 4.9229 | - |
| 0.4319 | 27000 | 4.9844 | - |
| 0.4399 | 27500 | 4.9603 | - |
| 0.4479 | 28000 | 4.8822 | 5.0000 |
| 0.4559 | 28500 | 4.8397 | - |
| 0.4638 | 29000 | 4.7395 | - |
| 0.4718 | 29500 | 4.7043 | - |
| 0.4798 | 30000 | 4.7187 | 5.0 |
| 0.4878 | 30500 | 4.7095 | - |
| 0.4958 | 31000 | 4.7235 | - |
| 0.5038 | 31500 | 4.6874 | - |
| 0.5118 | 32000 | 4.7163 | 5.0000 |
| 0.5198 | 32500 | 4.7088 | - |
| 0.5278 | 33000 | 4.6745 | - |
| 0.5358 | 33500 | 4.6755 | - |
| 0.5438 | 34000 | 4.6979 | 5.0 |
| 0.5518 | 34500 | 4.651 | - |
| 0.5598 | 35000 | 4.7008 | - |
| 0.5678 | 35500 | 4.6616 | - |
| 0.5758 | 36000 | 4.6652 | 5.0 |
| 0.5838 | 36500 | 4.7175 | - |
| 0.5918 | 37000 | 4.6286 | - |
| 0.5998 | 37500 | 4.6718 | - |
| 0.6078 | 38000 | 4.6938 | 5.0000 |
| 0.6158 | 38500 | 4.6944 | - |
| 0.6238 | 39000 | 4.6706 | - |
| 0.6318 | 39500 | 4.6894 | - |
| 0.6398 | 40000 | 4.676 | 5.0000 |
| 0.6478 | 40500 | 4.6605 | - |
| 0.6558 | 41000 | 4.6158 | - |
| 0.6638 | 41500 | 4.6362 | - |
| 0.6718 | 42000 | 4.6964 | 5.0000 |
| 0.6798 | 42500 | 4.6637 | - |
| 0.6878 | 43000 | 4.6605 | - |
| 0.6958 | 43500 | 4.6909 | - |
| 0.7038 | 44000 | 4.6563 | 5.0000 |
| 0.7118 | 44500 | 4.6067 | - |
| 0.7198 | 45000 | 4.6634 | - |
| 0.7278 | 45500 | 4.687 | - |
| 0.7358 | 46000 | 4.6981 | 5.0 |
| 0.7438 | 46500 | 4.6194 | - |
| 0.7518 | 47000 | 4.6646 | - |
| 0.7598 | 47500 | 4.659 | - |
| 0.7677 | 48000 | 4.6708 | 5.0 |
| 0.7757 | 48500 | 4.6559 | - |
| 0.7837 | 49000 | 4.6681 | - |
| 0.7917 | 49500 | 4.653 | - |
| 0.7997 | 50000 | 4.6313 | 5.0000 |
| 0.8077 | 50500 | 4.6037 | - |
| 0.8157 | 51000 | 4.662 | - |
| 0.8237 | 51500 | 4.6638 | - |
| 0.8317 | 52000 | 4.6856 | 5.0000 |
| 0.8397 | 52500 | 4.6596 | - |
| 0.8477 | 53000 | 4.6446 | - |
| 0.8557 | 53500 | 4.6244 | - |
| 0.8637 | 54000 | 4.6142 | 5.0000 |
| 0.8717 | 54500 | 4.6344 | - |
| 0.8797 | 55000 | 4.6599 | - |
| 0.8877 | 55500 | 4.6633 | - |
| 0.8957 | 56000 | 4.6133 | 5.0000 |
| 0.9037 | 56500 | 4.6694 | - |
| 0.9117 | 57000 | 4.6615 | - |
| 0.9197 | 57500 | 4.6731 | - |
| 0.9277 | 58000 | 4.6031 | 5.0000 |
| 0.9357 | 58500 | 4.6294 | - |
| 0.9437 | 59000 | 4.7104 | - |
| 0.9517 | 59500 | 4.6926 | - |
| 0.9597 | 60000 | 4.8205 | 5.0000 |
| 0.9677 | 60500 | 4.779 | - |
| 0.9757 | 61000 | 4.6869 | - |
| 0.9837 | 61500 | 4.6729 | - |
| 0.9917 | 62000 | 4.7036 | 5.0000 |
| 0.9997 | 62500 | 4.6077 | - |
| 1.0077 | 63000 | 4.6827 | - |
| 1.0157 | 63500 | 4.7468 | - |
| 1.0237 | 64000 | 4.6579 | 5.0000 |
| 1.0317 | 64500 | 4.661 | - |
| 1.0397 | 65000 | 4.7751 | - |
| 1.0476 | 65500 | 4.9796 | - |
| 1.0556 | 66000 | 4.6712 | 5.0000 |
| 1.0636 | 66500 | 4.6535 | - |
| 1.0716 | 67000 | 4.6395 | - |
| 1.0796 | 67500 | 4.664 | - |
| 1.0876 | 68000 | 4.6739 | 5.0000 |
| 1.0956 | 68500 | 4.7122 | - |
| 1.1036 | 69000 | 4.635 | - |
| 1.1116 | 69500 | 4.6227 | - |
| 1.1196 | 70000 | 4.6572 | 5.0 |
| 1.1276 | 70500 | 4.6442 | - |
| 1.1356 | 71000 | 4.7517 | - |
| 1.1436 | 71500 | 4.6708 | - |
| 1.1516 | 72000 | 4.6684 | 5.0000 |
| 1.1596 | 72500 | 4.6487 | - |
| 1.1676 | 73000 | 4.6369 | - |
| 1.1756 | 73500 | 4.6412 | - |
| 1.1836 | 74000 | 4.606 | 5.0000 |
| 1.1916 | 74500 | 4.6236 | - |
| 1.1996 | 75000 | 4.6565 | - |
| 1.2076 | 75500 | 4.6261 | - |
| 1.2156 | 76000 | 4.6692 | 5.0000 |
| 1.2236 | 76500 | 4.6694 | - |
| 1.2316 | 77000 | 4.6311 | - |
| 1.2396 | 77500 | 4.6361 | - |
| 1.2476 | 78000 | 4.6421 | 5.0 |
| 1.2556 | 78500 | 4.655 | - |
| 1.2636 | 79000 | 4.6034 | - |
| 1.2716 | 79500 | 4.6205 | - |
| 1.2796 | 80000 | 4.6287 | 5.0 |
| 1.2876 | 80500 | 4.644 | - |
| 1.2956 | 81000 | 4.6329 | - |
| 1.3036 | 81500 | 4.6353 | - |
| 1.3116 | 82000 | 4.6695 | 5.0000 |
| 1.3196 | 82500 | 4.5981 | - |
| 1.3276 | 83000 | 4.5955 | - |
| 1.3356 | 83500 | 4.6055 | - |
| 1.3436 | 84000 | 4.6236 | 5.0000 |
| 1.3515 | 84500 | 4.5971 | - |
| 1.3595 | 85000 | 4.6514 | - |
| 1.3675 | 85500 | 4.6274 | - |
| 1.3755 | 86000 | 4.6568 | 5.0000 |
| 1.3835 | 86500 | 4.6118 | - |
| 1.3915 | 87000 | 4.6046 | - |
| 1.3995 | 87500 | 4.6424 | - |
| 1.4075 | 88000 | 4.6249 | 5.0 |
| 1.4155 | 88500 | 4.6548 | - |
| 1.4235 | 89000 | 4.6172 | - |
| 1.4315 | 89500 | 4.6506 | - |
| 1.4395 | 90000 | 4.6338 | 5.0000 |
| 1.4475 | 90500 | 4.6031 | - |
| 1.4555 | 91000 | 4.6232 | - |
| 1.4635 | 91500 | 4.6531 | - |
| 1.4715 | 92000 | 4.657 | 5.0000 |
| 1.4795 | 92500 | 4.6186 | - |
| 1.4875 | 93000 | 4.6414 | - |
| 1.4955 | 93500 | 4.6638 | - |
| 1.5035 | 94000 | 4.6435 | 5.0000 |
| 1.5115 | 94500 | 4.6397 | - |
| 1.5195 | 95000 | 4.6291 | - |
| 1.5275 | 95500 | 4.6245 | - |
| 1.5355 | 96000 | 4.6267 | 5.0000 |
| 1.5435 | 96500 | 4.6202 | - |
| 1.5515 | 97000 | 4.6007 | - |
| 1.5595 | 97500 | 4.6755 | - |
| 1.5675 | 98000 | 4.6074 | 5.0 |
| 1.5755 | 98500 | 4.5967 | - |
| 1.5835 | 99000 | 4.6469 | - |
| 1.5915 | 99500 | 4.6222 | - |
| 1.5995 | 100000 | 4.6338 | 5.0 |
| 1.6075 | 100500 | 4.6078 | - |
| 1.6155 | 101000 | 4.6377 | - |
| 1.6235 | 101500 | 4.6282 | - |
| 1.6315 | 102000 | 4.621 | 5.0000 |
| 1.6395 | 102500 | 4.623 | - |
| 1.6475 | 103000 | 4.5915 | - |
| 1.6554 | 103500 | 4.6151 | - |
| 1.6634 | 104000 | 4.578 | 5.0 |
| 1.6714 | 104500 | 4.6573 | - |
| 1.6794 | 105000 | 4.6305 | - |
| 1.6874 | 105500 | 4.6225 | - |
| 1.6954 | 106000 | 4.6429 | 5.0 |
| 1.7034 | 106500 | 4.6165 | - |
| 1.7114 | 107000 | 4.6378 | - |
| 1.7194 | 107500 | 4.6721 | - |
| 1.7274 | 108000 | 4.665 | 5.0000 |
| 1.7354 | 108500 | 4.6258 | - |
| 1.7434 | 109000 | 4.6255 | - |
| 1.7514 | 109500 | 4.6619 | - |
| 1.7594 | 110000 | 4.6476 | 5.0000 |
| 1.7674 | 110500 | 4.623 | - |
| 1.7754 | 111000 | 4.6437 | - |
| 1.7834 | 111500 | 4.6151 | - |
| 1.7914 | 112000 | 4.6087 | 5.0000 |
| 1.7994 | 112500 | 4.5928 | - |
| 1.8074 | 113000 | 4.5851 | - |
| 1.8154 | 113500 | 4.6545 | - |
| 1.8234 | 114000 | 4.6412 | 5.0 |
| 1.8314 | 114500 | 4.6375 | - |
| 1.8394 | 115000 | 4.5937 | - |
| 1.8474 | 115500 | 4.6659 | - |
| 1.8554 | 116000 | 4.6142 | 5.0000 |
| 1.8634 | 116500 | 4.6446 | - |
| 1.8714 | 117000 | 4.7086 | - |
| 1.8794 | 117500 | 4.633 | - |
| 1.8874 | 118000 | 4.6005 | 5.0000 |
| 1.8954 | 118500 | 4.6383 | - |
| 1.9034 | 119000 | 4.6537 | - |
| 1.9114 | 119500 | 4.6594 | - |
| 1.9194 | 120000 | 4.6454 | 5.0000 |
| 1.9274 | 120500 | 4.6352 | - |
| 1.9354 | 121000 | 4.6208 | - |
| 1.9434 | 121500 | 4.6272 | - |
| 1.9514 | 122000 | 4.6243 | 5.0 |
| 1.9593 | 122500 | 4.6276 | - |
| 1.9673 | 123000 | 4.6233 | - |
| 1.9753 | 123500 | 4.6279 | - |
| 1.9833 | 124000 | 4.6105 | 5.0 |
| 1.9913 | 124500 | 4.6682 | - |
| 1.9993 | 125000 | 4.6543 | - |
| 2.0073 | 125500 | 4.6386 | - |
| 2.0153 | 126000 | 4.6067 | 5.0 |
| 2.0233 | 126500 | 4.6402 | - |
| 2.0313 | 127000 | 4.5977 | - |
| 2.0393 | 127500 | 4.6484 | - |
| 2.0473 | 128000 | 4.6529 | 5.0000 |
| 2.0553 | 128500 | 4.633 | - |
| 2.0633 | 129000 | 4.6371 | - |
| 2.0713 | 129500 | 4.6049 | - |
| 2.0793 | 130000 | 4.6293 | 5.0 |
| 2.0873 | 130500 | 4.5822 | - |
| 2.0953 | 131000 | 4.6561 | - |
| 2.1033 | 131500 | 4.605 | - |
| 2.1113 | 132000 | 4.6414 | 5.0000 |
| 2.1193 | 132500 | 4.6452 | - |
| 2.1273 | 133000 | 4.629 | - |
| 2.1353 | 133500 | 4.5899 | - |
| 2.1433 | 134000 | 4.6089 | 5.0 |
| 2.1513 | 134500 | 4.6411 | - |
| 2.1593 | 135000 | 4.6083 | - |
| 2.1673 | 135500 | 4.6411 | - |
| 2.1753 | 136000 | 4.626 | 5.0000 |
| 2.1833 | 136500 | 4.6484 | - |
| 2.1913 | 137000 | 4.5948 | - |
| 2.1993 | 137500 | 4.6208 | - |
| 2.2073 | 138000 | 4.6935 | 5.0 |
| 2.2153 | 138500 | 4.679 | - |
| 2.2233 | 139000 | 4.6019 | - |
| 2.2313 | 139500 | 4.6307 | - |
| 2.2392 | 140000 | 4.6478 | 5.0000 |
| 2.2472 | 140500 | 4.6317 | - |
| 2.2552 | 141000 | 4.6214 | - |
| 2.2632 | 141500 | 4.615 | - |
| 2.2712 | 142000 | 4.6009 | 5.0000 |
| 2.2792 | 142500 | 4.5882 | - |
| 2.2872 | 143000 | 4.5881 | - |
| 2.2952 | 143500 | 4.6663 | - |
| 2.3032 | 144000 | 4.6668 | 5.0 |
| 2.3112 | 144500 | 4.6245 | - |
| 2.3192 | 145000 | 4.5795 | - |
| 2.3272 | 145500 | 4.6359 | - |
| 2.3352 | 146000 | 4.6 | 5.0000 |
| 2.3432 | 146500 | 4.6438 | - |
| 2.3512 | 147000 | 4.6055 | - |
| 2.3592 | 147500 | 4.6815 | - |
| 2.3672 | 148000 | 4.6281 | 5.0 |
| 2.3752 | 148500 | 4.6194 | - |
| 2.3832 | 149000 | 4.626 | - |
| 2.3912 | 149500 | 4.6101 | - |
| 2.3992 | 150000 | 4.5967 | 5.0 |
| 2.4072 | 150500 | 4.6407 | - |
| 2.4152 | 151000 | 4.5859 | - |
| 2.4232 | 151500 | 4.6469 | - |
| 2.4312 | 152000 | 4.662 | 5.0 |
| 2.4392 | 152500 | 4.6381 | - |
| 2.4472 | 153000 | 4.6118 | - |
| 2.4552 | 153500 | 4.6146 | - |
| 2.4632 | 154000 | 4.653 | 5.0 |
| 2.4712 | 154500 | 4.6159 | - |
| 2.4792 | 155000 | 4.6126 | - |
| 2.4872 | 155500 | 4.6459 | - |
| 2.4952 | 156000 | 4.6223 | 5.0 |
| 2.5032 | 156500 | 4.635 | - |
| 2.5112 | 157000 | 4.6416 | - |
| 2.5192 | 157500 | 4.6114 | - |
| 2.5272 | 158000 | 4.6095 | 5.0 |
| 2.5352 | 158500 | 4.6559 | - |
| 2.5431 | 159000 | 4.6096 | - |
| 2.5511 | 159500 | 4.6833 | - |
| 2.5591 | 160000 | 4.602 | 5.0 |
| 2.5671 | 160500 | 4.5893 | - |
| 2.5751 | 161000 | 4.6242 | - |
| 2.5831 | 161500 | 4.5962 | - |
| 2.5911 | 162000 | 4.6741 | 5.0000 |
| 2.5991 | 162500 | 4.6266 | - |
| 2.6071 | 163000 | 4.615 | - |
| 2.6151 | 163500 | 4.6328 | - |
| 2.6231 | 164000 | 4.6566 | 5.0 |
| 2.6311 | 164500 | 4.598 | - |
| 2.6391 | 165000 | 4.6835 | - |
| 2.6471 | 165500 | 4.6327 | - |
| 2.6551 | 166000 | 4.6678 | 5.0 |
| 2.6631 | 166500 | 4.6286 | - |
| 2.6711 | 167000 | 4.6148 | - |
| 2.6791 | 167500 | 4.6139 | - |
| 2.6871 | 168000 | 4.6447 | 5.0 |
| 2.6951 | 168500 | 4.6069 | - |
| 2.7031 | 169000 | 4.6519 | - |
| 2.7111 | 169500 | 4.5942 | - |
| 2.7191 | 170000 | 4.6619 | 5.0 |
| 2.7271 | 170500 | 4.632 | - |
| 2.7351 | 171000 | 4.6049 | - |
| 2.7431 | 171500 | 4.6412 | - |
| 2.7511 | 172000 | 4.6045 | 5.0 |
| 2.7591 | 172500 | 4.6269 | - |
| 2.7671 | 173000 | 4.6011 | - |
| 2.7751 | 173500 | 4.6014 | - |
| 2.7831 | 174000 | 4.6338 | 5.0 |
Framework Versions
- Python: 3.11.13
- Sentence Transformers: 5.1.2
- Transformers: 4.57.1
- PyTorch: 2.8.0+cu128
- Accelerate: 1.8.1
- Datasets: 3.6.0
- Tokenizers: 0.22.1
Citation
BibTeX
Sentence Transformers
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
TripletLoss
@misc{hermans2017defense,
title={In Defense of the Triplet Loss for Person Re-Identification},
author={Alexander Hermans and Lucas Beyer and Bastian Leibe},
year={2017},
eprint={1703.07737},
archivePrefix={arXiv},
primaryClass={cs.CV}
}
- Downloads last month
- 8
Model tree for zerostratos/monolingual-vietnamese-bge
Base model
BAAI/bge-m3