---
tags:
- sentence-transformers
- cross-encoder
- reranker
- generated_from_trainer
- dataset_size:82796
- loss:CrossEntropyLoss
base_model: deepvk/USER-bge-m3
pipeline_tag: text-classification
library_name: sentence-transformers
metrics:
- f1_macro
- f1_micro
- f1_weighted
model-index:
- name: CrossEncoder based on deepvk/USER-bge-m3
results:
- task:
type: cross-encoder-softmax-accuracy
name: Cross Encoder Softmax Accuracy
dataset:
name: softmax accuracy eval
type: softmax_accuracy_eval
metrics:
- type: f1_macro
value: 0.9771728083627488
name: F1 Macro
- type: f1_micro
value: 0.9771739130434782
name: F1 Micro
- type: f1_weighted
value: 0.9771740511285696
name: F1 Weighted
---
# CrossEncoder based on deepvk/USER-bge-m3
This is a [Cross Encoder](https://www.sbert.net/docs/cross_encoder/usage/usage.html) model finetuned from [deepvk/USER-bge-m3](https://huggingface.co/deepvk/USER-bge-m3) using the [sentence-transformers](https://www.SBERT.net) library. It computes scores for pairs of texts, which can be used for text pair classification.
## Model Details
### Model Description
- **Model Type:** Cross Encoder
- **Base model:** [deepvk/USER-bge-m3](https://huggingface.co/deepvk/USER-bge-m3)
- **Maximum Sequence Length:** 8192 tokens
- **Number of Output Labels:** 2 labels
### Model Sources
- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
- **Documentation:** [Cross Encoder Documentation](https://www.sbert.net/docs/cross_encoder/usage/usage.html)
- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
- **Hugging Face:** [Cross Encoders on Hugging Face](https://huggingface.co/models?library=sentence-transformers&other=cross-encoder)
## Usage
### Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
```bash
pip install -U sentence-transformers
```
Then you can load this model and run inference.
```python
from sentence_transformers import CrossEncoder
# Download from the 🤗 Hub
model = CrossEncoder("Chimalpopoka/CrossEncoderRanker")
# Get scores for pairs of texts
pairs = [
['Панель №6 IgE (Сазан, карп, щука, судак, кефаль, ледяная рыба, пикша, осетр)', 'Сазан, (Cyprinus carpio), IgE, аллерген - e82. Метод: ИФА'],
['Определение антител класса M (IgM) к цитомегаловирусу (CytomegАlovirus) в крови', 'Бактериологическое исследование гнойного отделяемого: На аэробные и факультативно-анаэробные микроорганизмы. Метод: культуральный'],
['Исследования уровня бетта-изомеризованного C-концевого телопептида коллагена 1 типа (Beta-Cross laps) в крови', 'Глюкоза, в венозной крови'],
['Посев кала на диарогенные эшерихиозы (E. coli), закл., Кал', 'Коклюш (Bordetella pertussis): Антитела: IgG, (количественно). Метод: ИФА'],
['Ультразвуковое исследование поджелудочной железы (детям)', 'УЗИ поджелудочной железы, для детей'],
]
scores = model.predict(pairs)
print(scores.shape)
# (5, 2)
```
## Evaluation
### Metrics
#### Cross Encoder Softmax Accuracy
* Dataset: `softmax_accuracy_eval`
* Evaluated with [CESoftmaxAccuracyEvaluator](https://sbert.net/docs/package_reference/cross_encoder/evaluation.html#sentence_transformers.cross_encoder.evaluation.CESoftmaxAccuracyEvaluator)
| Metric | Value |
|:-------------|:-----------|
| **f1_macro** | **0.9772** |
| f1_micro | 0.9772 |
| f1_weighted | 0.9772 |
## Training Details
### Training Dataset
#### Unnamed Dataset
* Size: 82,796 training samples
* Columns: sentence_0, sentence_1, and label
* Approximate statistics based on the first 1000 samples:
| | sentence_0 | sentence_1 | label |
|:--------|:-----------------------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------------------|:------------------------------------------------|
| type | string | string | int |
| details |
Панель №6 IgE (Сазан, карп, щука, судак, кефаль, ледяная рыба, пикша, осетр) | Сазан, (Cyprinus carpio), IgE, аллерген - e82. Метод: ИФА | 1 |
| Определение антител класса M (IgM) к цитомегаловирусу (CytomegАlovirus) в крови | Бактериологическое исследование гнойного отделяемого: На аэробные и факультативно-анаэробные микроорганизмы. Метод: культуральный | 0 |
| Исследования уровня бетта-изомеризованного C-концевого телопептида коллагена 1 типа (Beta-Cross laps) в крови | Глюкоза, в венозной крови | 0 |
* Loss: [CrossEntropyLoss](https://sbert.net/docs/package_reference/cross_encoder/losses.html#crossentropyloss)
### Training Hyperparameters
#### Non-Default Hyperparameters
- `eval_strategy`: steps
- `num_train_epochs`: 1
#### All Hyperparameters