narayan214 commited on 18 days ago

Commit

0480e3b

verified ·

1 Parent(s): 8ae890d

Upload fine-tuned PII NER model

Browse files

Files changed (40) hide show

checkpoint-1053/config.json +110 -0
checkpoint-1053/model.safetensors +3 -0
checkpoint-1053/optimizer.pt +3 -0
checkpoint-1053/rng_state.pth +3 -0
checkpoint-1053/scaler.pt +3 -0
checkpoint-1053/scheduler.pt +3 -0
checkpoint-1053/special_tokens_map.json +37 -0
checkpoint-1053/tokenizer.json +0 -0
checkpoint-1053/tokenizer_config.json +60 -0
checkpoint-1053/trainer_state.json +226 -0
checkpoint-1053/training_args.bin +3 -0
checkpoint-1053/vocab.txt +0 -0
checkpoint-1404/config.json +110 -0
checkpoint-1404/model.safetensors +3 -0
checkpoint-1404/optimizer.pt +3 -0
checkpoint-1404/rng_state.pth +3 -0
checkpoint-1404/scaler.pt +3 -0
checkpoint-1404/scheduler.pt +3 -0
checkpoint-1404/special_tokens_map.json +37 -0
checkpoint-1404/tokenizer.json +0 -0
checkpoint-1404/tokenizer_config.json +60 -0
checkpoint-1404/trainer_state.json +287 -0
checkpoint-1404/training_args.bin +3 -0
checkpoint-1404/vocab.txt +0 -0
checkpoint-1755/config.json +110 -0
checkpoint-1755/model.safetensors +3 -0
checkpoint-1755/optimizer.pt +3 -0
checkpoint-1755/rng_state.pth +3 -0
checkpoint-1755/scaler.pt +3 -0
checkpoint-1755/scheduler.pt +3 -0
checkpoint-1755/special_tokens_map.json +37 -0
checkpoint-1755/tokenizer.json +0 -0
checkpoint-1755/tokenizer_config.json +60 -0
checkpoint-1755/trainer_state.json +348 -0
checkpoint-1755/training_args.bin +3 -0
checkpoint-1755/vocab.txt +0 -0
config.json +57 -53
label_mappings.json +57 -53
model.safetensors +2 -2
training_args.bin +1 -1

checkpoint-1053/config.json ADDED Viewed

	@@ -0,0 +1,110 @@

+{
+  "activation": "gelu",
+  "architectures": [
+    "DistilBertForTokenClassification"
+  ],
+  "attention_dropout": 0.1,
+  "dim": 768,
+  "dropout": 0.1,
+  "dtype": "float32",
+  "hidden_dim": 3072,
+  "id2label": {
+    "0": "O",
+    "1": "B-AMOUNT",
+    "2": "B-COUNTRY",
+    "3": "B-CREDENTIALS",
+    "4": "B-DATE",
+    "5": "B-DATETIME",
+    "6": "B-EMAIL",
+    "7": "B-EXPIRYDATE",
+    "8": "B-FIRSTNAME",
+    "9": "B-IPADDRESS",
+    "10": "B-LASTNAME",
+    "11": "B-LOCATION",
+    "12": "B-MACADDRESS",
+    "13": "B-NATIONALITY",
+    "14": "B-NUMBER",
+    "15": "B-ORGANIZATION",
+    "16": "B-PERCENT",
+    "17": "B-PHONE",
+    "18": "B-TIME",
+    "19": "B-UID",
+    "20": "B-ZIPCODE",
+    "21": "I-AMOUNT",
+    "22": "I-COUNTRY",
+    "23": "I-CREDENTIALS",
+    "24": "I-DATE",
+    "25": "I-DATETIME",
+    "26": "I-EMAIL",
+    "27": "I-EXPIRYDATE",
+    "28": "I-FIRSTNAME",
+    "29": "I-IPADDRESS",
+    "30": "I-LASTNAME",
+    "31": "I-LOCATION",
+    "32": "I-MACADDRESS",
+    "33": "I-NATIONALITY",
+    "34": "I-NUMBER",
+    "35": "I-ORGANIZATION",
+    "36": "I-PERCENT",
+    "37": "I-PHONE",
+    "38": "I-TIME",
+    "39": "I-UID",
+    "40": "I-ZIPCODE"
+  },
+  "initializer_range": 0.02,
+  "label2id": {
+    "B-AMOUNT": 1,
+    "B-COUNTRY": 2,
+    "B-CREDENTIALS": 3,
+    "B-DATE": 4,
+    "B-DATETIME": 5,
+    "B-EMAIL": 6,
+    "B-EXPIRYDATE": 7,
+    "B-FIRSTNAME": 8,
+    "B-IPADDRESS": 9,
+    "B-LASTNAME": 10,
+    "B-LOCATION": 11,
+    "B-MACADDRESS": 12,
+    "B-NATIONALITY": 13,
+    "B-NUMBER": 14,
+    "B-ORGANIZATION": 15,
+    "B-PERCENT": 16,
+    "B-PHONE": 17,
+    "B-TIME": 18,
+    "B-UID": 19,
+    "B-ZIPCODE": 20,
+    "I-AMOUNT": 21,
+    "I-COUNTRY": 22,
+    "I-CREDENTIALS": 23,
+    "I-DATE": 24,
+    "I-DATETIME": 25,
+    "I-EMAIL": 26,
+    "I-EXPIRYDATE": 27,
+    "I-FIRSTNAME": 28,
+    "I-IPADDRESS": 29,
+    "I-LASTNAME": 30,
+    "I-LOCATION": 31,
+    "I-MACADDRESS": 32,
+    "I-NATIONALITY": 33,
+    "I-NUMBER": 34,
+    "I-ORGANIZATION": 35,
+    "I-PERCENT": 36,
+    "I-PHONE": 37,
+    "I-TIME": 38,
+    "I-UID": 39,
+    "I-ZIPCODE": 40,
+    "O": 0
+  },
+  "max_position_embeddings": 512,
+  "model_type": "distilbert",
+  "n_heads": 12,
+  "n_layers": 6,
+  "output_past": true,
+  "pad_token_id": 0,
+  "qa_dropout": 0.1,
+  "seq_classif_dropout": 0.2,
+  "sinusoidal_pos_embds": false,
+  "tie_weights_": true,
+  "transformers_version": "4.56.2",
+  "vocab_size": 28996
+}

checkpoint-1053/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:86332656eaca32aa36fd65b13c045170c787c54f2fbe4a38ff4e63e540136b60
+size 260902108

checkpoint-1053/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0a9f9cb82a30a2d3975277a5f17beeae875d6e7e12597e5ee98c0152da7cfd98
+size 521866891

checkpoint-1053/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cbec5033c64a48f9a39d5f9d88a929ac670cc67d1a58b4c0c243a8e61614f770
+size 14645

checkpoint-1053/scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fc90e2b1ac9c68ba58a7e5826a5d79a9af71e0667e1a52fc0f737deeaea0a5c5
+size 1383

checkpoint-1053/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:099d50a3496c9efdbb2aaa403ccc3650cdf3bdbbf9abd678e060b3dcae93ef5c
+size 1465

checkpoint-1053/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "cls_token": {
+    "content": "[CLS]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "mask_token": {
+    "content": "[MASK]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "[PAD]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "sep_token": {
+    "content": "[SEP]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "[UNK]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

checkpoint-1053/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

checkpoint-1053/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,60 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_lower_case": false,
+  "extra_special_tokens": {},
+  "mask_token": "[MASK]",
+  "max_length": 512,
+  "model_max_length": 512,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "stride": 0,
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "DistilBertTokenizer",
+  "truncation_side": "right",
+  "truncation_strategy": "longest_first",
+  "unk_token": "[UNK]"
+}

checkpoint-1053/trainer_state.json ADDED Viewed

	@@ -0,0 +1,226 @@

+{
+  "best_global_step": 1053,
+  "best_metric": 0.9034800222150778,
+  "best_model_checkpoint": "/content/drive/MyDrive/AI ML/PIIMsaker/model_training/model11102025/model/checkpoint-1053",
+  "epoch": 3.0,
+  "eval_steps": 500,
+  "global_step": 1053,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.14245014245014245,
+      "grad_norm": 4.053828716278076,
+      "learning_rate": 5.568181818181818e-06,
+      "loss": 2.8837,
+      "step": 50
+    },
+    {
+      "epoch": 0.2849002849002849,
+      "grad_norm": 2.1837286949157715,
+      "learning_rate": 1.125e-05,
+      "loss": 1.505,
+      "step": 100
+    },
+    {
+      "epoch": 0.42735042735042733,
+      "grad_norm": 2.4568073749542236,
+      "learning_rate": 1.6931818181818182e-05,
+      "loss": 0.6653,
+      "step": 150
+    },
+    {
+      "epoch": 0.5698005698005698,
+      "grad_norm": 1.7492278814315796,
+      "learning_rate": 1.9708676377454084e-05,
+      "loss": 0.3883,
+      "step": 200
+    },
+    {
+      "epoch": 0.7122507122507122,
+      "grad_norm": 2.4913177490234375,
+      "learning_rate": 1.9075364154528183e-05,
+      "loss": 0.235,
+      "step": 250
+    },
+    {
+      "epoch": 0.8547008547008547,
+      "grad_norm": 1.5097750425338745,
+      "learning_rate": 1.8442051931602282e-05,
+      "loss": 0.2108,
+      "step": 300
+    },
+    {
+      "epoch": 0.9971509971509972,
+      "grad_norm": 1.7614439725875854,
+      "learning_rate": 1.7808739708676378e-05,
+      "loss": 0.1995,
+      "step": 350
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.0,
+      "eval_f1": 0.849518825626749,
+      "eval_loss": 0.15223319828510284,
+      "eval_precision": 0.8316818335794274,
+      "eval_recall": 0.8700500342964214,
+      "eval_runtime": 2.0848,
+      "eval_samples_per_second": 672.015,
+      "eval_steps_per_second": 21.105,
+      "step": 351
+    },
+    {
+      "epoch": 1.1396011396011396,
+      "grad_norm": 3.9141924381256104,
+      "learning_rate": 1.7175427485750477e-05,
+      "loss": 0.1588,
+      "step": 400
+    },
+    {
+      "epoch": 1.282051282051282,
+      "grad_norm": 0.9784330129623413,
+      "learning_rate": 1.6542115262824576e-05,
+      "loss": 0.1272,
+      "step": 450
+    },
+    {
+      "epoch": 1.4245014245014245,
+      "grad_norm": 2.1048169136047363,
+      "learning_rate": 1.590880303989867e-05,
+      "loss": 0.1345,
+      "step": 500
+    },
+    {
+      "epoch": 1.566951566951567,
+      "grad_norm": 2.9420387744903564,
+      "learning_rate": 1.527549081697277e-05,
+      "loss": 0.1323,
+      "step": 550
+    },
+    {
+      "epoch": 1.7094017094017095,
+      "grad_norm": 2.0811967849731445,
+      "learning_rate": 1.4642178594046866e-05,
+      "loss": 0.1458,
+      "step": 600
+    },
+    {
+      "epoch": 1.8518518518518519,
+      "grad_norm": 6.859551906585693,
+      "learning_rate": 1.4008866371120963e-05,
+      "loss": 0.1069,
+      "step": 650
+    },
+    {
+      "epoch": 1.9943019943019942,
+      "grad_norm": 1.1304482221603394,
+      "learning_rate": 1.337555414819506e-05,
+      "loss": 0.0973,
+      "step": 700
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.0,
+      "eval_f1": 0.8943449857600699,
+      "eval_loss": 0.10938618332147598,
+      "eval_precision": 0.880242372075773,
+      "eval_recall": 0.9092690274163624,
+      "eval_runtime": 2.116,
+      "eval_samples_per_second": 662.11,
+      "eval_steps_per_second": 20.794,
+      "step": 702
+    },
+    {
+      "epoch": 2.1367521367521367,
+      "grad_norm": 1.131783366203308,
+      "learning_rate": 1.274224192526916e-05,
+      "loss": 0.0717,
+      "step": 750
+    },
+    {
+      "epoch": 2.2792022792022792,
+      "grad_norm": 2.2972805500030518,
+      "learning_rate": 1.2108929702343256e-05,
+      "loss": 0.0852,
+      "step": 800
+    },
+    {
+      "epoch": 2.421652421652422,
+      "grad_norm": 0.8555024862289429,
+      "learning_rate": 1.1475617479417354e-05,
+      "loss": 0.0742,
+      "step": 850
+    },
+    {
+      "epoch": 2.564102564102564,
+      "grad_norm": 1.5859020948410034,
+      "learning_rate": 1.0842305256491453e-05,
+      "loss": 0.0824,
+      "step": 900
+    },
+    {
+      "epoch": 2.7065527065527064,
+      "grad_norm": 0.9457488059997559,
+      "learning_rate": 1.0208993033565548e-05,
+      "loss": 0.0788,
+      "step": 950
+    },
+    {
+      "epoch": 2.849002849002849,
+      "grad_norm": 1.330013632774353,
+      "learning_rate": 9.575680810639646e-06,
+      "loss": 0.0751,
+      "step": 1000
+    },
+    {
+      "epoch": 2.9914529914529915,
+      "grad_norm": 0.8843093514442444,
+      "learning_rate": 8.942368587713743e-06,
+      "loss": 0.0992,
+      "step": 1050
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.0,
+      "eval_f1": 0.9034800222150778,
+      "eval_loss": 0.09727968275547028,
+      "eval_precision": 0.8917970535296625,
+      "eval_recall": 0.9157629923674507,
+      "eval_runtime": 2.246,
+      "eval_samples_per_second": 623.788,
+      "eval_steps_per_second": 19.591,
+      "step": 1053
+    }
+  ],
+  "logging_steps": 50,
+  "max_steps": 1755,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 5,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "EarlyStoppingCallback": {
+      "args": {
+        "early_stopping_patience": 3,
+        "early_stopping_threshold": 0.001
+      },
+      "attributes": {
+        "early_stopping_patience_counter": 0
+      }
+    },
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 549620270634240.0,
+  "train_batch_size": 16,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-1053/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2dc0d1f41610192cd2e3fb0ddf624cd2ba54ef1a162452d0ad275908ce535518
+size 5841

checkpoint-1053/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

checkpoint-1404/config.json ADDED Viewed

	@@ -0,0 +1,110 @@

+{
+  "activation": "gelu",
+  "architectures": [
+    "DistilBertForTokenClassification"
+  ],
+  "attention_dropout": 0.1,
+  "dim": 768,
+  "dropout": 0.1,
+  "dtype": "float32",
+  "hidden_dim": 3072,
+  "id2label": {
+    "0": "O",
+    "1": "B-AMOUNT",
+    "2": "B-COUNTRY",
+    "3": "B-CREDENTIALS",
+    "4": "B-DATE",
+    "5": "B-DATETIME",
+    "6": "B-EMAIL",
+    "7": "B-EXPIRYDATE",
+    "8": "B-FIRSTNAME",
+    "9": "B-IPADDRESS",
+    "10": "B-LASTNAME",
+    "11": "B-LOCATION",
+    "12": "B-MACADDRESS",
+    "13": "B-NATIONALITY",
+    "14": "B-NUMBER",
+    "15": "B-ORGANIZATION",
+    "16": "B-PERCENT",
+    "17": "B-PHONE",
+    "18": "B-TIME",
+    "19": "B-UID",
+    "20": "B-ZIPCODE",
+    "21": "I-AMOUNT",
+    "22": "I-COUNTRY",
+    "23": "I-CREDENTIALS",
+    "24": "I-DATE",
+    "25": "I-DATETIME",
+    "26": "I-EMAIL",
+    "27": "I-EXPIRYDATE",
+    "28": "I-FIRSTNAME",
+    "29": "I-IPADDRESS",
+    "30": "I-LASTNAME",
+    "31": "I-LOCATION",
+    "32": "I-MACADDRESS",
+    "33": "I-NATIONALITY",
+    "34": "I-NUMBER",
+    "35": "I-ORGANIZATION",
+    "36": "I-PERCENT",
+    "37": "I-PHONE",
+    "38": "I-TIME",
+    "39": "I-UID",
+    "40": "I-ZIPCODE"
+  },
+  "initializer_range": 0.02,
+  "label2id": {
+    "B-AMOUNT": 1,
+    "B-COUNTRY": 2,
+    "B-CREDENTIALS": 3,
+    "B-DATE": 4,
+    "B-DATETIME": 5,
+    "B-EMAIL": 6,
+    "B-EXPIRYDATE": 7,
+    "B-FIRSTNAME": 8,
+    "B-IPADDRESS": 9,
+    "B-LASTNAME": 10,
+    "B-LOCATION": 11,
+    "B-MACADDRESS": 12,
+    "B-NATIONALITY": 13,
+    "B-NUMBER": 14,
+    "B-ORGANIZATION": 15,
+    "B-PERCENT": 16,
+    "B-PHONE": 17,
+    "B-TIME": 18,
+    "B-UID": 19,
+    "B-ZIPCODE": 20,
+    "I-AMOUNT": 21,
+    "I-COUNTRY": 22,
+    "I-CREDENTIALS": 23,
+    "I-DATE": 24,
+    "I-DATETIME": 25,
+    "I-EMAIL": 26,
+    "I-EXPIRYDATE": 27,
+    "I-FIRSTNAME": 28,
+    "I-IPADDRESS": 29,
+    "I-LASTNAME": 30,
+    "I-LOCATION": 31,
+    "I-MACADDRESS": 32,
+    "I-NATIONALITY": 33,
+    "I-NUMBER": 34,
+    "I-ORGANIZATION": 35,
+    "I-PERCENT": 36,
+    "I-PHONE": 37,
+    "I-TIME": 38,
+    "I-UID": 39,
+    "I-ZIPCODE": 40,
+    "O": 0
+  },
+  "max_position_embeddings": 512,
+  "model_type": "distilbert",
+  "n_heads": 12,
+  "n_layers": 6,
+  "output_past": true,
+  "pad_token_id": 0,
+  "qa_dropout": 0.1,
+  "seq_classif_dropout": 0.2,
+  "sinusoidal_pos_embds": false,
+  "tie_weights_": true,
+  "transformers_version": "4.56.2",
+  "vocab_size": 28996
+}

checkpoint-1404/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8f3930070cf5001b24f4b3a754ddfb1981f4b0561fe7187dbe1adbd605766d69
+size 260902108

checkpoint-1404/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:78cb1f505c088b43a319b5b2095e3cbb5620f88cf26c0b4279f16d72adbdd39e
+size 521866891

checkpoint-1404/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0560e9251864c5154d08bb46c59e977e904d8a522631d8d1592946ba2bfd1ef7
+size 14645

checkpoint-1404/scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e3a782a4dbbfc98b2d4cc2a05c2aaf631ec6efdab2dc5da37bf69c5dc9d1ecc7
+size 1383

checkpoint-1404/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b4c59cf682ba754fdd25888a2cd59a753ba814ef164de84cbe57cd788df126f4
+size 1465

checkpoint-1404/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "cls_token": {
+    "content": "[CLS]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "mask_token": {
+    "content": "[MASK]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "[PAD]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "sep_token": {
+    "content": "[SEP]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "[UNK]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

checkpoint-1404/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

checkpoint-1404/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,60 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_lower_case": false,
+  "extra_special_tokens": {},
+  "mask_token": "[MASK]",
+  "max_length": 512,
+  "model_max_length": 512,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "stride": 0,
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "DistilBertTokenizer",
+  "truncation_side": "right",
+  "truncation_strategy": "longest_first",
+  "unk_token": "[UNK]"
+}

checkpoint-1404/trainer_state.json ADDED Viewed

	@@ -0,0 +1,287 @@

+{
+  "best_global_step": 1404,
+  "best_metric": 0.9103603502831294,
+  "best_model_checkpoint": "/content/drive/MyDrive/AI ML/PIIMsaker/model_training/model11102025/model/checkpoint-1404",
+  "epoch": 4.0,
+  "eval_steps": 500,
+  "global_step": 1404,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.14245014245014245,
+      "grad_norm": 4.053828716278076,
+      "learning_rate": 5.568181818181818e-06,
+      "loss": 2.8837,
+      "step": 50
+    },
+    {
+      "epoch": 0.2849002849002849,
+      "grad_norm": 2.1837286949157715,
+      "learning_rate": 1.125e-05,
+      "loss": 1.505,
+      "step": 100
+    },
+    {
+      "epoch": 0.42735042735042733,
+      "grad_norm": 2.4568073749542236,
+      "learning_rate": 1.6931818181818182e-05,
+      "loss": 0.6653,
+      "step": 150
+    },
+    {
+      "epoch": 0.5698005698005698,
+      "grad_norm": 1.7492278814315796,
+      "learning_rate": 1.9708676377454084e-05,
+      "loss": 0.3883,
+      "step": 200
+    },
+    {
+      "epoch": 0.7122507122507122,
+      "grad_norm": 2.4913177490234375,
+      "learning_rate": 1.9075364154528183e-05,
+      "loss": 0.235,
+      "step": 250
+    },
+    {
+      "epoch": 0.8547008547008547,
+      "grad_norm": 1.5097750425338745,
+      "learning_rate": 1.8442051931602282e-05,
+      "loss": 0.2108,
+      "step": 300
+    },
+    {
+      "epoch": 0.9971509971509972,
+      "grad_norm": 1.7614439725875854,
+      "learning_rate": 1.7808739708676378e-05,
+      "loss": 0.1995,
+      "step": 350
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.0,
+      "eval_f1": 0.849518825626749,
+      "eval_loss": 0.15223319828510284,
+      "eval_precision": 0.8316818335794274,
+      "eval_recall": 0.8700500342964214,
+      "eval_runtime": 2.0848,
+      "eval_samples_per_second": 672.015,
+      "eval_steps_per_second": 21.105,
+      "step": 351
+    },
+    {
+      "epoch": 1.1396011396011396,
+      "grad_norm": 3.9141924381256104,
+      "learning_rate": 1.7175427485750477e-05,
+      "loss": 0.1588,
+      "step": 400
+    },
+    {
+      "epoch": 1.282051282051282,
+      "grad_norm": 0.9784330129623413,
+      "learning_rate": 1.6542115262824576e-05,
+      "loss": 0.1272,
+      "step": 450
+    },
+    {
+      "epoch": 1.4245014245014245,
+      "grad_norm": 2.1048169136047363,
+      "learning_rate": 1.590880303989867e-05,
+      "loss": 0.1345,
+      "step": 500
+    },
+    {
+      "epoch": 1.566951566951567,
+      "grad_norm": 2.9420387744903564,
+      "learning_rate": 1.527549081697277e-05,
+      "loss": 0.1323,
+      "step": 550
+    },
+    {
+      "epoch": 1.7094017094017095,
+      "grad_norm": 2.0811967849731445,
+      "learning_rate": 1.4642178594046866e-05,
+      "loss": 0.1458,
+      "step": 600
+    },
+    {
+      "epoch": 1.8518518518518519,
+      "grad_norm": 6.859551906585693,
+      "learning_rate": 1.4008866371120963e-05,
+      "loss": 0.1069,
+      "step": 650
+    },
+    {
+      "epoch": 1.9943019943019942,
+      "grad_norm": 1.1304482221603394,
+      "learning_rate": 1.337555414819506e-05,
+      "loss": 0.0973,
+      "step": 700
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.0,
+      "eval_f1": 0.8943449857600699,
+      "eval_loss": 0.10938618332147598,
+      "eval_precision": 0.880242372075773,
+      "eval_recall": 0.9092690274163624,
+      "eval_runtime": 2.116,
+      "eval_samples_per_second": 662.11,
+      "eval_steps_per_second": 20.794,
+      "step": 702
+    },
+    {
+      "epoch": 2.1367521367521367,
+      "grad_norm": 1.131783366203308,
+      "learning_rate": 1.274224192526916e-05,
+      "loss": 0.0717,
+      "step": 750
+    },
+    {
+      "epoch": 2.2792022792022792,
+      "grad_norm": 2.2972805500030518,
+      "learning_rate": 1.2108929702343256e-05,
+      "loss": 0.0852,
+      "step": 800
+    },
+    {
+      "epoch": 2.421652421652422,
+      "grad_norm": 0.8555024862289429,
+      "learning_rate": 1.1475617479417354e-05,
+      "loss": 0.0742,
+      "step": 850
+    },
+    {
+      "epoch": 2.564102564102564,
+      "grad_norm": 1.5859020948410034,
+      "learning_rate": 1.0842305256491453e-05,
+      "loss": 0.0824,
+      "step": 900
+    },
+    {
+      "epoch": 2.7065527065527064,
+      "grad_norm": 0.9457488059997559,
+      "learning_rate": 1.0208993033565548e-05,
+      "loss": 0.0788,
+      "step": 950
+    },
+    {
+      "epoch": 2.849002849002849,
+      "grad_norm": 1.330013632774353,
+      "learning_rate": 9.575680810639646e-06,
+      "loss": 0.0751,
+      "step": 1000
+    },
+    {
+      "epoch": 2.9914529914529915,
+      "grad_norm": 0.8843093514442444,
+      "learning_rate": 8.942368587713743e-06,
+      "loss": 0.0992,
+      "step": 1050
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.0,
+      "eval_f1": 0.9034800222150778,
+      "eval_loss": 0.09727968275547028,
+      "eval_precision": 0.8917970535296625,
+      "eval_recall": 0.9157629923674507,
+      "eval_runtime": 2.246,
+      "eval_samples_per_second": 623.788,
+      "eval_steps_per_second": 19.591,
+      "step": 1053
+    },
+    {
+      "epoch": 3.133903133903134,
+      "grad_norm": 0.5358484983444214,
+      "learning_rate": 8.30905636478784e-06,
+      "loss": 0.0488,
+      "step": 1100
+    },
+    {
+      "epoch": 3.2763532763532766,
+      "grad_norm": 0.5537762641906738,
+      "learning_rate": 7.675744141861939e-06,
+      "loss": 0.0616,
+      "step": 1150
+    },
+    {
+      "epoch": 3.4188034188034186,
+      "grad_norm": 4.597471714019775,
+      "learning_rate": 7.0424319189360354e-06,
+      "loss": 0.0633,
+      "step": 1200
+    },
+    {
+      "epoch": 3.561253561253561,
+      "grad_norm": 1.4646154642105103,
+      "learning_rate": 6.4091196960101335e-06,
+      "loss": 0.0665,
+      "step": 1250
+    },
+    {
+      "epoch": 3.7037037037037037,
+      "grad_norm": 0.9090561270713806,
+      "learning_rate": 5.775807473084231e-06,
+      "loss": 0.0399,
+      "step": 1300
+    },
+    {
+      "epoch": 3.8461538461538463,
+      "grad_norm": 1.164624571800232,
+      "learning_rate": 5.142495250158328e-06,
+      "loss": 0.0377,
+      "step": 1350
+    },
+    {
+      "epoch": 3.9886039886039883,
+      "grad_norm": 12.009307861328125,
+      "learning_rate": 4.509183027232426e-06,
+      "loss": 0.0623,
+      "step": 1400
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.0,
+      "eval_f1": 0.9103603502831294,
+      "eval_loss": 0.09384271502494812,
+      "eval_precision": 0.900490507971208,
+      "eval_recall": 0.9205799098457256,
+      "eval_runtime": 2.2095,
+      "eval_samples_per_second": 634.076,
+      "eval_steps_per_second": 19.914,
+      "step": 1404
+    }
+  ],
+  "logging_steps": 50,
+  "max_steps": 1755,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 5,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "EarlyStoppingCallback": {
+      "args": {
+        "early_stopping_patience": 3,
+        "early_stopping_threshold": 0.001
+      },
+      "attributes": {
+        "early_stopping_patience_counter": 0
+      }
+    },
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 732827027512320.0,
+  "train_batch_size": 16,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-1404/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2dc0d1f41610192cd2e3fb0ddf624cd2ba54ef1a162452d0ad275908ce535518
+size 5841

checkpoint-1404/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

checkpoint-1755/config.json ADDED Viewed

	@@ -0,0 +1,110 @@

+{
+  "activation": "gelu",
+  "architectures": [
+    "DistilBertForTokenClassification"
+  ],
+  "attention_dropout": 0.1,
+  "dim": 768,
+  "dropout": 0.1,
+  "dtype": "float32",
+  "hidden_dim": 3072,
+  "id2label": {
+    "0": "O",
+    "1": "B-AMOUNT",
+    "2": "B-COUNTRY",
+    "3": "B-CREDENTIALS",
+    "4": "B-DATE",
+    "5": "B-DATETIME",
+    "6": "B-EMAIL",
+    "7": "B-EXPIRYDATE",
+    "8": "B-FIRSTNAME",
+    "9": "B-IPADDRESS",
+    "10": "B-LASTNAME",
+    "11": "B-LOCATION",
+    "12": "B-MACADDRESS",
+    "13": "B-NATIONALITY",
+    "14": "B-NUMBER",
+    "15": "B-ORGANIZATION",
+    "16": "B-PERCENT",
+    "17": "B-PHONE",
+    "18": "B-TIME",
+    "19": "B-UID",
+    "20": "B-ZIPCODE",
+    "21": "I-AMOUNT",
+    "22": "I-COUNTRY",
+    "23": "I-CREDENTIALS",
+    "24": "I-DATE",
+    "25": "I-DATETIME",
+    "26": "I-EMAIL",
+    "27": "I-EXPIRYDATE",
+    "28": "I-FIRSTNAME",
+    "29": "I-IPADDRESS",
+    "30": "I-LASTNAME",
+    "31": "I-LOCATION",
+    "32": "I-MACADDRESS",
+    "33": "I-NATIONALITY",
+    "34": "I-NUMBER",
+    "35": "I-ORGANIZATION",
+    "36": "I-PERCENT",
+    "37": "I-PHONE",
+    "38": "I-TIME",
+    "39": "I-UID",
+    "40": "I-ZIPCODE"
+  },
+  "initializer_range": 0.02,
+  "label2id": {
+    "B-AMOUNT": 1,
+    "B-COUNTRY": 2,
+    "B-CREDENTIALS": 3,
+    "B-DATE": 4,
+    "B-DATETIME": 5,
+    "B-EMAIL": 6,
+    "B-EXPIRYDATE": 7,
+    "B-FIRSTNAME": 8,
+    "B-IPADDRESS": 9,
+    "B-LASTNAME": 10,
+    "B-LOCATION": 11,
+    "B-MACADDRESS": 12,
+    "B-NATIONALITY": 13,
+    "B-NUMBER": 14,
+    "B-ORGANIZATION": 15,
+    "B-PERCENT": 16,
+    "B-PHONE": 17,
+    "B-TIME": 18,
+    "B-UID": 19,
+    "B-ZIPCODE": 20,
+    "I-AMOUNT": 21,
+    "I-COUNTRY": 22,
+    "I-CREDENTIALS": 23,
+    "I-DATE": 24,
+    "I-DATETIME": 25,
+    "I-EMAIL": 26,
+    "I-EXPIRYDATE": 27,
+    "I-FIRSTNAME": 28,
+    "I-IPADDRESS": 29,
+    "I-LASTNAME": 30,
+    "I-LOCATION": 31,
+    "I-MACADDRESS": 32,
+    "I-NATIONALITY": 33,
+    "I-NUMBER": 34,
+    "I-ORGANIZATION": 35,
+    "I-PERCENT": 36,
+    "I-PHONE": 37,
+    "I-TIME": 38,
+    "I-UID": 39,
+    "I-ZIPCODE": 40,
+    "O": 0
+  },
+  "max_position_embeddings": 512,
+  "model_type": "distilbert",
+  "n_heads": 12,
+  "n_layers": 6,
+  "output_past": true,
+  "pad_token_id": 0,
+  "qa_dropout": 0.1,
+  "seq_classif_dropout": 0.2,
+  "sinusoidal_pos_embds": false,
+  "tie_weights_": true,
+  "transformers_version": "4.56.2",
+  "vocab_size": 28996
+}

checkpoint-1755/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:419fce98cde0a0c65acb33b98dd2e67820aec8342751d164cc0948369ef8dd59
+size 260902108

checkpoint-1755/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4d8419887f5c80bbfcedcb8f403f679ceb757f8da6bd6bec343de9a455b72c50
+size 521866891

checkpoint-1755/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2b62a08dbcdc9f7a18defa4779d3151c765fa336e6952e0c7f5dcc8bc9c10a06
+size 14645

checkpoint-1755/scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bc1ceae5ea465dc43ff24b6e9163cfed562a81984e23e3ce46d171bca92cf9a2
+size 1383

checkpoint-1755/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4bf29d5ef2a570d99a2f721fa7b09c44506a807f50b6cde70a5bdc2d2940068b
+size 1465

checkpoint-1755/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "cls_token": {
+    "content": "[CLS]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "mask_token": {
+    "content": "[MASK]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "[PAD]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "sep_token": {
+    "content": "[SEP]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "[UNK]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

checkpoint-1755/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

checkpoint-1755/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,60 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_lower_case": false,
+  "extra_special_tokens": {},
+  "mask_token": "[MASK]",
+  "max_length": 512,
+  "model_max_length": 512,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "stride": 0,
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "DistilBertTokenizer",
+  "truncation_side": "right",
+  "truncation_strategy": "longest_first",
+  "unk_token": "[UNK]"
+}

checkpoint-1755/trainer_state.json ADDED Viewed

	@@ -0,0 +1,348 @@

+{
+  "best_global_step": 1755,
+  "best_metric": 0.9113534509294903,
+  "best_model_checkpoint": "/content/drive/MyDrive/AI ML/PIIMsaker/model_training/model11102025/model/checkpoint-1755",
+  "epoch": 5.0,
+  "eval_steps": 500,
+  "global_step": 1755,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.14245014245014245,
+      "grad_norm": 4.053828716278076,
+      "learning_rate": 5.568181818181818e-06,
+      "loss": 2.8837,
+      "step": 50
+    },
+    {
+      "epoch": 0.2849002849002849,
+      "grad_norm": 2.1837286949157715,
+      "learning_rate": 1.125e-05,
+      "loss": 1.505,
+      "step": 100
+    },
+    {
+      "epoch": 0.42735042735042733,
+      "grad_norm": 2.4568073749542236,
+      "learning_rate": 1.6931818181818182e-05,
+      "loss": 0.6653,
+      "step": 150
+    },
+    {
+      "epoch": 0.5698005698005698,
+      "grad_norm": 1.7492278814315796,
+      "learning_rate": 1.9708676377454084e-05,
+      "loss": 0.3883,
+      "step": 200
+    },
+    {
+      "epoch": 0.7122507122507122,
+      "grad_norm": 2.4913177490234375,
+      "learning_rate": 1.9075364154528183e-05,
+      "loss": 0.235,
+      "step": 250
+    },
+    {
+      "epoch": 0.8547008547008547,
+      "grad_norm": 1.5097750425338745,
+      "learning_rate": 1.8442051931602282e-05,
+      "loss": 0.2108,
+      "step": 300
+    },
+    {
+      "epoch": 0.9971509971509972,
+      "grad_norm": 1.7614439725875854,
+      "learning_rate": 1.7808739708676378e-05,
+      "loss": 0.1995,
+      "step": 350
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.0,
+      "eval_f1": 0.849518825626749,
+      "eval_loss": 0.15223319828510284,
+      "eval_precision": 0.8316818335794274,
+      "eval_recall": 0.8700500342964214,
+      "eval_runtime": 2.0848,
+      "eval_samples_per_second": 672.015,
+      "eval_steps_per_second": 21.105,
+      "step": 351
+    },
+    {
+      "epoch": 1.1396011396011396,
+      "grad_norm": 3.9141924381256104,
+      "learning_rate": 1.7175427485750477e-05,
+      "loss": 0.1588,
+      "step": 400
+    },
+    {
+      "epoch": 1.282051282051282,
+      "grad_norm": 0.9784330129623413,
+      "learning_rate": 1.6542115262824576e-05,
+      "loss": 0.1272,
+      "step": 450
+    },
+    {
+      "epoch": 1.4245014245014245,
+      "grad_norm": 2.1048169136047363,
+      "learning_rate": 1.590880303989867e-05,
+      "loss": 0.1345,
+      "step": 500
+    },
+    {
+      "epoch": 1.566951566951567,
+      "grad_norm": 2.9420387744903564,
+      "learning_rate": 1.527549081697277e-05,
+      "loss": 0.1323,
+      "step": 550
+    },
+    {
+      "epoch": 1.7094017094017095,
+      "grad_norm": 2.0811967849731445,
+      "learning_rate": 1.4642178594046866e-05,
+      "loss": 0.1458,
+      "step": 600
+    },
+    {
+      "epoch": 1.8518518518518519,
+      "grad_norm": 6.859551906585693,
+      "learning_rate": 1.4008866371120963e-05,
+      "loss": 0.1069,
+      "step": 650
+    },
+    {
+      "epoch": 1.9943019943019942,
+      "grad_norm": 1.1304482221603394,
+      "learning_rate": 1.337555414819506e-05,
+      "loss": 0.0973,
+      "step": 700
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.0,
+      "eval_f1": 0.8943449857600699,
+      "eval_loss": 0.10938618332147598,
+      "eval_precision": 0.880242372075773,
+      "eval_recall": 0.9092690274163624,
+      "eval_runtime": 2.116,
+      "eval_samples_per_second": 662.11,
+      "eval_steps_per_second": 20.794,
+      "step": 702
+    },
+    {
+      "epoch": 2.1367521367521367,
+      "grad_norm": 1.131783366203308,
+      "learning_rate": 1.274224192526916e-05,
+      "loss": 0.0717,
+      "step": 750
+    },
+    {
+      "epoch": 2.2792022792022792,
+      "grad_norm": 2.2972805500030518,
+      "learning_rate": 1.2108929702343256e-05,
+      "loss": 0.0852,
+      "step": 800
+    },
+    {
+      "epoch": 2.421652421652422,
+      "grad_norm": 0.8555024862289429,
+      "learning_rate": 1.1475617479417354e-05,
+      "loss": 0.0742,
+      "step": 850
+    },
+    {
+      "epoch": 2.564102564102564,
+      "grad_norm": 1.5859020948410034,
+      "learning_rate": 1.0842305256491453e-05,
+      "loss": 0.0824,
+      "step": 900
+    },
+    {
+      "epoch": 2.7065527065527064,
+      "grad_norm": 0.9457488059997559,
+      "learning_rate": 1.0208993033565548e-05,
+      "loss": 0.0788,
+      "step": 950
+    },
+    {
+      "epoch": 2.849002849002849,
+      "grad_norm": 1.330013632774353,
+      "learning_rate": 9.575680810639646e-06,
+      "loss": 0.0751,
+      "step": 1000
+    },
+    {
+      "epoch": 2.9914529914529915,
+      "grad_norm": 0.8843093514442444,
+      "learning_rate": 8.942368587713743e-06,
+      "loss": 0.0992,
+      "step": 1050
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.0,
+      "eval_f1": 0.9034800222150778,
+      "eval_loss": 0.09727968275547028,
+      "eval_precision": 0.8917970535296625,
+      "eval_recall": 0.9157629923674507,
+      "eval_runtime": 2.246,
+      "eval_samples_per_second": 623.788,
+      "eval_steps_per_second": 19.591,
+      "step": 1053
+    },
+    {
+      "epoch": 3.133903133903134,
+      "grad_norm": 0.5358484983444214,
+      "learning_rate": 8.30905636478784e-06,
+      "loss": 0.0488,
+      "step": 1100
+    },
+    {
+      "epoch": 3.2763532763532766,
+      "grad_norm": 0.5537762641906738,
+      "learning_rate": 7.675744141861939e-06,
+      "loss": 0.0616,
+      "step": 1150
+    },
+    {
+      "epoch": 3.4188034188034186,
+      "grad_norm": 4.597471714019775,
+      "learning_rate": 7.0424319189360354e-06,
+      "loss": 0.0633,
+      "step": 1200
+    },
+    {
+      "epoch": 3.561253561253561,
+      "grad_norm": 1.4646154642105103,
+      "learning_rate": 6.4091196960101335e-06,
+      "loss": 0.0665,
+      "step": 1250
+    },
+    {
+      "epoch": 3.7037037037037037,
+      "grad_norm": 0.9090561270713806,
+      "learning_rate": 5.775807473084231e-06,
+      "loss": 0.0399,
+      "step": 1300
+    },
+    {
+      "epoch": 3.8461538461538463,
+      "grad_norm": 1.164624571800232,
+      "learning_rate": 5.142495250158328e-06,
+      "loss": 0.0377,
+      "step": 1350
+    },
+    {
+      "epoch": 3.9886039886039883,
+      "grad_norm": 12.009307861328125,
+      "learning_rate": 4.509183027232426e-06,
+      "loss": 0.0623,
+      "step": 1400
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.0,
+      "eval_f1": 0.9103603502831294,
+      "eval_loss": 0.09384271502494812,
+      "eval_precision": 0.900490507971208,
+      "eval_recall": 0.9205799098457256,
+      "eval_runtime": 2.2095,
+      "eval_samples_per_second": 634.076,
+      "eval_steps_per_second": 19.914,
+      "step": 1404
+    },
+    {
+      "epoch": 4.131054131054131,
+      "grad_norm": 0.5174495577812195,
+      "learning_rate": 3.8758708043065234e-06,
+      "loss": 0.0408,
+      "step": 1450
+    },
+    {
+      "epoch": 4.273504273504273,
+      "grad_norm": 1.375473976135254,
+      "learning_rate": 3.242558581380621e-06,
+      "loss": 0.0418,
+      "step": 1500
+    },
+    {
+      "epoch": 4.415954415954416,
+      "grad_norm": 1.5857481956481934,
+      "learning_rate": 2.6092463584547184e-06,
+      "loss": 0.0464,
+      "step": 1550
+    },
+    {
+      "epoch": 4.5584045584045585,
+      "grad_norm": 0.6780904531478882,
+      "learning_rate": 1.975934135528816e-06,
+      "loss": 0.041,
+      "step": 1600
+    },
+    {
+      "epoch": 4.700854700854701,
+      "grad_norm": 2.867487907409668,
+      "learning_rate": 1.3426219126029133e-06,
+      "loss": 0.0292,
+      "step": 1650
+    },
+    {
+      "epoch": 4.843304843304844,
+      "grad_norm": 0.27440184354782104,
+      "learning_rate": 7.093096896770109e-07,
+      "loss": 0.0335,
+      "step": 1700
+    },
+    {
+      "epoch": 4.985754985754986,
+      "grad_norm": 0.47164642810821533,
+      "learning_rate": 7.59974667511083e-08,
+      "loss": 0.0367,
+      "step": 1750
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.0,
+      "eval_f1": 0.9113534509294903,
+      "eval_loss": 0.08031181991100311,
+      "eval_precision": 0.90035757458181,
+      "eval_recall": 0.9227343452971066,
+      "eval_runtime": 2.7749,
+      "eval_samples_per_second": 504.892,
+      "eval_steps_per_second": 15.857,
+      "step": 1755
+    }
+  ],
+  "logging_steps": 50,
+  "max_steps": 1755,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 5,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "EarlyStoppingCallback": {
+      "args": {
+        "early_stopping_patience": 3,
+        "early_stopping_threshold": 0.001
+      },
+      "attributes": {
+        "early_stopping_patience_counter": 1
+      }
+    },
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 916033784390400.0,
+  "train_batch_size": 16,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-1755/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2dc0d1f41610192cd2e3fb0ddf624cd2ba54ef1a162452d0ad275908ce535518
+size 5841

checkpoint-1755/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

config.json CHANGED Viewed

@@ -22,32 +22,34 @@
     "10": "B-LASTNAME",
     "11": "B-LOCATION",
     "12": "B-MACADDRESS",
-    "13": "B-NUMBER",
-    "14": "B-ORGANIZATION",
-    "15": "B-PERCENT",
-    "16": "B-PHONE",
-    "17": "B-TIME",
-    "18": "B-UID",
-    "19": "B-ZIPCODE",
-    "20": "I-AMOUNT",
-    "21": "I-COUNTRY",
-    "22": "I-CREDENTIALS",
-    "23": "I-DATE",
-    "24": "I-DATETIME",
-    "25": "I-EMAIL",
-    "26": "I-EXPIRYDATE",
-    "27": "I-FIRSTNAME",
-    "28": "I-IPADDRESS",
-    "29": "I-LASTNAME",
-    "30": "I-LOCATION",
-    "31": "I-MACADDRESS",
-    "32": "I-NUMBER",
-    "33": "I-ORGANIZATION",
-    "34": "I-PERCENT",
-    "35": "I-PHONE",
-    "36": "I-TIME",
-    "37": "I-UID",
-    "38": "I-ZIPCODE"
   },
   "initializer_range": 0.02,
   "label2id": {
@@ -63,32 +65,34 @@
     "B-LASTNAME": 10,
     "B-LOCATION": 11,
     "B-MACADDRESS": 12,
-    "B-NUMBER": 13,
-    "B-ORGANIZATION": 14,
-    "B-PERCENT": 15,
-    "B-PHONE": 16,
-    "B-TIME": 17,
-    "B-UID": 18,
-    "B-ZIPCODE": 19,
-    "I-AMOUNT": 20,
-    "I-COUNTRY": 21,
-    "I-CREDENTIALS": 22,
-    "I-DATE": 23,
-    "I-DATETIME": 24,
-    "I-EMAIL": 25,
-    "I-EXPIRYDATE": 26,
-    "I-FIRSTNAME": 27,
-    "I-IPADDRESS": 28,
-    "I-LASTNAME": 29,
-    "I-LOCATION": 30,
-    "I-MACADDRESS": 31,
-    "I-NUMBER": 32,
-    "I-ORGANIZATION": 33,
-    "I-PERCENT": 34,
-    "I-PHONE": 35,
-    "I-TIME": 36,
-    "I-UID": 37,
-    "I-ZIPCODE": 38,
     "O": 0
   },
   "max_position_embeddings": 512,
@@ -101,6 +105,6 @@
   "seq_classif_dropout": 0.2,
   "sinusoidal_pos_embds": false,
   "tie_weights_": true,
-  "transformers_version": "4.56.1",
   "vocab_size": 28996
 }

     "10": "B-LASTNAME",
     "11": "B-LOCATION",
     "12": "B-MACADDRESS",
+    "13": "B-NATIONALITY",
+    "14": "B-NUMBER",
+    "15": "B-ORGANIZATION",
+    "16": "B-PERCENT",
+    "17": "B-PHONE",
+    "18": "B-TIME",
+    "19": "B-UID",
+    "20": "B-ZIPCODE",
+    "21": "I-AMOUNT",
+    "22": "I-COUNTRY",
+    "23": "I-CREDENTIALS",
+    "24": "I-DATE",
+    "25": "I-DATETIME",
+    "26": "I-EMAIL",
+    "27": "I-EXPIRYDATE",
+    "28": "I-FIRSTNAME",
+    "29": "I-IPADDRESS",
+    "30": "I-LASTNAME",
+    "31": "I-LOCATION",
+    "32": "I-MACADDRESS",
+    "33": "I-NATIONALITY",
+    "34": "I-NUMBER",
+    "35": "I-ORGANIZATION",
+    "36": "I-PERCENT",
+    "37": "I-PHONE",
+    "38": "I-TIME",
+    "39": "I-UID",
+    "40": "I-ZIPCODE"
   },
   "initializer_range": 0.02,
   "label2id": {
     "B-LASTNAME": 10,
     "B-LOCATION": 11,
     "B-MACADDRESS": 12,
+    "B-NATIONALITY": 13,
+    "B-NUMBER": 14,
+    "B-ORGANIZATION": 15,
+    "B-PERCENT": 16,
+    "B-PHONE": 17,
+    "B-TIME": 18,
+    "B-UID": 19,
+    "B-ZIPCODE": 20,
+    "I-AMOUNT": 21,
+    "I-COUNTRY": 22,
+    "I-CREDENTIALS": 23,
+    "I-DATE": 24,
+    "I-DATETIME": 25,
+    "I-EMAIL": 26,
+    "I-EXPIRYDATE": 27,
+    "I-FIRSTNAME": 28,
+    "I-IPADDRESS": 29,
+    "I-LASTNAME": 30,
+    "I-LOCATION": 31,
+    "I-MACADDRESS": 32,
+    "I-NATIONALITY": 33,
+    "I-NUMBER": 34,
+    "I-ORGANIZATION": 35,
+    "I-PERCENT": 36,
+    "I-PHONE": 37,
+    "I-TIME": 38,
+    "I-UID": 39,
+    "I-ZIPCODE": 40,
     "O": 0
   },
   "max_position_embeddings": 512,
   "seq_classif_dropout": 0.2,
   "sinusoidal_pos_embds": false,
   "tie_weights_": true,
+  "transformers_version": "4.56.2",
   "vocab_size": 28996
 }

label_mappings.json CHANGED Viewed

@@ -13,32 +13,34 @@
     "B-LASTNAME": 10,
     "B-LOCATION": 11,
     "B-MACADDRESS": 12,
-    "B-NUMBER": 13,
-    "B-ORGANIZATION": 14,
-    "B-PERCENT": 15,
-    "B-PHONE": 16,
-    "B-TIME": 17,
-    "B-UID": 18,
-    "B-ZIPCODE": 19,
-    "I-AMOUNT": 20,
-    "I-COUNTRY": 21,
-    "I-CREDENTIALS": 22,
-    "I-DATE": 23,
-    "I-DATETIME": 24,
-    "I-EMAIL": 25,
-    "I-EXPIRYDATE": 26,
-    "I-FIRSTNAME": 27,
-    "I-IPADDRESS": 28,
-    "I-LASTNAME": 29,
-    "I-LOCATION": 30,
-    "I-MACADDRESS": 31,
-    "I-NUMBER": 32,
-    "I-ORGANIZATION": 33,
-    "I-PERCENT": 34,
-    "I-PHONE": 35,
-    "I-TIME": 36,
-    "I-UID": 37,
-    "I-ZIPCODE": 38
   },
   "id2label": {
     "0": "O",
@@ -54,32 +56,34 @@
     "10": "B-LASTNAME",
     "11": "B-LOCATION",
     "12": "B-MACADDRESS",
-    "13": "B-NUMBER",
-    "14": "B-ORGANIZATION",
-    "15": "B-PERCENT",
-    "16": "B-PHONE",
-    "17": "B-TIME",
-    "18": "B-UID",
-    "19": "B-ZIPCODE",
-    "20": "I-AMOUNT",
-    "21": "I-COUNTRY",
-    "22": "I-CREDENTIALS",
-    "23": "I-DATE",
-    "24": "I-DATETIME",
-    "25": "I-EMAIL",
-    "26": "I-EXPIRYDATE",
-    "27": "I-FIRSTNAME",
-    "28": "I-IPADDRESS",
-    "29": "I-LASTNAME",
-    "30": "I-LOCATION",
-    "31": "I-MACADDRESS",
-    "32": "I-NUMBER",
-    "33": "I-ORGANIZATION",
-    "34": "I-PERCENT",
-    "35": "I-PHONE",
-    "36": "I-TIME",
-    "37": "I-UID",
-    "38": "I-ZIPCODE"
   },
-  "num_labels": 39
 }

     "B-LASTNAME": 10,
     "B-LOCATION": 11,
     "B-MACADDRESS": 12,
+    "B-NATIONALITY": 13,
+    "B-NUMBER": 14,
+    "B-ORGANIZATION": 15,
+    "B-PERCENT": 16,
+    "B-PHONE": 17,
+    "B-TIME": 18,
+    "B-UID": 19,
+    "B-ZIPCODE": 20,
+    "I-AMOUNT": 21,
+    "I-COUNTRY": 22,
+    "I-CREDENTIALS": 23,
+    "I-DATE": 24,
+    "I-DATETIME": 25,
+    "I-EMAIL": 26,
+    "I-EXPIRYDATE": 27,
+    "I-FIRSTNAME": 28,
+    "I-IPADDRESS": 29,
+    "I-LASTNAME": 30,
+    "I-LOCATION": 31,
+    "I-MACADDRESS": 32,
+    "I-NATIONALITY": 33,
+    "I-NUMBER": 34,
+    "I-ORGANIZATION": 35,
+    "I-PERCENT": 36,
+    "I-PHONE": 37,
+    "I-TIME": 38,
+    "I-UID": 39,
+    "I-ZIPCODE": 40
   },
   "id2label": {
     "0": "O",
     "10": "B-LASTNAME",
     "11": "B-LOCATION",
     "12": "B-MACADDRESS",
+    "13": "B-NATIONALITY",
+    "14": "B-NUMBER",
+    "15": "B-ORGANIZATION",
+    "16": "B-PERCENT",
+    "17": "B-PHONE",
+    "18": "B-TIME",
+    "19": "B-UID",
+    "20": "B-ZIPCODE",
+    "21": "I-AMOUNT",
+    "22": "I-COUNTRY",
+    "23": "I-CREDENTIALS",
+    "24": "I-DATE",
+    "25": "I-DATETIME",
+    "26": "I-EMAIL",
+    "27": "I-EXPIRYDATE",
+    "28": "I-FIRSTNAME",
+    "29": "I-IPADDRESS",
+    "30": "I-LASTNAME",
+    "31": "I-LOCATION",
+    "32": "I-MACADDRESS",
+    "33": "I-NATIONALITY",
+    "34": "I-NUMBER",
+    "35": "I-ORGANIZATION",
+    "36": "I-PERCENT",
+    "37": "I-PHONE",
+    "38": "I-TIME",
+    "39": "I-UID",
+    "40": "I-ZIPCODE"
   },
+  "num_labels": 41
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2a326979a8b6b2139879e4ce8d53d1c6856227aaa183a0a11e03975158105141
-size 260895956

 version https://git-lfs.github.com/spec/v1
+oid sha256:419fce98cde0a0c65acb33b98dd2e67820aec8342751d164cc0948369ef8dd59
+size 260902108

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:607060dc1a385aeade053d5949a8e442300f240193b4ff8d5eb06938f5581f3d
 size 5841

 version https://git-lfs.github.com/spec/v1
+oid sha256:2dc0d1f41610192cd2e3fb0ddf624cd2ba54ef1a162452d0ad275908ce535518
 size 5841