knowledgator
/

gliner-x-large-v0.5

Token Classification

information extraction

entity recognition

Model card Files Files and versions

gliner-x-large-v0.5 / trainer_state.json

alexandrlukashov's picture

alexandrlukashov

Upload folder using huggingface_hub

7015158 verified 5 months ago

2.95 kB

	{
	"best_global_step": null,
	"best_metric": null,
	"best_model_checkpoint": null,
	"epoch": 0.8421052631578947,
	"eval_steps": 500,
	"global_step": 1000,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 0.08421052631578947,
	"grad_norm": 668.1707763671875,
	"learning_rate": 2.7653631284916204e-06,
	"loss": 76.9764,
	"step": 100
	},
	{
	"epoch": 0.16842105263157894,
	"grad_norm": 334.9554138183594,
	"learning_rate": 4.995154405440528e-06,
	"loss": 20.7828,
	"step": 200
	},
	{
	"epoch": 0.25263157894736843,
	"grad_norm": 412.4559326171875,
	"learning_rate": 4.827522757879159e-06,
	"loss": 15.08,
	"step": 300
	},
	{
	"epoch": 0.3368421052631579,
	"grad_norm": 237.86691284179688,
	"learning_rate": 4.436070529523132e-06,
	"loss": 13.2074,
	"step": 400
	},
	{
	"epoch": 0.42105263157894735,
	"grad_norm": 524.6715087890625,
	"learning_rate": 3.858440774476823e-06,
	"loss": 12.3694,
	"step": 500
	},
	{
	"epoch": 0.42105263157894735,
	"eval_loss": 355.589599609375,
	"eval_runtime": 177.1704,
	"eval_samples_per_second": 2.822,
	"eval_steps_per_second": 2.822,
	"step": 500
	},
	{
	"epoch": 0.5052631578947369,
	"grad_norm": 240.74716186523438,
	"learning_rate": 3.1501798571403568e-06,
	"loss": 11.8955,
	"step": 600
	},
	{
	"epoch": 0.5894736842105263,
	"grad_norm": 245.36228942871094,
	"learning_rate": 2.3793959708002526e-06,
	"loss": 11.3556,
	"step": 700
	},
	{
	"epoch": 0.6736842105263158,
	"grad_norm": 240.87294006347656,
	"learning_rate": 1.6202096784128967e-06,
	"loss": 10.9534,
	"step": 800
	},
	{
	"epoch": 0.7578947368421053,
	"grad_norm": 256.82452392578125,
	"learning_rate": 9.456262884412293e-07,
	"loss": 11.0009,
	"step": 900
	},
	{
	"epoch": 0.8421052631578947,
	"grad_norm": 246.02391052246094,
	"learning_rate": 4.205154764348304e-07,
	"loss": 10.8251,
	"step": 1000
	},
	{
	"epoch": 0.8421052631578947,
	"eval_loss": 300.8138732910156,
	"eval_runtime": 178.7981,
	"eval_samples_per_second": 2.796,
	"eval_steps_per_second": 2.796,
	"step": 1000
	}
	],
	"logging_steps": 100,
	"max_steps": 1188,
	"num_input_tokens_seen": 0,
	"num_train_epochs": 1,
	"save_steps": 500,
	"stateful_callbacks": {
	"TrainerControl": {
	"args": {
	"should_epoch_stop": false,
	"should_evaluate": false,
	"should_log": false,
	"should_save": true,
	"should_training_stop": false
	},
	"attributes": {}
	}
	},
	"total_flos": 0.0,
	"train_batch_size": 1,
	"trial_name": null,
	"trial_params": null
	}