Training in progress, step 25

Files changed (8) hide show

adapter_config.json CHANGED Viewed

@@ -16,8 +16,8 @@
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
-    "q_proj",
     "o_proj",
     "k_proj",
     "v_proj"
   ],

   "rank_pattern": {},
   "revision": null,
   "target_modules": [
     "o_proj",
+    "q_proj",
     "k_proj",
     "v_proj"
   ],

adapter_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b83398fcd1f83b2b4645df1bdbeebc94b55adf84df4f531c41d4da50278bd54e
 size 872508554

 version https://git-lfs.github.com/spec/v1
+oid sha256:5a65b50967390cfef35f29c0c558040200984c1dc16570052ecad9979dae852d
 size 872508554

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4507cecfab4aed7b850ede3e6b20862e39e7aafc5cefba9750cc95b8301e63a4
 size 872450448

 version https://git-lfs.github.com/spec/v1
+oid sha256:e0db23340a233d6a10240667d8ba287a38e66b15ecd1d863fee3447be11638b8
 size 872450448

all_results.json CHANGED Viewed

@@ -1,13 +1,13 @@
 {
     "epoch": 0.03,
     "eval_loss": 0.8876652717590332,
-    "eval_runtime": 113.1958,
     "eval_samples": 650,
-    "eval_samples_per_second": 5.742,
-    "eval_steps_per_second": 1.44,
     "train_loss": 1.0970729541778566,
-    "train_runtime": 344.8794,
     "train_samples": 5845,
-    "train_samples_per_second": 0.58,
-    "train_steps_per_second": 0.145
 }

 {
     "epoch": 0.03,
     "eval_loss": 0.8876652717590332,
+    "eval_runtime": 112.9915,
     "eval_samples": 650,
+    "eval_samples_per_second": 5.753,
+    "eval_steps_per_second": 1.443,
     "train_loss": 1.0970729541778566,
+    "train_runtime": 356.1922,
     "train_samples": 5845,
+    "train_samples_per_second": 0.561,
+    "train_steps_per_second": 0.14
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 0.03,
     "eval_loss": 0.8876652717590332,
-    "eval_runtime": 113.1958,
     "eval_samples": 650,
-    "eval_samples_per_second": 5.742,
-    "eval_steps_per_second": 1.44
 }

 {
     "epoch": 0.03,
     "eval_loss": 0.8876652717590332,
+    "eval_runtime": 112.9915,
     "eval_samples": 650,
+    "eval_samples_per_second": 5.753,
+    "eval_steps_per_second": 1.443
 }

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 0.03,
     "train_loss": 1.0970729541778566,
-    "train_runtime": 344.8794,
     "train_samples": 5845,
-    "train_samples_per_second": 0.58,
-    "train_steps_per_second": 0.145
 }

 {
     "epoch": 0.03,
     "train_loss": 1.0970729541778566,
+    "train_runtime": 356.1922,
     "train_samples": 5845,
+    "train_samples_per_second": 0.561,
+    "train_steps_per_second": 0.14
 }

trainer_state.json CHANGED Viewed

@@ -29,9 +29,9 @@
     {
       "epoch": 0.02,
       "eval_loss": 0.9467611908912659,
-      "eval_runtime": 113.1765,
-      "eval_samples_per_second": 5.743,
-      "eval_steps_per_second": 1.44,
       "step": 25
     },
     {
@@ -55,9 +55,9 @@
     {
       "epoch": 0.03,
       "eval_loss": 0.8876652717590332,
-      "eval_runtime": 114.0148,
-      "eval_samples_per_second": 5.701,
-      "eval_steps_per_second": 1.43,
       "step": 50
     },
     {
@@ -65,9 +65,9 @@
       "step": 50,
       "total_flos": 4008716634423296.0,
       "train_loss": 1.0970729541778566,
-      "train_runtime": 344.8794,
-      "train_samples_per_second": 0.58,
-      "train_steps_per_second": 0.145
     }
   ],
   "logging_steps": 10,

     {
       "epoch": 0.02,
       "eval_loss": 0.9467611908912659,
+      "eval_runtime": 113.3532,
+      "eval_samples_per_second": 5.734,
+      "eval_steps_per_second": 1.438,
       "step": 25
     },
     {
     {
       "epoch": 0.03,
       "eval_loss": 0.8876652717590332,
+      "eval_runtime": 114.2498,
+      "eval_samples_per_second": 5.689,
+      "eval_steps_per_second": 1.427,
       "step": 50
     },
     {
       "step": 50,
       "total_flos": 4008716634423296.0,
       "train_loss": 1.0970729541778566,
+      "train_runtime": 356.1922,
+      "train_samples_per_second": 0.561,
+      "train_steps_per_second": 0.14
     }
   ],
   "logging_steps": 10,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ce4fc530190fc50faa5c41b7996377ae6495a8c82a8243129b1546cca66170e8
 size 4664

 version https://git-lfs.github.com/spec/v1
+oid sha256:bfbbe611ebadd32f93b7dc4ee103872d24668c7eff310a8b7fe4ca99b2448042
 size 4664