Spaces:

Heartsync
/

phoenix

Paused

App Files Files Community

seawolf2357 commited on 25 days ago

Commit

23f9fc2

verified ·

1 Parent(s): c381ead

Update app.py

Browse files

Files changed (1) hide show

app.py +50 -5

app.py CHANGED Viewed

@@ -48,7 +48,8 @@ from huggingface_hub import HfApi, create_repo
 DEVICE = "cuda" if torch.cuda.is_available() else "cpu"
 NUM_GPUS = torch.cuda.device_count()
-STORAGE_PATH = "/data"
 DB_PATH = f"{STORAGE_PATH}/phoenix_experiments.db"
 MODELS_PATH = f"{STORAGE_PATH}/phoenix_models"
 DEFAULT_MODEL = "Qwen/Qwen3-0.6B"
@@ -56,8 +57,19 @@ DEFAULT_MODEL = "Qwen/Qwen3-0.6B"
 # HuggingFace Token
 HF_TOKEN = os.getenv("HF_TOKEN")
-Path(STORAGE_PATH).mkdir(parents=True, exist_ok=True)
-Path(MODELS_PATH).mkdir(parents=True, exist_ok=True)
 print(f"🔥 PHOENIX Platform v2.0 - Multi-GPU Optimized")
 print(f"💾 Storage: {STORAGE_PATH}")
@@ -486,12 +498,16 @@ def finetune_retention_model(
     num_steps: int = 3000,
     batch_size: int = 4,
     learning_rate: float = 1e-5,
-    output_dir: str = "/data/finetuning_temp",
     use_gradient_checkpointing: bool = True,
 ):
     """
     🆕 v2.0: Brumby-style Retraining with Multi-GPU Support
     """
     print("\n" + "="*80)
     print("🔥 PHOENIX RETRAINING - Multi-GPU (v2.0)")
     print("="*80)
@@ -1513,5 +1529,34 @@ with gr.Blocks(title="🔥 PHOENIX v2.0 Multi-GPU", theme=gr.themes.Soft()) as d
 if __name__ == "__main__":
     demo.queue(max_size=20)
-    demo.launch(server_name="0.0.0.0", server_port=7860, share=False)

 DEVICE = "cuda" if torch.cuda.is_available() else "cpu"
 NUM_GPUS = torch.cuda.device_count()
+# ✅ 우분투 호환: 홈 디렉토리 또는 환경 변수 사용
+STORAGE_PATH = os.getenv("PHOENIX_STORAGE_PATH", str(Path.home() / "phoenix_data"))
 DB_PATH = f"{STORAGE_PATH}/phoenix_experiments.db"
 MODELS_PATH = f"{STORAGE_PATH}/phoenix_models"
 DEFAULT_MODEL = "Qwen/Qwen3-0.6B"
 # HuggingFace Token
 HF_TOKEN = os.getenv("HF_TOKEN")
+# 디렉토리 생성 (권한 오류 처리)
+try:
+    Path(STORAGE_PATH).mkdir(parents=True, exist_ok=True)
+    Path(MODELS_PATH).mkdir(parents=True, exist_ok=True)
+    print(f"✅ Storage initialized: {STORAGE_PATH}")
+except PermissionError:
+    print(f"⚠️ Permission denied for {STORAGE_PATH}")
+    print(f"   Using current directory instead")
+    STORAGE_PATH = "./phoenix_data"
+    DB_PATH = f"{STORAGE_PATH}/phoenix_experiments.db"
+    MODELS_PATH = f"{STORAGE_PATH}/phoenix_models"
+    Path(STORAGE_PATH).mkdir(parents=True, exist_ok=True)
+    Path(MODELS_PATH).mkdir(parents=True, exist_ok=True)
 print(f"🔥 PHOENIX Platform v2.0 - Multi-GPU Optimized")
 print(f"💾 Storage: {STORAGE_PATH}")
     num_steps: int = 3000,
     batch_size: int = 4,
     learning_rate: float = 1e-5,
+    output_dir: str = None,
     use_gradient_checkpointing: bool = True,
 ):
     """
     🆕 v2.0: Brumby-style Retraining with Multi-GPU Support
     """
+    # output_dir 기본값 설정
+    if output_dir is None:
+        output_dir = f"{STORAGE_PATH}/finetuning_temp"
     print("\n" + "="*80)
     print("🔥 PHOENIX RETRAINING - Multi-GPU (v2.0)")
     print("="*80)
 if __name__ == "__main__":
+    import argparse
+    parser = argparse.ArgumentParser(description='PHOENIX v2.0 Multi-GPU')
+    parser.add_argument('--port', type=int, default=None, help='Server port (default: auto find 7860-7960)')
+    parser.add_argument('--share', action='store_true', help='Create public Gradio link')
+    parser.add_argument('--host', type=str, default="0.0.0.0", help='Server host')
+    args = parser.parse_args()
     demo.queue(max_size=20)
+    # 포트 자동 찾기
+    if args.port is None:
+        # 7860부터 7960까지 시도
+        for port in range(7860, 7960):
+            try:
+                demo.launch(
+                    server_name=args.host,
+                    server_port=port,
+                    share=args.share,
+                    show_error=True
+                )
+                break
+            except OSError:
+                continue
+    else:
+        demo.launch(
+            server_name=args.host,
+            server_port=args.port,
+            share=args.share,
+            show_error=True
+        )