Spaces:

reddit-tools-HF
/

processing-bestofredditorupdates

Sleeping

derek-thomas commited on Jun 26, 2024

Commit

356f92c

verified ·

1 Parent(s): 8f38904

Adding the HF_TOKEN to gradio_client

Files changed (1) hide show

src/utilities.py CHANGED Viewed

@@ -14,6 +14,8 @@ OG_DATASET = f"{USERNAME}/dataset-creator-reddit-{SUBREDDIT}"
 PROCESSED_DATASET = os.environ['PROCESSED_DATASET']
 embeddings_space = f"{USERNAME}/nomic-embeddings"
 FILTER_IDS_URL = "https://huggingface.co/spaces/reddit-tools-HF/dataset-creator-reddit-bestofredditorupdates/raw/main/filter_ids.json"
 logger = setup_logger(__name__)
@@ -32,7 +34,7 @@ def load_datasets():
 def merge_and_update_datasets(dataset, original_dataset):
     # Get client
-    client = Client(embeddings_space)
     # Merge and figure out which rows need to be updated with embeddings
     odf = original_dataset['train'].to_pandas()

 PROCESSED_DATASET = os.environ['PROCESSED_DATASET']
 embeddings_space = f"{USERNAME}/nomic-embeddings"
 FILTER_IDS_URL = "https://huggingface.co/spaces/reddit-tools-HF/dataset-creator-reddit-bestofredditorupdates/raw/main/filter_ids.json"
+HF_TOKEN = os.environ.get("HF_TOKEN")
 logger = setup_logger(__name__)
 def merge_and_update_datasets(dataset, original_dataset):
     # Get client
+    client = Client(embeddings_space, hf_token=HF_TOKEN)
     # Merge and figure out which rows need to be updated with embeddings
     odf = original_dataset['train'].to_pandas()