Spaces:

reddit-tools-HF
/

processing-bestofredditorupdates

Sleeping

App Files Files Community

Clean readme update script

by Wauplin HF Staff - opened May 21, 2024

base: refs/heads/main

←

from: refs/pr/2

Discussion Files changed

+16

-22

Files changed (1) hide show

src/readme_update.py +16 -22

src/readme_update.py CHANGED Viewed

@@ -1,14 +1,10 @@
 import os
 from datetime import datetime
-from pathlib import Path
-from shutil import rmtree
 import pytz
-from huggingface_hub import HfApi, Repository
 GENERATED_BELOW_MARKER = "--- Generated Part of README Below ---"
-hf_token = os.environ["HUGGINGFACE_AUTH_TOKEN"]
-local_repo_path = "./readme_repo"
 def update_dataset_readme(dataset_name: str, subreddit: str, new_rows: int) -> None:
@@ -19,31 +15,29 @@ def update_dataset_readme(dataset_name: str, subreddit: str, new_rows: int) -> N
     dataset_name (str): Name of the dataset repository.
     subreddit (str): Name of the subreddit being used for dataset creation.
     new_rows (int): Number of new rows added in the latest update.
-    hf_token (str): Hugging Face authentication token.
-    local_repo_path (str): Local path to clone the repository.
     """
     # Initialize HfApi
     api = HfApi()
-    if Path(local_repo_path).exists():
-        rmtree(local_repo_path)
-    # Clone the repository locally
-    repo = Repository(local_repo_path, clone_from=dataset_name, repo_type='dataset', use_auth_token=hf_token)
-    # Read the README file
-    with open(f"{local_repo_path}/README.md", "r") as file:
         old_readme = file.read()
-    # Modify the README
     new_readme = append_to_readme(subreddit=subreddit, new_rows=new_rows, old_readme=old_readme)
-    # Write the updated README back to the repository
-    with open(f"{local_repo_path}/README.md", "w") as file:
-        file.write(new_readme)
-    # Push the changes
-    repo.push_to_hub(blocking=True, commit_message=f'Pushing {new_rows} new rows')
 def append_to_readme(subreddit: str, new_rows: int, old_readme: str) -> str:

 import os
 from datetime import datetime
 import pytz
+from huggingface_hub import HfApi
 GENERATED_BELOW_MARKER = "--- Generated Part of README Below ---"
 def update_dataset_readme(dataset_name: str, subreddit: str, new_rows: int) -> None:
     dataset_name (str): Name of the dataset repository.
     subreddit (str): Name of the subreddit being used for dataset creation.
     new_rows (int): Number of new rows added in the latest update.
     """
     # Initialize HfApi
     api = HfApi()
+    # Download README file
+    readme_path = api.hf_hub_download(repo_id=dataset_name, repo_type="dataset", filename="README.md", token=hf_token)
+    # Read it
+    with open(readme_path, "r") as file:
         old_readme = file.read()
+    # Modify it
     new_readme = append_to_readme(subreddit=subreddit, new_rows=new_rows, old_readme=old_readme)
+    # Commit modifications
+    api.upload_file(
+        path_or_fileobj=new_readme.encode(),
+        path_in_repo="README.md",
+        repo_id=dataset_name,
+        repo_type="dataset",
+        token=hf_token,
+        commit_message=f'Pushing {new_rows} new rows'
+    )
 def append_to_readme(subreddit: str, new_rows: int, old_readme: str) -> str: