Spaces:

RJuro
/

SDC_test

Runtime error

RJuro commited on May 13, 2024

Commit

ad809c8

verified ·

1 Parent(s): 0fafc69

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,31 +1,30 @@
-import streamlit as st
 import pandas as pd
-import matplotlib.pyplot as plt
-import seaborn as sns
-st.title('My first app')
-st.write("Here's our first app with Streamlit")
-df_courses_year = pd.read_csv('udemy_courses_year.csv')
-# Extract unique years and sort them
-years = sorted(df_courses_year['year'].unique())
-# Sidebar for selecting year(s)
-selected_years = st.sidebar.multiselect('Select Year(s)', years, default=years)
-# Filter data based on selected year(s)
-filtered_data = df_courses_year[df_courses_year['year'].isin(selected_years)]
-# Set style for better visuals
-sns.set(style="whitegrid")
-# Create the plot
-plt.figure(figsize=(10, 6))
-ax = sns.countplot(x='year', data=filtered_data, palette='viridis')
-ax.set_title('Count of Observations per Year')
-ax.set_xlabel('Year')
-ax.set_ylabel('Count')
-plt.xticks(rotation=45)
-st.pyplot(plt)

 import pandas as pd
+import streamlit as st
+st.title('Udemy Courses Analysis')
+courses_info = pd.read_csv('udemy_courses_info.csv')
+courses_year = pd.read_csv('udemy_courses_year.csv')
+couses_df = pd.merge(courses_info, courses_year, on='course_id')
+options = st.multiselect(
+    "Please select subjects",
+    couses_df.subject.unique(),
+    couses_df.subject.unique())
+couses_df = couses_df[couses_df['subject'].isin(options)]
+# Group the DataFrame by 'subject' and 'course_title', and calculate the sum of 'num_subscribers'
+grouped = couses_df.groupby(['subject', 'course_title'])['num_subscribers'].sum()
+# Reset the index of the grouped DataFrame
+grouped = grouped.reset_index()
+# Sort the grouped DataFrame by 'subject' and 'num_subscribers' in descending order
+grouped = grouped.sort_values(['subject', 'num_subscribers'], ascending=[True, False])
+# Group the sorted DataFrame by 'subject' and get the top 5 rows for each group
+top_courses = grouped.groupby('subject').head(5)
+st.dataframe(top_courses)