Skip to content

ayorick23/data-science-salaries-analysis

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

13 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

📊 Data Science Salaries Analysis

Este proyecto presenta un análisis integral del mercado global de salarios en el área de Data Science, con el objetivo de identificar los principales factores que influyen en la compensación, tales como el rol, nivel de experiencia, ubicación geográfica y tipo de empleo.

El análisis fue desarrollado siguiendo un enfoque end-to-end, incluyendo procesos de ETL, análisis exploratorio de datos (EDA), consultas SQL y visualización interactiva en Power BI.

📚 Tabla de contenidos

🎯 Objetivos

  • Analizar la distribución de salarios en Data Science a nivel global
  • Identificar los roles mejor remunerados
  • Evaluar el impacto de la experiencia en los salarios
  • Comparar salarios entre países y regiones
  • Proporcionar insights útiles para la toma de decisiones

🧠 Enfoque del análisis

El proyecto fue estructurado bajo un flujo de trabajo profesional de análisis de datos:

  1. ETL (Extract, Transform, Load)

    • Limpieza de datos
    • Estandarización de variables
    • Creación de nuevas características (feature engineering)
  2. EDA (Exploratory Data Analysis)

    • Análisis de distribuciones
    • Identificación de outliers
    • Comparaciones entre variables clave
  3. SQL (Análisis de negocio)

    • Consultas para responder preguntas estratégicas
    • Agregaciones y segmentaciones
    • Uso de funciones de ventana
  4. Dashboard en Power BI

    • Visualización interactiva
    • KPIs clave
    • Filtros dinámicos

🛠️ Tecnologías utilizadas

  • Python (Pandas, NumPy, Matplotlib, Seaborn)
  • SQL (SQL Server)
  • Power BI
  • Jupyter Notebook

📂 Estructura del proyecto

data-science-salaries-analysis/
│
├── data/
│   ├── raw/
│   └── processed/
│
├── notebooks/
│   └── eda_ds_salaries.ipynb
│
├── sql/
│   └── queries.sql
│
├── dashboard/
│   └── ds_salaries_dashboard.pbix
│
├── src/
│   └── etl.py
│
├── .gitignore
├── requirements.txt
├── LICENSE
└── README.md

📊 Dashboard (Power BI)

El dashboard permite explorar de manera interactiva:

  • Salario promedio global
  • Comparación por roles y experiencia
  • Análisis por país
  • Distribución salarial
  • Impacto del tipo de empleo

🔗 Prueba el Dashboard interactivo aquí.

alt text Demo del proyecto

📈 Principales insights

  • Los roles de Data Scientist y Data Engineer presentan los salarios más altos
  • El nivel de experiencia es uno de los factores más determinantes en la compensación
  • Estados Unidos lidera el mercado en términos de salario promedio
  • Los empleos Full-time dominan el mercado laboral
  • Existe una alta variabilidad en salarios, especialmente en roles senior

🚀 Cómo ejecutar el proyecto

  1. Clonar el repositorio:

    git clone https://github.com/ayorick23/ds-salaries-analysis.git
  2. Instalar dependencias:

    pip install -r requirements.txt
  3. Ejecutar el ETL:

    python src/etl.py
  4. Abrir el notebook:

    jupyter notebook notebooks/EDA_ds_salaries.ipynb

💡 Valor del proyecto

Este proyecto demuestra habilidades clave para un rol de Data Analyst:

  • Limpieza y transformación de datos
  • Análisis exploratorio con enfoque de negocio
  • Uso de SQL para generación de insights
  • Creación de dashboards interactivos
  • Comunicación efectiva de resultados

📝 Fuentes de Datos y Créditos

Este proyecto ha sido posible gracias a la disponibilidad de datos abiertos. El conjunto de datos principal utilizado para este análisis proviene de:

  • Fuente Primaria: ai-jobs.net - Plataforma original que recopila y distribuye los datos de salarios en el sector tecnológico.
  • Dataset en Kaggle: Data Science Job Salaries - Proporcionado por la usuario Ruchi Bhatia.

Agradecemos a ambas plataformas por facilitar el acceso a esta información para fines educativos y de análisis.

🎖️ Licencia

Este proyecto está bajo la Licencia MIT. Consulta el archivo LICENSE para más detalles.

📩 Contacto

Si deseas conocer más sobre este proyecto o colaborar, puedes contactarme:

GitHub Gmail LinkedIn Kaggle

About

End-to-end Data Analysis project exploring global Data Science salaries using Python, SQL, and Power BI, including ETL, EDA, and interactive dashboarding.

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors