Este proyecto presenta un análisis integral del mercado global de salarios en el área de Data Science, con el objetivo de identificar los principales factores que influyen en la compensación, tales como el rol, nivel de experiencia, ubicación geográfica y tipo de empleo.
El análisis fue desarrollado siguiendo un enfoque end-to-end, incluyendo procesos de ETL, análisis exploratorio de datos (EDA), consultas SQL y visualización interactiva en Power BI.
- Analizar la distribución de salarios en Data Science a nivel global
- Identificar los roles mejor remunerados
- Evaluar el impacto de la experiencia en los salarios
- Comparar salarios entre países y regiones
- Proporcionar insights útiles para la toma de decisiones
El proyecto fue estructurado bajo un flujo de trabajo profesional de análisis de datos:
-
ETL (Extract, Transform, Load)
- Limpieza de datos
- Estandarización de variables
- Creación de nuevas características (feature engineering)
-
EDA (Exploratory Data Analysis)
- Análisis de distribuciones
- Identificación de outliers
- Comparaciones entre variables clave
-
SQL (Análisis de negocio)
- Consultas para responder preguntas estratégicas
- Agregaciones y segmentaciones
- Uso de funciones de ventana
-
Dashboard en Power BI
- Visualización interactiva
- KPIs clave
- Filtros dinámicos
- Python (Pandas, NumPy, Matplotlib, Seaborn)
- SQL (SQL Server)
- Power BI
- Jupyter Notebook
data-science-salaries-analysis/
│
├── data/
│ ├── raw/
│ └── processed/
│
├── notebooks/
│ └── eda_ds_salaries.ipynb
│
├── sql/
│ └── queries.sql
│
├── dashboard/
│ └── ds_salaries_dashboard.pbix
│
├── src/
│ └── etl.py
│
├── .gitignore
├── requirements.txt
├── LICENSE
└── README.md
El dashboard permite explorar de manera interactiva:
- Salario promedio global
- Comparación por roles y experiencia
- Análisis por país
- Distribución salarial
- Impacto del tipo de empleo
🔗 Prueba el Dashboard interactivo aquí.
- Los roles de Data Scientist y Data Engineer presentan los salarios más altos
- El nivel de experiencia es uno de los factores más determinantes en la compensación
- Estados Unidos lidera el mercado en términos de salario promedio
- Los empleos Full-time dominan el mercado laboral
- Existe una alta variabilidad en salarios, especialmente en roles senior
-
Clonar el repositorio:
git clone https://github.com/ayorick23/ds-salaries-analysis.git
-
Instalar dependencias:
pip install -r requirements.txt
-
Ejecutar el ETL:
python src/etl.py
-
Abrir el notebook:
jupyter notebook notebooks/EDA_ds_salaries.ipynb
Este proyecto demuestra habilidades clave para un rol de Data Analyst:
- Limpieza y transformación de datos
- Análisis exploratorio con enfoque de negocio
- Uso de SQL para generación de insights
- Creación de dashboards interactivos
- Comunicación efectiva de resultados
Este proyecto ha sido posible gracias a la disponibilidad de datos abiertos. El conjunto de datos principal utilizado para este análisis proviene de:
- Fuente Primaria: ai-jobs.net - Plataforma original que recopila y distribuye los datos de salarios en el sector tecnológico.
- Dataset en Kaggle: Data Science Job Salaries - Proporcionado por la usuario Ruchi Bhatia.
Agradecemos a ambas plataformas por facilitar el acceso a esta información para fines educativos y de análisis.
Este proyecto está bajo la Licencia MIT. Consulta el archivo LICENSE para más detalles.
Si deseas conocer más sobre este proyecto o colaborar, puedes contactarme:

