Skip to content

Portafolio de análisis de datos que integra proyectos prácticos y certificaciones en Python, SQL, Excel, Machine Learning entre otras herramientas. Incluye desde limpieza y visualización de datos con pandas, hasta modelos de ML (RNN, LSTM, Transfer Learning) y pruebas estadísticas (Chi‑cuadrado, ANOVA, regresión lineal, prueba de independencia).

Notifications You must be signed in to change notification settings

Allan19k/Data_analysis_portfolio

Repository files navigation

📊 Data Analysis Portfolio

Este repositorio —en constante desarrollo— reúne mis proyectos, ejercicios y certificaciones en el área de análisis de datos, con el objetivo de postularme a una vacante de prácticas profesionales en Black Labs (Chihuahua), como parte de mi formación académica en la carrera de Ingeniería en Ciencias de la Computación.

Actualmente, el portafolio incluye secciones completas de Python, Excel, SQL y Machine Learning, que corresponden directamente con las herramientas mencionadas en la vacante. Sin embargo, mi intención no es solo cumplir con lo solicitado, sino demostrar que soy una persona comprometida con el aprendizaje continuo y con la mejora constante de mis habilidades.

Este repositorio crecerá progresivamente, incorporando nuevas tecnologías, herramientas y metodologías que son relevantes en el campo del análisis de datos. Considero fundamental mantenerse actualizado en un entorno tecnológico en constante evolución, donde las soluciones actuales pueden quedar rápidamente desfasadas. Por ello, además de consolidar lo aprendido, me esfuerzo por explorar e integrar enfoques emergentes que puedan ser de valor para la empresa en la que me desempeñe.


1. 🏅 Certifications

Colección de certificados de cursos y programas formativos que he completado, o estoy por completar (checklist en mi repositorio principal: Allan19k), incluidos:

  • Kaggle Learn (Python, Pandas, Data Cleaning, Data Visualization, SQL, Machine Learning, Geospatial Analysis etc.)
  • Santander Open Academy (Excel, Fundamentos de ChatGPT, Power BI)

2. 📈 Excel Projects

Proyectos de Excel aplicados a análisis y dashboarding, entre ellos:

  • Dashboards interactivos y formatos condicionales
  • Prácticas del curso de Excel de Santander y otros ejercicios básicos
  • Ejercicios de simulación y reportes automatizados

3. 🤖 Machine Learning Projects

Desarrollados en 7º semestre con la Dra. Graciela María de Jesús Ramírez Alonso:

  • Repaso de Álgebra para redes neuronales (Ejercicios de Álgebra usando la libreria Numpy, enfocados a reforzar dichos conocimientos esenciales para ML)
  • Búsqueda de hiperparámetros (GridSearchCV con MLPClassifier sobre load_wine)
  • Predicción de series temporales (RNN vs. LSTM para EUR/USD)
  • Transfer Learning con ResNet50 para clasificación de imágenes
  • Smart Dairy Farming: Milk Yield Classification App (Proyecto Final de la materia) Consiste en una aplicación móvil que utiliza un modelo de clasificación entrenado con visión por computadora para predecir niveles de producción de leche (alta, media o baja) a partir de imágenes. Fue publicado como artículo científico y demuestra la aplicación práctica del aprendizaje automático en el sector agropecuario
  • Documentación y métricas en Jupyter Notebooks

4. 📉 Minitab Projects

Ejercicios de Estadística realizados en 5º semestre con la Profesora Patricia Guadalupe Orpinel Ureña:

  • Pruebas Chi‑cuadrado (bondad de ajuste e independencia)
  • ANOVA (un solo factor y dos factores)
  • Regresión Lineal (simple y múltiple)
  • Conclusiones formales, gráficos y validación de supuestos

5. 🐍 Python Projects

Proyectos y ejercicios con diversas librerías:

  • Fundamentos de Python (sintaxis, funciones, listas, condicionales…)
  • Análisis Estadistico usando Statistics
  • Generación de dummy data con Faker para exportación a CSV y xlsx
  • Cursos de Kaggle Learn (Pandas, Data Cleaning y Data Visualization)
  • Adaptaciones de notebooks de Kaggle

6. 💾 SQL Projects

Ejercicios del curso de Fundamentos de Bases de Datos desarrollados con el Profesor José Saúl de Lira Miramontes en 6º semestre y más:

  • Instalación y configuración de Oracle 21c XE y esquema HR
  • Consultas básicas: SELECT, WHERE, JOIN, GROUP BY, subconsultas, DML, views
  • Ejercicios organizados por tema con capturas y explicaciones

7. 🦾 Intro to AI Ethics (Kaggle)

Curso enfocado en los principios éticos del uso de la inteligencia artificial. A través de ejemplos y casos reales, se exploraron conceptos clave como sesgos algorítmicos, privacidad, equidad y responsabilidad en sistemas automatizados.

Incluí este contenido en mi portafolio porque considero fundamental comprender el impacto social de las herramientas que desarrollamos. En particular, me interesa aplicar estos principios dentro del análisis de datos y proyectos de inteligencia artificial de forma ética y transparente.


🔭 ¿Qué sigue?

  • Completar todos los cursos de Kaggle para reforzar SQL, Machine Learning y otros temas relacionados
  • 🔜 Integrar Power BI para dashboards ejecutivos (curso en proceso)
  • Añadir más proyectos propios con datos reales o simulados
  • Mejorar continuamente la documentación y el diseño del portafolio

Propósito: Este portafolio es mi carta de presentación para prácticas profesionales en Black Labs (Chihuahua) y muestra mi compromiso con el aprendizaje continuo en análisis de datos.

Repositorios y secciones actualizados al 2025‑07‑26.

About

Portafolio de análisis de datos que integra proyectos prácticos y certificaciones en Python, SQL, Excel, Machine Learning entre otras herramientas. Incluye desde limpieza y visualización de datos con pandas, hasta modelos de ML (RNN, LSTM, Transfer Learning) y pruebas estadísticas (Chi‑cuadrado, ANOVA, regresión lineal, prueba de independencia).

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published