Bienvenido/a a este repositorio de proyectos de ingeniería de datos. Acá vas a encontrar soluciones prácticas para extraer, procesar y analizar datos. Cada carpeta es un proyecto independiente, pensado para tareas comunes de data engineering, machine learning y web scraping.
Este proyecto utiliza técnicas de visión por computadora y aprendizaje profundo para reconocer letras de la Lengua de Señas Argentina (LSA) a partir de imágenes. Incluye notebooks interactivos para tomar fotos, preprocesar imágenes (recortes y remoción de fondo), entrenar modelos y realizar predicciones.
- Captura de imágenes desde webcam o uso de datasets pre-procesados.
- Remoción automática del fondo usando redes neuronales.
- Entrenamiento y evaluación de modelos con Keras y Python.
- Ideal para aprender sobre IA aplicada a problemas reales y accesibilidad.
Herramienta para extraer datos del HTML de distintos sitios web, con soporte para login, navegadores headless (Selenium, Playwright) y spiders preconfigurados para sitios populares. Ideal para automatizar la recopilación de info pública.
- Funciona con HTML y SSR.
- Docker listo para levantar en cualquier máquina.
- Configuración fácil vía YAML.
Automatiza la extracción de contactos de franquiciados desde PDFs. Incluye scripts para procesar, limpiar y exportar datos, más análisis de logs y combinación de resultados.
- Procesa PDFs en lote.
- Exporta resultados a CSV.
- Consolida y analiza logs.
Herramienta para extraer valores de superficie de PDFs de franquicias, usando regex configurables. Útil para métricas inmobiliarias o comerciales.
- Extracción automática vía regex.
- Configurable para distintos formatos.
Script para agregar marcas de agua y páginas de portada a PDFs en lote. Ideal para documentos oficiales o presentaciones.
- Marca de agua en cada hoja.
- Página principal personalizada.
- Procesamiento masivo.
Cada proyecto trae archivos de configuración y scripts en Python. Recomendado Python 3.10+, y algunos tienen Docker para facilitar todo.
¿Querés más detalles de algún proyecto? Mirá la documentación específica en cada carpeta o contactame.