Skip to content

fedecarboni7/data-projects

Repository files navigation

Data Projects

Bienvenido/a a este repositorio de proyectos de ingeniería de datos. Acá vas a encontrar soluciones prácticas para extraer, procesar y analizar datos. Cada carpeta es un proyecto independiente, pensado para tareas comunes de data engineering, machine learning y web scraping.

Proyectos incluidos

1. Reconocimiento de Lengua de Señas

Este proyecto utiliza técnicas de visión por computadora y aprendizaje profundo para reconocer letras de la Lengua de Señas Argentina (LSA) a partir de imágenes. Incluye notebooks interactivos para tomar fotos, preprocesar imágenes (recortes y remoción de fondo), entrenar modelos y realizar predicciones.

  • Captura de imágenes desde webcam o uso de datasets pre-procesados.
  • Remoción automática del fondo usando redes neuronales.
  • Entrenamiento y evaluación de modelos con Keras y Python.
  • Ideal para aprender sobre IA aplicada a problemas reales y accesibilidad.

2. Web Scraping / Website Scanner

Herramienta para extraer datos del HTML de distintos sitios web, con soporte para login, navegadores headless (Selenium, Playwright) y spiders preconfigurados para sitios populares. Ideal para automatizar la recopilación de info pública.

  • Funciona con HTML y SSR.
  • Docker listo para levantar en cualquier máquina.
  • Configuración fácil vía YAML.

3. FDD Scanner / Franchisee Contacts

Automatiza la extracción de contactos de franquiciados desde PDFs. Incluye scripts para procesar, limpiar y exportar datos, más análisis de logs y combinación de resultados.

  • Procesa PDFs en lote.
  • Exporta resultados a CSV.
  • Consolida y analiza logs.

4. FDD Scanner / Extract Surface Area

Herramienta para extraer valores de superficie de PDFs de franquicias, usando regex configurables. Útil para métricas inmobiliarias o comerciales.

  • Extracción automática vía regex.
  • Configurable para distintos formatos.

5. Manage Files / Watermark and Frontpage

Script para agregar marcas de agua y páginas de portada a PDFs en lote. Ideal para documentos oficiales o presentaciones.

  • Marca de agua en cada hoja.
  • Página principal personalizada.
  • Procesamiento masivo.

Cada proyecto trae archivos de configuración y scripts en Python. Recomendado Python 3.10+, y algunos tienen Docker para facilitar todo.


¿Querés más detalles de algún proyecto? Mirá la documentación específica en cada carpeta o contactame.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published