Data Projects

Bienvenido/a a este repositorio de proyectos de ingeniería de datos. Acá vas a encontrar soluciones prácticas para extraer, procesar y analizar datos. Cada carpeta es un proyecto independiente, pensado para tareas comunes de data engineering, machine learning y web scraping.

Proyectos incluidos

1. Reconocimiento de Lengua de Señas

Este proyecto utiliza técnicas de visión por computadora y aprendizaje profundo para reconocer letras de la Lengua de Señas Argentina (LSA) a partir de imágenes. Incluye notebooks interactivos para tomar fotos, preprocesar imágenes (recortes y remoción de fondo), entrenar modelos y realizar predicciones.

Captura de imágenes desde webcam o uso de datasets pre-procesados.
Remoción automática del fondo usando redes neuronales.
Entrenamiento y evaluación de modelos con Keras y Python.
Ideal para aprender sobre IA aplicada a problemas reales y accesibilidad.

2. Web Scraping / Website Scanner

Herramienta para extraer datos del HTML de distintos sitios web, con soporte para login, navegadores headless (Selenium, Playwright) y spiders preconfigurados para sitios populares. Ideal para automatizar la recopilación de info pública.

Funciona con HTML y SSR.
Docker listo para levantar en cualquier máquina.
Configuración fácil vía YAML.

3. FDD Scanner / Franchisee Contacts

Automatiza la extracción de contactos de franquiciados desde PDFs. Incluye scripts para procesar, limpiar y exportar datos, más análisis de logs y combinación de resultados.

Procesa PDFs en lote.
Exporta resultados a CSV.
Consolida y analiza logs.

4. FDD Scanner / Extract Surface Area

Herramienta para extraer valores de superficie de PDFs de franquicias, usando regex configurables. Útil para métricas inmobiliarias o comerciales.

Extracción automática vía regex.
Configurable para distintos formatos.

5. Manage Files / Watermark and Frontpage

Script para agregar marcas de agua y páginas de portada a PDFs en lote. Ideal para documentos oficiales o presentaciones.

Marca de agua en cada hoja.
Página principal personalizada.
Procesamiento masivo.

Cada proyecto trae archivos de configuración y scripts en Python. Recomendado Python 3.10+, y algunos tienen Docker para facilitar todo.

¿Querés más detalles de algún proyecto? Mirá la documentación específica en cada carpeta o contactame.

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
Data Analysis/IMDB_Challenge		Data Analysis/IMDB_Challenge
Data Engineering		Data Engineering
.gitignore		.gitignore
README.md		README.md
Reconocimiento_de_Leng_de_Señas.ipynb		Reconocimiento_de_Leng_de_Señas.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Data Projects

Proyectos incluidos

1. Reconocimiento de Lengua de Señas

2. Web Scraping / Website Scanner

3. FDD Scanner / Franchisee Contacts

4. FDD Scanner / Extract Surface Area

5. Manage Files / Watermark and Frontpage

About

Uh oh!

Releases

Packages

Uh oh!

Languages

fedecarboni7/data-projects

Folders and files

Latest commit

History

Repository files navigation

Data Projects

Proyectos incluidos

1. Reconocimiento de Lengua de Señas

2. Web Scraping / Website Scanner

3. FDD Scanner / Franchisee Contacts

4. FDD Scanner / Extract Surface Area

5. Manage Files / Watermark and Frontpage

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages