Framework de Auditoría Estadística, Simulación de Escenarios y Modelado de IA para la Lotería Peruana.
Tinka Analytics no es un generador de números de la suerte. Es un proyecto integral de Ciencia de Datos diseñado para auditar la integridad y aleatoriedad del sistema de lotería "La Tinka" (Era Moderna: 50 bolillas).
El objetivo principal es demostrar cómo técnicas avanzadas de Estadística Inferencial, Machine Learning y Simulación de Monte Carlo pueden ser aplicadas para analizar sistemas caóticos y tomar decisiones basadas en riesgos financieros.
El proyecto se divide en 4 fases de madurez analítica:
- Análisis de Frecuencias: Identificación de sesgos en la rotación de bolillas.
- Distribución de Sumas: Validación del Teorema del Límite Central (Campana de Gauss).
- Heatmaps Temporales: Análisis de estabilidad del sistema a través del tiempo.
-
Prueba Chi-Cuadrado (
$\chi^2$ ): Validación matemática de la uniformidad del azar. - Z-Score Gap Analysis: Medición de la "presión" estadística de números rezagados.
- Runs Test: Prueba de rachas para detectar autocorrelación o falta de independencia.
- XGBoost Classifier: Entrenamiento de un modelo de ensamble para detectar patrones no lineales.
- LSTM (Deep Learning): Arquitectura de red neuronal recurrente para análisis de series temporales.
- Inferencia Bayesiana: Actualización de probabilidades basada en evidencia histórica reciente.
- Monte Carlo (10 000 Sorteos): Simulación masiva vectorizada con NumPy para calcular el ROI real.
- Criterio de Kelly: Algoritmo de optimización de apuestas para evitar la ruina del capital.
- A/B Testing Simulado: Comparación de estrategias de selección (Calientes vs. Aleatorios).
- FastAPI Ready: Estructura lista para despliegue de modelos vía API.
- Lenguaje: Python 🐍
- Dashboard: Streamlit (UI/UX interactiva).
- Análisis de Datos: Pandas, NumPy.
- Visualización: Plotly (Gráficas interactivas y dinámicas).
- Ciencia & Modelos: SciPy, Scikit-learn, XGBoost.
- API: FastAPI.
-
Clonar el repositorio:
git clone [https://github.com/juanchocce/Tinka-Analytics-Decoding-Patterns.git](https://github.com/juanchocce/Tinka-Analytics-Decoding-Patterns.git) cd Tinka-Analytics-Decoding-Patterns -
Crear y activar entorno virtual:
python -m venv .venv
# Windows
.\.venv\Scripts\activate
# Linux/Mac
source .venv/bin/activate
- Instalar dependencias:
pip install -r requirements.txt
- Ejecutar la aplicación:
streamlit run app.py
Este proyecto adopta una postura ética y científica. A través de la Simulación de Monte Carlo, se demuestra gráficamente que, aunque el Machine Learning puede encontrar patrones mínimos, la esperanza matemática del sistema es negativa. Esto sirve como una herramienta educativa sobre la gestión de riesgos y la falacia del jugador.
Juan Chocce
- Systems Engineer & Data Science Enthusiast 🚀
- LinkedIn | Portfolio Website
“La Ciencia de Datos no se trata de predecir el futuro con una bola de cristal, sino de iluminar el camino con la linterna de la estadística para tomar mejores decisiones bajo incertidumbre.”