Skip to content

juanchocce/Tinka-Analytics-Decoding-Patterns

Repository files navigation

💸 Tinka Analytics: Decoding Randomness 📊

Framework de Auditoría Estadística, Simulación de Escenarios y Modelado de IA para la Lotería Peruana.

Python Streamlit Machine Learning License: MIT


1

🎯 El Proyecto

Tinka Analytics no es un generador de números de la suerte. Es un proyecto integral de Ciencia de Datos diseñado para auditar la integridad y aleatoriedad del sistema de lotería "La Tinka" (Era Moderna: 50 bolillas).

El objetivo principal es demostrar cómo técnicas avanzadas de Estadística Inferencial, Machine Learning y Simulación de Monte Carlo pueden ser aplicadas para analizar sistemas caóticos y tomar decisiones basadas en riesgos financieros.


🚀 Características Principales (Roadmap de Ingeniería)

El proyecto se divide en 4 fases de madurez analítica:

1. 📊 Fase 1: Auditoría y EDA (Estadística Descriptiva)

  • Análisis de Frecuencias: Identificación de sesgos en la rotación de bolillas.
  • Distribución de Sumas: Validación del Teorema del Límite Central (Campana de Gauss).
  • Heatmaps Temporales: Análisis de estabilidad del sistema a través del tiempo.

2. 🧪 Fase 2: Inferencia y Azar (Estadística Inferencial)

  • Prueba Chi-Cuadrado ($\chi^2$): Validación matemática de la uniformidad del azar.
  • Z-Score Gap Analysis: Medición de la "presión" estadística de números rezagados.
  • Runs Test: Prueba de rachas para detectar autocorrelación o falta de independencia.

3. 🤖 Fase 3: Modelado de IA (Predictive Analytics)

  • XGBoost Classifier: Entrenamiento de un modelo de ensamble para detectar patrones no lineales.
  • LSTM (Deep Learning): Arquitectura de red neuronal recurrente para análisis de series temporales.
  • Inferencia Bayesiana: Actualización de probabilidades basada en evidencia histórica reciente.

4. 📈 Fase 4: Simulación y Negocio (Risk Management)

  • Monte Carlo (10 000 Sorteos): Simulación masiva vectorizada con NumPy para calcular el ROI real.
  • Criterio de Kelly: Algoritmo de optimización de apuestas para evitar la ruina del capital.
  • A/B Testing Simulado: Comparación de estrategias de selección (Calientes vs. Aleatorios).
  • FastAPI Ready: Estructura lista para despliegue de modelos vía API.

🛠️ Tech Stack

  • Lenguaje: Python 🐍
  • Dashboard: Streamlit (UI/UX interactiva).
  • Análisis de Datos: Pandas, NumPy.
  • Visualización: Plotly (Gráficas interactivas y dinámicas).
  • Ciencia & Modelos: SciPy, Scikit-learn, XGBoost.
  • API: FastAPI.

⚙️ Instalación y Uso

  1. Clonar el repositorio:

    git clone [https://github.com/juanchocce/Tinka-Analytics-Decoding-Patterns.git](https://github.com/juanchocce/Tinka-Analytics-Decoding-Patterns.git)
    cd Tinka-Analytics-Decoding-Patterns
  2. Crear y activar entorno virtual:

python -m venv .venv
# Windows
.\.venv\Scripts\activate
# Linux/Mac
source .venv/bin/activate
  1. Instalar dependencias:
pip install -r requirements.txt
  1. Ejecutar la aplicación:
streamlit run app.py

🧠 Filosofía del Proyecto: "Honestidad Brutal"

Este proyecto adopta una postura ética y científica. A través de la Simulación de Monte Carlo, se demuestra gráficamente que, aunque el Machine Learning puede encontrar patrones mínimos, la esperanza matemática del sistema es negativa. Esto sirve como una herramienta educativa sobre la gestión de riesgos y la falacia del jugador.


🙋‍♂️ Autor

Juan Chocce


“La Ciencia de Datos no se trata de predecir el futuro con una bola de cristal, sino de iluminar el camino con la linterna de la estadística para tomar mejores decisiones bajo incertidumbre.”

About

Proyecto que realiza un Análisis Exploratorio de Datos (EDA) y un estudio probabilístico avanzado de "La Tinka" (Perú). El objetivo es desmitificar el azar mediante la identificación de patrones de variabilidad, ciclos de latencia y anomalías estadísticas en los sorteos históricos.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors