Klasyfikacja jakości wina — porównanie modeli

Krótki opis

Zbiór: Wine Quality (data/WineQT.csv) — klasyfikacja wieloklasowa etykiety quality (np. oceny 3–8).
Modele: DecisionTree, kNN, RandomForest — po 3 warianty hiperparametrów (łącznie 9 klasyfikatorów).
Zespół: VotingClassifier z majority voting (voting="hard") nad tymi samymi 9 pipeline’ami (MinMaxScaler + klasyfikator).
Bez przecieku: MinMaxScaler w Pipeline / ColumnTransformer, dopasowanie wyłącznie na treningu każdej foldy.
Walidacja: stratyfikowana 5-fold CV (StratifiedKFold, stały random_state).
Metryki: accuracy, balanced_accuracy.
Stack: scikit-learn, Pandas (groupby, to_latex), Plotly (wykresy), Streamlit (opis przebiegu badania, definicje pojęć, zgodność z wymaganiami, podgląd .tex).

Wymagania

Python 3.10+ (zalecane)
Instalacja: pip install -r requirements.txt

Eksperyment (zapis do `results/`)

Uruchamia walidację, zapisuje m.in. CSV, .tex, wersje_bibliotek.txt oraz wykresy HTML w results/wykresy/.

python run_experiment.py

Streamlit i skrypty startowe

Skrypty start.sh (Linux/macOS) oraz start.bat (Windows) wykonują po kolei:

venv + pip install -r requirements.txt
python run_experiment.py
streamlit run streamlit_app.py → zwykle http://localhost:8501

chmod +x start.sh
./start.sh

start.bat

Zakładki aplikacji

Zakładka	Treść
Opis projektu	Cel badania, przebieg eksperymentu (co → po co → efekt), słownik pojęć, zgodność z wymaganiami, podgląd plików LaTeX
Wymogi i metodologia	Tabela: wymaganie → realizacja w kodzie / plikach
Zbiór danych (EDA)	Rozkład klasy `quality`, macierz korelacji, podgląd danych
Wyniki klasyfikacji	Wykresy metryk z CV, tabele, podgląd i pobieranie wyników

Odtwarzalność

Seed: RANDOM_STATE w src/config.py; ten sam obiekt cv w cross_validate (Common pitfalls — scikit-learn).
Plik results/wersje_bibliotek.txt zapisuje wersje bibliotek użytych przy generowaniu wyników.

Struktura repozytorium

Ścieżka	Opis
`data/WineQT.csv`	Dane źródłowe
`src/config.py`	Ścieżki, seed
`src/experiment.py`	Pipeline, CV, zespół, eksport CSV/LaTeX, wywołanie wykresów
`src/wykresy.py`	Wykresy Plotly + zapis HTML
`run_experiment.py`	Wejście z linii poleceń
`streamlit_app.py`	Aplikacja WWW
`start.sh` / `start.bat`	Eksperyment + Streamlit
`results/`	Wyniki wygenerowane (CSV, TeX, `wykresy/*.html`, `wersje_bibliotek.txt`)

`.gitignore`

Ignorowane są m.in. .venv/, cache Pythona, pliki IDE. Wygenerowane pliki w results/ można opcjonalnie dodać do ignorowania — w .gitignore jest gotowy, zakomentowany blok instrukcji.

Licencja

Zobacz plik LICENSE.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Klasyfikacja jakości wina — porównanie modeli

Krótki opis

Wymagania

Eksperyment (zapis do `results/`)

Streamlit i skrypty startowe

Zakładki aplikacji

Odtwarzalność

Struktura repozytorium

`.gitignore`

Licencja

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
data		data
results		results
src		src
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt
run_experiment.py		run_experiment.py
start.bat		start.bat
start.sh		start.sh
streamlit_app.py		streamlit_app.py

Folders and files

Latest commit

History

Repository files navigation

Klasyfikacja jakości wina — porównanie modeli

Krótki opis

Wymagania

Eksperyment (zapis do results/)

Streamlit i skrypty startowe

Zakładki aplikacji

Odtwarzalność

Struktura repozytorium

.gitignore

Licencja

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Eksperyment (zapis do `results/`)

`.gitignore`

Packages