class DataEngineer:
def __init__(self):
self.name = "Karl Sondeji"
self.role = "Junior Data Engineer"
self.skills = {
"languages": ["Python", "SQL"],
"data_processing": ["Pandas", "PySpark"],
"databases": ["PostgreSQL", "MySQL"],
"tools": ["Git", "Docker"]
}
self.specialties = [
"ETL Pipelines",
"Data Processing",
"Data Modeling"
]
self.currently_learning = [
"Apache Airflow",
"Kubernetes",
"Cloud (AWS/Azure)"
]
self.goal = "Building scalable and efficient data pipelines"
def say_hi(self):
return "Thanks for visiting my profile 👋🏾"
me = DataEngineer()
print(me.say_hi())Api-client • Data security • docker-compose • Virtual machine • HTTPS server
Création d'une mini-application volontairement vulnérable afin de passer en revue différents fondamentaux sur la sécurité des données lorsque l'on crée des API web.
Orchestration framework • Data processing • medallion architecture • star schema • Power BI
This project aims to set up an orchestrated ETL pipeline to evaluate the daily performance of turbines.
Data science • Prediction model • Python • Machine learning • Streamlit • API interractive
Application Streamlit qui prédit le churn client dans un contexte de Télécoms avec 89% de précision et génère des recommandations de rétention personnalisées.
Data science • Prediction model • R • Machine learning • Quarto
Analyse de données sur les campagnes de marketing d'une institution bancaire portugaise. L'objectif est de prédire si un client souscrira à un dépôt à terme en utilisant diverses techniques d'apprentissage automatique.
🎓 Master's Data Engineering & Cloud Computing
AIVANCITY, Paris, France (2025-2026)
🎓 Master's Data Sciene & Econometrics
Université de Tours, France (2023-2025)
🎓 Bachelor's in Economics
Université de Tours, France (2020-2023)

