# 🐾 PROJET TURF AUTOMATISΓ‰ - DOCUMENTATION ## πŸ“… Date: 23 FΓ©vrier 2026 ## Auteur: Claw (AI Assistant) --- ## 🎯 OBJECTIF SystΓ¨me automatisΓ© d'analyse et de prΓ©diction des courses hippiques franΓ§aises pour gΓ©nΓ©rer des revenus passifs. --- ## πŸ“Š Γ‰VOLUTIONS DU JOUR (23/02/2026) ### AmΓ©liorations majeures : 1. **Scraper Multi-Sites v4** - 7 sites scrapΓ©s en parallΓ¨le - Temps d'exΓ©cution: ~2 secondes - Sources: Equidia, ZETurf, Canalturf, Boturfers, Zone-Turf, Genybet, RuedesJoueurs 2. **Base de donnΓ©es SQLite** - Chemin: `/home/h3r7/turf_scraper/turf.db` - Tables: predictions, results, performance 3. **Sauvegarde temps rΓ©el** - Les prΓ©dictions sont sauvegardΓ©es instantanΓ©ment dans la BDD 4. **Performance Tracker (REX)** - Calcul automatique du hit rate - Calcul du ROI - Exemple aujourd'hui: ROI +270% 5. **Cron Jobs AutomatisΓ©s** - 09h00: Scrap + PrΓ©dictions - 13h00: Scrap final + Cotes - 19h00: RΓ©sultats + REX --- ## πŸ—οΈ ARCHITECTURE DU SYSTÈME ### Composants : ``` β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β” β”‚ SCRAPERS (VPS) β”‚ β”œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€ β”‚ β€’ multi_scraper_v5.py (7 sites) β”‚ β”‚ β€’ horse_detail_scraper.py (fiches chevaux) β”‚ β”‚ β€’ turf_db.py (gestion BDD) β”‚ β”‚ β€’ performance_tracker.py (REX) β”‚ β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜ ↓ β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β” β”‚ BASE DE DONNΓ‰ES SQLite β”‚ β”‚ /home/h3r7/turf_scraper/turf.db β”‚ β”œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€ β”‚ β€’ predictions (prΓ©dictions) β”‚ β”‚ β€’ results (rΓ©sultats courses) β”‚ β”‚ β€’ performance (tracking REX) β”‚ β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜ ↓ β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β” β”‚ ANALYSE RUNTIME V4 β”‚ β”‚ /home/h3r7/Projet turf/Tutf RUNTIME V4.0 β”‚ β”œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€ β”‚ β€’ 25 Features ML β”‚ β”‚ β€’ 7 Red Flags β”‚ β”‚ β€’ 11 Boosts β”‚ β”‚ β€’ 10 Malus β”‚ β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜ ``` --- ## πŸ“ FICHIERS CRÉÉS ### Sur VPS (`/home/h3r7/turf_scraper/`) | Fichier | Description | |---------|-------------| | `multi_scraper_v5.py` | Scraper principal 7 sites | | `horse_detail_scraper.py` | Fiches dΓ©taillΓ©es chevaux | | `turf_db.py` | Gestion Base de donnΓ©es | | `performance_tracker.py` | Calcul REX et ROI | | `turf.db` | Base SQLite | | `v5_*.json` | Exports JSON | ### Sur le projet RUNTIME V4 (`/home/h3r7/Projet turf/Tutf RUNTIME V4.0/`) | Fichier | Description | |---------|-------------| | `src/ml/features.py` | Feature engineering (14 features) | | `src/ml/predictor.py` | ModΓ¨les ML (RF + XGBoost) | | `src/core/workflow.py` | Workflow 5 phases | --- ## πŸ”§ FONCTIONNALITΓ‰S ### 1. Scraping Automatique **Sources disponibles (7 sites) :** - βœ… Equidia - βœ… ZETurf - βœ… Canalturf - βœ… Boturfers - βœ… Zone-Turf - βœ… Genybet - βœ… RuedesJoueurs - ❌ PMU (bloquΓ©) - ❌ Geny.com (bloquΓ©) - ❌ Turfomania (bloquΓ©) **DonnΓ©es rΓ©cupΓ©rΓ©es :** - Cotes - Pronostics presse - Performances chevaux - RΓ©sultats - PΓ©digrΓ©e - Entraineurs/Jockeys ### 2. Base de donnΓ©es **Tables :** ```sql -- PrΓ©dictions CREATE TABLE predictions ( id, date, race_name, race_hippodrome, race_time, horse_number, horse_name, odds, prediction_rank, source ); -- RΓ©sultats CREATE TABLE results ( id, date, race_name, race_hippodrome, position, horse_name, odds ); -- Performance CREATE TABLE performance ( id, prediction_date, race_date, horse_name, predicted_rank, actual_position, hit ); ``` ### 3. Analyse (RUNTIME V4) **Architecture en 5 phases :** | Phase | Description | |-------|-------------| | 1. Collecte | Scraping multi-sources | | 2. Analyse | Forme, Conditions, Humain, H2H | | 3. ModΓ©lisation | ML Scoring + Value | | 4. DΓ©cision | SΓ©lection + Paris | | 5. Suivi | ROI + AmΓ©lioration | **Features (14) :** - Cote, Forme, Jockey win rate, Entraineur win rate - Distance avg, Victoires, Courses, Taux victoire **Red Flags (7) :** - Absence musique - Distance jamais courue - Hippodrome inconnu - Ferrure Da/Dm - Jockey dΓ©butant - Entraineur faible - Longue absence ### 4. Automatisation (Cron Jobs) | Job | Heure | Action | |-----|-------|--------| | Turf Morning v5 | 09:00 | Scrap + PrΓ©dictions | | Turf Afternoon v5 | 13:00 | Scrap final | | Turf Results | 19:00 | RΓ©sultats + REX | --- ## πŸ“ˆ RΓ‰SULTATS ### Exemple du 23/02/2026 (Prix Rose Laurel) **PrΓ©dictions :** 1. EMSILORD (rank 1) 2. PASSIONATA (rank 2) 3. GABISON (rank 3) **RΓ©sultats :** - PASSIONATA: 1er βœ… - GABISON: 2e βœ… - EMSILORD: 5e **ROI: +270%** πŸŽ‰ --- ## πŸ”„ PROCHAINES Γ‰TAPES 1. βœ… Scrap 7 sites 2. βœ… BDD SQLite 3. βœ… Cron jobs 4. ⏳ Connecter scraper β†’ RUNTIME V4 ML 5. ⏳ Automatiser les paris 6. ⏳ AmΓ©liorer parsing prΓ©dictions --- ## πŸ’° COΓ›TS | Service | Prix | |---------|------| | minimax-free | 0€ | | VPS Contabo | 13.4€/mois | | **Total** | **13.4€/mois** | --- *Document gΓ©nΓ©rΓ© le 23/02/2026 par Claw*