1. Aggressive Limit Fill Model
Începând cu ses.168 (Mai 2026), prețul de intrare folosit pentru calculul P&L nu mai este mid-point-ul zonei. Este preţul real de fill al unui limit order plasat la marginea cea mai prudentă a zonei, cu bonus dacă lumânarea de activare a deschis printr-un gap.
LONG:
fillPrice = min(activationCandle.open, entryMax)SHORT:
fillPrice = max(activationCandle.open, entryMin)În cuvinte: pentru LONG, dacă piaţa se deschide sub entryMax (gap-down), limit-ul nostru fill-ează la deschiderea reală — beneficiu pentru utilizator. Dacă deschiderea este peste entryMax, fill-ul se face la worst-edge (entryMax) — scenariul cel mai conservator. Simetric pentru SHORT cu entryMin.
Fără cherry-picking: toate semnalele care au atins zona de intrare sunt incluse, inclusiv cele care au lovit stop-loss imediat după fill. Semnalele neactivate (PENDING expirate) sunt marcate EXPIRED şi excluse din metricele de win-rate, dar rămân vizibile în lista publică.
Backfill din Mai 2026 a recalculat 26 de semnale închise. Avg result a coborât de la 1.099% (mid-fill) la 0.93% (aggressive limit) — o ajustare matematic onestă, nu o degradare a metodei.
2. Sharpe Ratio cu Deflated Adjustment (DSR)
Sharpe Ratio raw este uşor de inflatat prin multi-trial bias: dacă testezi 100 strategii şi păstrezi best-of-100, Sharpe-ul observat este garantat supra-estimat. Folosim Deflated Sharpe Ratio peste un cadru Combinatorial Purged Cross-Validation.
CPCV — Combinatorial Purged Cross-Validation
Splituri combinatoriale ale istoricului de semnale, cu purge zone între train/test pentru a elimina data leakage de la suprapunerile temporale ale semnalelor (ex. două semnale BTC cu zone de intrare suprapuse într-un interval de 4h).
DSR — Deflated Sharpe Ratio
Penalizează Sharpe-ul observat în funcţie de numărul de încercări (N_TRIALS), skewness şi kurtosis ale return-urilor. Rezultatul este probabilitatea ca Sharpe-ul real să fie peste pragul minim setat — nu doar valoarea raw.
Numărul de trial-uri folosit pentru deflation este configurabil prin variabila de mediu DSR_N_TRIALS (default 10), pentru a evita over-deflation atunci când backtesting-ul are intenţionat puţine ipoteze independente.
Implementat în lib/engine/cpcvDsr.ts (ses.172 M100-02). Foundation pentru CRPS leaderboard şi viitor walk-forward dashboard.
3. CRPS Forecast Scoring
Pentru forecast-urile macro / geopolitice (output: distribuţie continuă cu quantile p10/p50/p90), evaluăm calitatea prin Continuous Ranked Probability Score — un proper scoring rule care penalizează atât bias-ul, cât şi over/under-confidence.
CRPS(F, x) = ∫ (F(y) − 𝟙{y ≥ x})² dyunde F este CDF prezis şi x este realizarea observată.
Validare quantile (post-ses.175)
Quantilele trebuie să respecte ordinea naturală p10 ≤ p50 ≤ p90. Începând cu ses.175, un guard cu auto-repair detectează crossing-ul (rar, dar posibil când personas-urile divergesc) şi reordonează quantile-le înainte de scoring, cu logging pentru audit.
Per-category rolling aggregation
CRPS-ul nu e un scor global — îl agregăm pe categorie (rates, conflict, election, energy, etc.) pe ferestre rolling de 30/90 zile. Leaderboard-ul intern arată mean / median / p90 / număr eşantioane per categorie; valorile sub 0.15 sunt considerate excelente, 0.15–0.30 acceptabile, peste 0.30 problematice.
Implementat în lib/forecast/calibration/crps.ts + crpsRolling.ts (ses.172 N-05).
4. Persona Divergence Labels
Multi-LLM Council foloseşte 4 voci independente (Claude, GPT-4o, Gemini, Grok). Pentru fiecare ciclu de scoring, măsurăm cât de aliniate sunt cele 4 verdicte prin standard deviation şi entropy peste scoruri.
- CONSENSUS — stdev mic + entropy mică. Cele 4 voci converg spre acelaşi verdict. Confidence ridicată.
- MIXED — stdev moderat. Voci aliniate pe direcţie, dar cu magnitudini diferite.
- CHAOS — stdev mare + entropy mare. Vocile sunt fundamental dezacordate. Tratat cu confidence redusă şi routing diferit la sinteză.
Influenţă asupra sistemului
- Synthesis routing (POST-01): CONSENSUS → Haiku 4.5 (cost redus), MIXED → Sonnet 4.6, CHAOS → Opus 4.6 (capacitate maximă pentru arbitraj).
- Cache TTL (POST-12): rezultatele CONSENSUS pot fi cache-uite mai agresiv; CHAOS forţează re-evaluare la următorul ciclu.
- Confidence dampening: CHAOS aplică un penalty informativ pe scorul final, semnalând că modelele nu „ştiu" cu certitudine.
Implementat în lib/multiLLM/personaDivergence.ts (ses.172 N-06). Eticheta este persistată pe fiecare semnal în câmpul SignalSnapshot.divergenceAdj şi vizibilă pe pagina AI Council.
Past performance nu garantează rezultate viitoare. Toate metricele sunt calculate din semnale închise istoric şi sunt informative, nu prescriptive. Trading-ul de criptomonede implică risc semnificativ de pierdere.