import json
m=json.load(open('results/fulltest_finetune.json'))   # raw_13d arm is shared across runs
r=m['arms']['raw_13d']; t=m['test']
print(f"raw 13-feature XGBoost — full test ({t['rows']:,} rows, {t['fraud']:,} fraud, {t['rate']:.3%})")
print(f"  AUPRC {r['auprc_mean']:.3f} ± {r['auprc_std']:.3f}  ({r['auprc_mean']/t['rate']:.0f}x random, mean over {m['seeds']} seeds)   F1 {r['f1_mean']:.3f} ± {r['f1_std']:.3f}")

raw 13-feature XGBoost — full test (2,412,326 rows, 2,698 fraud, 0.112%)
  AUPRC 0.176 ± 0.034  (157x random, mean over 4 seeds)   F1 0.301 ± 0.041

NeoLDM · 01 — Raw-feature baseline¶

Setup¶