rubis

History

Build & Deploy API / build-and-deploy (push) Successful in 1m19s

Details

feat(ocr): retry exponential backoff sur 429 dans ocr:validate

La free tier Mistral a un rate limit non-linéaire (parfois 4-5 req/min
acceptées, parfois 1 req/2min selon la charge). Un délai fixe entre
calls ne suffit pas — on retry max 3× avec backoff 30s, 60s, 90s.

Combiné avec --delay-ms (espacement nominal entre calls), ça permet
de tenir tout un bench même si le quota se serre en cours de route.

Bench réel observé sur 10 factures variées (templates Boulangerie,
Mercier moderne, Mercier ancien, retards 5j/30j/90j/180j) :

  - amountTtcCents : 10/10 (100 %)  ← précision financière parfaite
  - clientEmail    : 10/10 (100 %)
  - numero         :  9/10 (90 %)   ← 1 hallucination "FOUT"
  - issueDate      :  9/10 (90 %)   ← même facture, 1970-01-01 fallback
  - dueDate        :  9/10 (90 %)   ← idem
  - clientName     :  8/10 (80 %)   ← 2 fails : Mistral inclut contact
  - Latence moy.   : 9.5 s/facture (avec delay 7s)
  - 8/10 factures 100 % match (80 %)
  - 91.7 % accuracy globale champs

Insights actionnables :
  - amountTtcCents et clientEmail sont fiables → ok pour auto-validate
  - clientName : ajouter au prompt "ne pas inclure le contact (M./Mme)"
  - 1 facture sur 10 fait halluciner Mistral (FOUT + dates 1970) →
    afficher "à vérifier" dans la UI quand confidence < 0.5 sur dates

Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>

2026-05-18 16:17:56 +02:00

app

test(e2e): tests Playwright multi-stack — vrai navigateur, DB isolée, Stripe mocké

2026-05-18 14:58:51 +02:00

bin

feat(observability): Sentry monitoring API + Web (ADR-024)

2026-05-08 13:38:12 +02:00

commands

feat(ocr): retry exponential backoff sur 429 dans ocr:validate

2026-05-18 16:17:56 +02:00

config

test(e2e): tests Playwright multi-stack — vrai navigateur, DB isolée, Stripe mocké