Documentation Index
Fetch the complete documentation index at: https://docs.coalesc.ai/llms.txt
Use this file to discover all available pages before exploring further.
Le cycle d’un document
Quand un document arrive dans Coalesc (par courriel, portail client ou upload manuel), il passe par plusieurs étapes automatiques.Réception
Le document est reçu et stocké de manière sécurisée. La source est identifiée (courriel, portail client, upload manuel, triage).
Extraction
Le contenu du document est lu. Pour les PDF avec du texte, la lecture est directe. Pour les documents scannés ou les photos, un OCR (reconnaissance optique de caractères) est appliqué.
Classification
Le système identifie le type de document (T4, relevé bancaire, facture, etc.) en analysant le contenu extrait. La classification fonctionne en français et en anglais, et reconnaît 71 types de documents.
Association
Le document est associé au bon client et au bon mandat. Si le client est reconnu (par son adresse courriel), le document est automatiquement ajouté à son dossier actif.
Trois couches d’extraction
Coalesc utilise trois niveaux d’extraction pour traiter tous les types de documents:| Couche | Technologie | Utilisée quand |
|---|---|---|
| 1. Texte direct | PyMuPDF | PDF avec texte intégré (la majorité des feuillets fiscaux et relevés bancaires) |
| 2. OCR | Mistral OCR | Documents scannés, photos, PDF sans texte |
| 3. Vision | Gemini Vision | Documents complexes, formulaires manuscrits, documents à angles |
Gestion des PDF multiples
Un des problèmes les plus courants: le client envoie un seul PDF contenant plusieurs documents (T4 + RL-1 + relevé bancaire dans le même fichier). Coalesc détecte automatiquement les documents bundlés et les sépare:- Le PDF est analysé page par page
- Chaque page est classifiée individuellement
- Les pages du même type sont regroupées
- Chaque groupe devient un document séparé dans le dossier
Détection des doublons
Si un client envoie le même document deux fois (par courriel et par le portail, par exemple), Coalesc détecte le doublon et ne le compte qu’une seule fois dans la checklist.Extraction de données
Pour certains types de documents, Coalesc extrait les données structurées:Relevés bancaires
Les transactions sont extraites ligne par ligne avec:- Date de la transaction
- Description
- Montant (débit/crédit)
- Catégorisation selon la charte de compte de la firme
Feuillets fiscaux
Les montants clés sont extraits (revenus, retenues, cotisations) pour validation rapide.Relances automatiques
Quand des documents manquent à la checklist, Coalesc peut envoyer des rappels automatiques au client:- Premier rappel: selon le délai configuré après la demande initiale
- Deuxième rappel: si le client n’a toujours pas répondu
- Rappel final: dernier avis avant l’échéance
Mémoire par client
Coalesc apprend les préférences de chaque client au fil du temps:- Si vous marquez un document comme optionnel pour un client, il restera optionnel l’année prochaine
- Si vous ajoutez un document spécifique à la checklist d’un client, il sera automatiquement inclus au prochain mandat du même type
- Les personnalisations sont copiées d’un mandat à l’autre pour le même client
La mémoire fonctionne par client ET par type de mandat. Un client peut avoir des checklists différentes pour son T1 et sa tenue de livres.