OCR PDF
Convertissez les pages PDF scannées en texte éditable et consultable — extrayez le texte de tout document scanné, PDF en image seule ou photo d'une page. Fonctionne localement dans votre navigateur.
La précision de l'OCR dépend de la qualité de l'image. Pour de meilleurs résultats, utilisez des scans nets à 300 DPI ou plus. Le texte manuscrit et les polices stylisées peuvent avoir une précision inférieure.
Glissez-déposez un PDF scanné ici, ou cliquez pour parcourir
Sélectionner un fichier PDF
Taille maximale du fichier : 128 Mo
Tout le traitement se fait localement dans votre navigateur. Votre fichier n'est jamais téléchargé.
OCR PDF — Extraire le Texte des PDF Scannés, Gratuit et Privé
OCR PDF convertit les documents scannés, les PDF en image seule et les photos de pages en texte éditable et consultable — directement dans votre navigateur. Choisissez texte brut, PDF consultable avec couche de texte cachée, ou les deux. Pas de téléversement, pas d'inscription, et le modèle OCR est mis en cache localement pour se charger instantanément à la deuxième visite.
100% GratuitAucun TéléversementAucune InscriptionSans Téléversement
Comment Utiliser
- Téléversez: Glissez votre PDF scanné ou cliquez pour parcourir.
- Configurez: Choisissez la langue de reconnaissance, le format de sortie (texte / PDF consultable / ZIP) et limitez éventuellement à des pages spécifiques.
- Lancez l'OCR: Cliquez sur Démarrer l'OCR — le modèle se télécharge une fois, puis chaque page est rendue et reconnue localement dans votre navigateur.
- Téléchargez: Enregistrez le .txt, le .pdf consultable ou le paquet ZIP du texte reconnu de chaque page.
Pourquoi Choisir Cet Outil
- 100% Traitement Local: Les fichiers sont traités entièrement dans votre navigateur avec JavaScript — jamais téléversés sur un serveur.
- Aucune Limite: Aucune restriction de nombre ou de taille de fichier. Traitez autant de fichiers que votre appareil peut gérer.
- Aucune Inscription: Gratuit pour toujours, sans compte requis, sans e-mail. Ouvrez la page et commencez.
- Confidentialité par Conception: Rien n'est envoyé à aucun serveur. Fermez l'onglet et vos fichiers disparaîtront pour toujours.
Comparaison
| Feature | Ours | SmallPDF | iLovePDF | Adobe |
|---|---|---|---|---|
| S'exécute entièrement dans le navigateur | Oui — pas de téléversement, pas de serveur | Non | Non | Non |
| OCR multilingue | Oui — 6 langues, d'autres à venir | Limité (anglais uniquement en gratuit) | Limité (anglais uniquement) | Oui (payant) |
| Sortie PDF consultable | Oui — image + couche de texte invisible | Payant | Payant | Oui |
| Sortie texte brut | Oui — gratuit | Oui | Oui | Oui |
| Hors ligne après le premier chargement | Oui — modèle en cache dans IndexedDB | Non | Non | Partiel |
| Coût | Gratuit, illimité | Plan gratuit (2 tâches/jour) | Plan gratuit (limité) | 19,99 $/mois |
Questions Fréquentes
Mon PDF est-il téléversé sur un serveur ?
Non. L'ensemble du pipeline OCR s'exécute localement dans votre navigateur avec WebAssembly et Tesseract.js. Votre fichier ne quitte jamais votre appareil et le modèle OCR est mis en cache dans IndexedDB après le premier téléchargement : vous pouvez vous déconnecter d'Internet après le chargement de la page et l'outil fonctionnera toujours entièrement hors ligne.
Quelle est la précision de l'OCR ?
La précision dépend de la qualité du scan en entrée. Pour de meilleurs résultats, utilisez des scans nets à 300 DPI ou plus. Le texte tapé en polices standard est généralement reconnu à 95 % ou plus ; les polices stylisées, l'écriture manuscrite, les scans basse résolution et les arrière-plans bruités réduisent la précision. Vous pouvez toujours relire et corriger le résultat avant de l'utiliser.
Quelles langues sont prises en charge ?
Six langues courantes sont disponibles : anglais, chinois simplifié, chinois traditionnel, français, allemand et espagnol. Chaque modèle linguistique pèse ~10-15 Mo et n'est téléchargé que la première fois que vous l'utilisez ; les exécutions suivantes chargent depuis votre cache local en quelques secondes.
Qu'est-ce qu'un PDF consultable ?
Un PDF consultable conserve l'apparence visuelle des pages scannées originales (rendues sous forme d'images de page) et ajoute une couche de texte invisible par-dessus. Vous pouvez rechercher, copier et sélectionner le texte dans n'importe quel lecteur PDF, tandis que le document reste visuellement identique à l'original scanné. C'est un PDF standard — aucun logiciel spécial n'est nécessaire pour l'ouvrir.
Pourquoi le modèle OCR est-il si volumineux ?
Les modèles OCR de Tesseract sont des réseaux de neurones entraînés à reconnaître des caractères dans de nombreuses polices et styles. Le modèle anglais pèse ~12 Mo ; les modèles chinois, ~15 Mo. Nous ne téléchargeons le modèle que pour la langue que vous choisissez et nous le mettons en cache localement, donc le coût n'est payé qu'une seule fois, pas à chaque visite.
Que faire si mon PDF est protégé par mot de passe ?
Le mot de passe vous sera demandé. Le déchiffrement se fait localement dans votre navigateur et le mot de passe n'est jamais envoyé à aucun serveur. Après déverrouillage, l'OCR se poursuit normalement sur les pages déchiffrées.
Pourquoi le texte reconnu ne correspond-il pas exactement à la mise en page d'origine ?
L'OCR récupère le contenu textuel mais ne préserve pas la mise en page visuelle exacte, les polices ou le style du document original. Pour la plupart des usages (recherche, copie, édition ou alimentation d'un autre outil), c'est le bon compromis. Si vous avez besoin d'une mise en page au pixel près, convertissez le PDF en document Word avec un outil dédié qui préserve la mise en page.
L'outil est-il vraiment gratuit ?
Oui. Pas de frais, pas d'inscription, pas de filigrane, pas de limite du nombre de pages. L'outil est soutenu par une publicité non intrusive sur les pages environnantes.