PDF OCR

Wandeln Sie gescannte PDF-Seiten in bearbeitbaren, durchsuchbaren Text um — extrahieren Sie Text aus jedem gescannten Dokument, reinen Bild-PDFs oder einem Foto einer Seite. Läuft lokal in Ihrem Browser.

Die OCR-Genauigkeit hängt von der Bildqualität ab. Für beste Ergebnisse verwenden Sie klare Scans mit 300 DPI oder mehr. Handschrift und stilisierte Schriftarten können eine geringere Genauigkeit aufweisen.

Gescannte PDF hierher ziehen oder zum Durchsuchen klicken

PDF-Datei auswählen

Maximale Dateigröße: 128 MB

Die gesamte Verarbeitung erfolgt lokal in Ihrem Browser. Ihre Datei wird niemals hochgeladen.

PDF OCR — Text aus gescannten PDFs extrahieren, kostenlos & privat

PDF OCR verwandelt gescannte Dokumente, reine Bild-PDFs und Fotos von Seiten in bearbeitbaren, durchsuchbaren Text — direkt in Ihrem Browser. Wählen Sie Klartext, ein durchsuchbares PDF mit versteckter Textebene oder beides. Kein Hochladen, keine Registrierung, und das OCR-Modell wird lokal zwischengespeichert, sodass es beim zweiten Aufruf sofort geladen wird.

100% KostenlosKein UploadKeine RegistrierungKein Upload

Anleitung

  1. Hochladen: Ziehen Sie Ihre gescannte PDF hierher oder klicken Sie zum Durchsuchen.
  2. Konfigurieren: Wählen Sie die Erkennungssprache, das Ausgabeformat (Text / durchsuchbares PDF / ZIP) und beschränken Sie optional auf bestimmte Seiten.
  3. OCR starten: Klicken Sie auf OCR starten — das Modell wird einmal heruntergeladen, danach wird jede Seite lokal in Ihrem Browser gerendert und erkannt.
  4. Herunterladen: Speichern Sie die .txt-, die durchsuchbare .pdf-Datei oder das ZIP-Paket mit dem erkannten Text jeder Seite.

Warum Dieses Tool Wählen

  • 100% Lokale Verarbeitung: Dateien werden vollständig in Ihrem Browser mit JavaScript verarbeitet — nie auf einen Server hochgeladen.
  • Keine Grenzen: Keine Beschränkungen bei Dateianzahl oder Dateigröße. Verarbeiten Sie so viele Dateien, wie Ihr Gerät bewältigen kann.
  • Keine Registrierung: Für immer kostenlos, kein Konto erforderlich, keine E-Mail nötig. Seite öffnen und loslegen.
  • Privatsphäre by Design: Es wird nichts an einen Server gesendet. Schließen Sie den Tab und Ihre Dateien sind für immer weg.

Vergleich

FeatureOursSmallPDFiLovePDFAdobe
Läuft vollständig im BrowserJa — kein Upload, kein ServerNeinNeinNein
Mehrsprachige OCRJa — 6 Sprachen, weitere folgenEingeschränkt (nur Englisch in Free)Eingeschränkt (nur Englisch)Ja (kostenpflichtig)
Durchsuchbare PDF-AusgabeJa — Bild + unsichtbare TextebeneKostenpflichtigKostenpflichtigJa
Klartext-AusgabeJa — kostenlosJaJaJa
Offline nach erstem LadenJa — Modell in IndexedDB zwischengespeichertNeinNeinTeilweise
KostenKostenlos, unbegrenztFree-Plan (2 Aufgaben/Tag)Free-Plan (eingeschränkt)19,99 $/Monat

Häufige Fragen

Wird meine PDF auf einen Server hochgeladen?

Nein. Die gesamte OCR-Pipeline läuft lokal in Ihrem Browser mit WebAssembly und Tesseract.js. Ihre Datei verlässt Ihr Gerät nie und das OCR-Modell wird nach dem ersten Download in IndexedDB zwischengespeichert — Sie können die Internetverbindung trennen, sobald die Seite geladen ist, und das Tool funktioniert weiterhin vollständig offline.

Wie genau ist die OCR?

Die Genauigkeit hängt von der Qualität des Eingabescans ab. Für beste Ergebnisse verwenden Sie klare Scans mit 300 DPI oder mehr. In Standard-Schriftarten gedruckter Text wird in der Regel zu 95 % oder mehr erkannt; stilisierte Schriftarten, Handschrift, Scans mit niedriger Auflösung und verrauschte Hintergründe verringern die Genauigkeit. Sie können das Ergebnis vor der Verwendung jederzeit prüfen und korrigieren.

Welche Sprachen werden unterstützt?

Sechs gängige Sprachen sind verfügbar: Englisch, vereinfachtes Chinesisch, traditionelles Chinesisch, Französisch, Deutsch und Spanisch. Jedes Sprachmodell ist ~10-15 MB groß und wird nur beim ersten Aufruf heruntergeladen; nachfolgende Aufrufe laden in Sekunden aus dem lokalen Cache.

Was ist ein durchsuchbares PDF?

Ein durchsuchbares PDF behält das visuelle Erscheinungsbild der ursprünglichen gescannten Seiten (als Seitenbilder gerendert) und fügt darüber eine unsichtbare Textebene hinzu. Sie können den Text in jedem PDF-Reader suchen, kopieren und auswählen, während das Dokument optisch weiterhin genau wie das gescannte Original aussieht. Es ist ein Standard-PDF — zum Öffnen ist keine Spezialsoftware erforderlich.

Warum ist das OCR-Modell so groß?

Tesseract-OCR-Modelle sind neuronale Netze, die darauf trainiert sind, Zeichen in vielen Schriftarten und Stilen zu erkennen. Das englische Modell ist ~12 MB groß; die chinesischen Modelle ~15 MB. Wir laden das Modell nur für die von Ihnen gewählte Sprache herunter und speichern es lokal zwischen, sodass die Kosten einmalig anfallen, nicht bei jedem Besuch.

Was, wenn meine PDF passwortgeschützt ist?

Sie werden nach dem Passwort gefragt. Die Entschlüsselung erfolgt lokal in Ihrem Browser und das Passwort wird nie an einen Server gesendet. Nach dem Entsperren läuft die OCR normal auf den entschlüsselten Seiten weiter.

Warum stimmt der erkannte Text nicht exakt mit dem Original-Layout überein?

OCR stellt den Textinhalt wieder her, behält jedoch nicht das exakte visuelle Layout, die Schriftarten oder den Stil des Originaldokuments bei. Für die meisten Anwendungsfälle (Suchen, Kopieren, Bearbeiten oder Einspeisen in ein anderes Tool) ist dies der richtige Kompromiss. Wenn Sie pixelgenaues Layout benötigen, konvertieren Sie die PDF stattdessen mit einem dedizierten Layout-erhaltenden Tool in ein Word-Dokument.

Ist das Tool wirklich kostenlos?

Ja. Es fallen keine Gebühren an, keine Registrierung, kein Wasserzeichen und keine Begrenzung der Seitenzahl. Das Tool wird durch nicht-intrusive Werbung auf den umliegenden Seiten finanziert.