PDF OCR 辨識

將掃描的 PDF 頁面轉換為可編輯、可搜尋的文字 — 從任何掃描文件、純影像 PDF 或頁面照片中擷取文字。整個過程在您的瀏覽器中本地執行。

OCR 準確率取決於影像品質。為獲得最佳效果,請使用 300 DPI 或更高的清晰掃描檔。手寫文字和藝術字體的辨識準確率可能較低。

將掃描的 PDF 拖到此處,或點擊選擇檔案

選擇 PDF 檔案

最大檔案大小:128 MB

所有處理在您的瀏覽器中本地完成。檔案永遠不會上傳。

PDF OCR 辨識 — 擷取掃描 PDF 中的文字,免費且私密

PDF OCR 辨識可將掃描文件、純影像 PDF、頁面照片轉換為可編輯、可搜尋的文字 — 全部在您的瀏覽器中本地執行。支援純文字輸出、加入隱藏文字層的可搜尋 PDF,或兩者一起的 ZIP 封包。無需上傳,無需註冊,OCR 模型會在本地快取,二次存取秒開。

100% 免費不上傳檔案無需註冊無上傳

Feature	Ours	SmallPDF	iLovePDF	Adobe
完全在瀏覽器中運作	是 — 無上傳,無伺服器	否	否	否
多語言 OCR	是 — 6 種語言,持續擴充中	有限(免費版僅英文)	有限(僅英文)	是(付費)
可搜尋 PDF 輸出	是 — 影像 + 不可見文字層	付費	付費	是
純文字輸出	是 — 免費	是	是	是
首次載入後可離線使用	是 — 模型快取在 IndexedDB	否	否	部分
費用	免費,無限次	免費版(每天 2 次)	免費版(有限)	$19.99/月

不會。整個 OCR 流程都使用 WebAssembly 和 Tesseract.js 在您瀏覽器中本地執行。您的檔案永遠不會離開裝置,OCR 模型會在首次下載後快取到 IndexedDB — 頁面載入完成後您可以中斷網路,工具仍可完全離線運作。

準確率取決於輸入掃描的品質。為獲得最佳效果,請使用 300 DPI 或更高的清晰掃描檔。標準字型列印的文字辨識率通常在 95% 以上;藝術字型、手寫、低解析度掃描、雜訊背景會降低準確率。您始終可以在使用前檢查並修正輸出。

支援六種常用語言:英文、簡體中文、繁體中文、法文、德文、西班牙文。每種語言模型約 10-15 MB,僅在您首次使用該語言時下載,之後會從本地快取中秒速載入。

可搜尋 PDF 保留原始掃描頁面的視覺外觀(以頁面影像形式),並在上面加入不可見的文字層。您可以在任何 PDF 閱讀器中搜尋、複製、選擇文字,同時文件看起來與掃描原件完全一致。這是標準 PDF,無需特殊軟體即可開啟。

Tesseract OCR 模型是經過訓練可辨識多種字型和樣式字元的神經網路。英文模型約 12 MB,中文模型約 15 MB。我們僅在您選擇某種語言時下載該語言模型,並在本地快取,所以只需支付一次成本,而非每次存取都重新下載。

系統會提示您輸入密碼。解密在您瀏覽器中本地完成,密碼永遠不會傳送到任何伺服器。解鎖後,OCR 將正常處理解密後的頁面。

OCR 還原文字內容,但不保留原始文件的精確視覺佈局、字型或樣式。對於大多數用途(搜尋、複製、編輯或輸入到其他工具),這是正確的取捨。如果您需要像素級精確佈局,請改用專門的保留佈局工具將 PDF 轉換為 Word 文件。

是的。免費、無需註冊、無浮水印、頁數無限制。工具由周圍頁面的非侵入式廣告支援。