pdf-ocr
CommunityTurn PDFs into editable text with OCR.
Authorghjghjghkimo
Version1.0.0
Installs0
System Documentation
What problem does it solve?
将 PDF 的內容提取工作自動化,結合 OCR、公式識別與圖片辨識,降低手動轉錄與校對成本,提升工作效率。
Core Features & Use Cases
- 高品質 OCR:使用 PP-OCRv5 進行中英文識別與排版保留。
- 公式提取:支援科學公式轉為 MathML,或保留 LaTeX 原始格式。
- 路徑自動修正與穩定化:內建 clean_path 類型邏輯,處理不規範的檔案路徑。
- 硬體加速:預設使用 CUDA,優化高端顯示卡的性能。
Quick Start
在專案目錄下執行 pdf-ocr 的工具,輸入待處理的 PDF 路徑並指定輸出目錄。
Dependency Matrix
Required Modules
doclingdocling_core
Components
scripts
💻 Claude Code Installation
Recommended: Let Claude install automatically. Simply copy and paste the text below to Claude Code.
Please help me install this Skill: Name: pdf-ocr Download link: https://github.com/ghjghjghkimo/skills/archive/main.zip#pdf-ocr Please download this .zip file, extract it, and install it in the .claude/skills/ directory.
Agent Skills Search Helper
Install a tiny helper to your Agent, search and equip skill from 471,000+ vetted skills library on demand.