← 返回工具箱
OCR 文字识别
📷

点击上传图片,或拖拽图片到此处

支持 PNG、JPG、BMP、WebP,也可使用 Ctrl+V 粘贴
准备中...

OCR 知识

什么是 OCR

OCR(Optical Character Recognition,光学字符识别)是一种将图片中的文字转换为可编辑文本的技术。本工具使用 Tesseract.js 引擎,在浏览器中本地运行,无需上传图片到服务器。

Tesseract 引擎

Tesseract 是由 Google 维护的开源 OCR 引擎,支持 100+ 种语言。Tesseract.js 是其 JavaScript 移植版本,可在浏览器中直接运行。

特性说明
支持语言100+ 种,包括中英日韩等
运行环境浏览器本地,基于 WebAssembly
隐私保护图片不上传,全程离线处理
图片 → 预处理(二值化/降噪) → 文字区域检测 → 字符分割 → 特征提取 → 文字输出
识别效果提示:清晰、正向、高对比度的图片识别率最高。手写体、模糊图片、复杂背景会降低识别准确率。首次使用需下载语言模型(约几 MB),请耐心等待。