chineseocr_lite 是一个开源项目,用来实现中文的文字识别,支持竖排文字识别、繁体识别,总模型只有 17M(很小就是了),无需联网,支持 CPU 与 GPU,但需要自己部署。

目前绝大多数图片转文字,或者说中文 OCR 系统,都使用了云服务,也就是需要联网使用,这使得服务商有着大量的数据可以进行机器学习,而 chineseocr_lite 就有点厉害了:

超轻量级中文 ocr,支持竖排文字识别, 支持 ncnn 推理 , psenet(8.5M) + crnn(6.3M) + anglenet(1.5M) 总模型仅 17M

识别率还是可以的。

如何安装?

chineseocr_lite 是一款需要自行编译、自行部署的开源软件(GitHub 开源),所以…有使用门槛!

必备环境:

  • Python
  • PyTorch(官网
  • VS2015(Windows 需要)

Linux 与 macOS 直接编译就好,青小蛙在想要不要搞成 Docker 方便大家用…想用的人多么?

编译也非常简单,只需要先复制源代码,然后跟着编译即可:

git clone https://github.com/ouyanghuiyu/chineseocr_lite.git
cd psenet/pse
rm -rf pse.so 
make

如何运行?

pip3 install -r requirements.txt
cd chineseocr_lite ## 进入chineseocr目录
python3 app.py 8080 ## 8080端口号,可以设置任意端口

上面的安装和运行两个步骤,对于新手会有不少的坑,所以你需要善用搜索引擎…总之青小蛙觉得这是一个能挡住 90% 普通用户的项目 ?

如何使用?

在浏览器上输入 ip:8080 就能打开页面,然后加载图片进行识别了。并且还有 火车票身份证 两个单独识别选项。

来源:小众软件

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。