怎么在SpringBoot中使用Tess4j实现一个OCR识别工具
更新:HHH   时间:2023-1-7


怎么在SpringBoot中使用Tess4j实现一个OCR识别工具?很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。

开发实现

First 创建工程

Second 添加依赖

<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
  <modelVersion>4.0.0</modelVersion>

  <groupId>org.example</groupId>
  <artifactId>test-textocr</artifactId>
  <version>1.0-SNAPSHOT</version>
  <dependencies>
    <!-- https://mvnrepository.com/artifact/net.sourceforge.tess4j/tess4j -->
    <dependency>
      <groupId>net.sourceforge.tess4j</groupId>
      <artifactId>tess4j</artifactId>
      <version>4.5.3</version>
    </dependency>

  </dependencies>

</project>

Third 填写类文件

package ocr;

import net.sourceforge.tess4j.ITesseract;
import net.sourceforge.tess4j.Tesseract;
import net.sourceforge.tess4j.TesseractException;

import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;


/**
* ocr测试.
*
* @author huc_逆天
* @since 2021/1/12 17:42
*/
public class TestTextOcr {

  public static void main(String[] args) throws IOException {
    // 创建实例
    ITesseract instance = new Tesseract();

    // 设置识别语言

    instance.setLanguage("chi_sim");

    // 设置识别引擎

    instance.setOcrEngineMode(1);

    // 读取文件

    BufferedImage image = ImageIO.read(TestTextOcr.class.getResourceAsStream("/2.jpg"));
    try {

      // 识别

      String result = instance.doOCR(image);
      System.out.println(result);
   } catch (TesseractException e) {
      System.err.println(e.getMessage());
   }


 }
}

Fifth 添加训练语言环境配置

TESSDATA_PREFIX=F:\tessdata ,变量名,固定,值为官网下载文件 https://github.com/tesseract-ocr/tessdata

Sixth 运行

结果如下:

可能识别模式,不是很合适,切换下

instance.setOcrEngineMode(0);

看完上述内容是否对您有帮助呢?如果还想对相关知识有进一步的了解或阅读更多相关文章,请关注天达云行业资讯频道,感谢您对天达云的支持。

返回开发技术教程...