图片验证码自动识别,使用tess4j进行验证码自动识别(java实现) - zw520ly

时间:2024-02-24 21:07:31

图片验证码自动识别,使用tess4j进行验证码自动识别(java实现)

1、下载tess4j依赖的jar包,maven*库地址:<dependency>
            <groupId>net.sourceforge.tess4j</groupId>
            <artifactId>tess4j</artifactId>
            <version>3.1.0</version>
        </dependency>

由于maven官方库下载很慢,推荐在阿里云的镜像下载:配置文件中加入镜像:<mirror>
           <id>alimaven</id>
            <mirrorOf>central</mirrorOf>
             <name>aliyun maven</name>
             <url>http://maven.aliyun.com/nexus/content/repositories/central/</url>
         </mirror>
          <!-- *仓库1 -->
        <mirror>
            <id>repo1</id>
            <mirrorOf>central</mirrorOf>
            <name>Human Readable Name for this Mirror.</name>
            <url>http://repo1.maven.org/maven2/</url>
         </mirror>
        <!-- *仓库2 -->
        <mirror>
           <id>repo2</id>
           <mirrorOf>central</mirrorOf>
            <name>Human Readable Name for this Mirror.</name>
           <url>http://repo2.maven.org/maven2/</url>
        </mirror>

2、maven工程中导入文字库tessdata,放在当前工程的根目录下即可,tessdata的文字库包自己下载,如图所示:

 

3、核心代码:
        File imageFile = new File("E:/test.png");  
        Tesseract instance = new Tesseract();

        //将验证码图片的内容识别为字符串
        String result = instance.doOCR(imageFile);