Tess4J图片文字识别

论坛 期权论坛 脚本     
匿名技术用户   2020-12-23 17:43   803   0
public static void main(String[] args) throws Exception {
        ITesseract instance = new Tesseract();
        File imageFile = new File("jcaptcha.jpg");
        BufferedImage bi = ImageIO.read(imageFile);
        BufferedImage textImage = ImageHelper.convertImageToGrayscale(ImageHelper.getSubImage(bi, 0, 0, bi.getWidth(), bi.getHeight()));
        // 图片锐化,自己使用中影响识别率的主要因素是针式打印机字迹不连贯,所以锐化反而降低识别率
        textImage = ImageHelper.convertImageToBinary(textImage);
        // 图片放大5倍,增强识别率(很多图片本身无法识别,放大5倍时就可以轻易识,但是考滤到客户电脑配置低,针式打印机打印不连贯的问题,这里就放大5倍)
        textImage = ImageHelper.getScaledInstance(textImage, bi.getWidth() * 10, bi.getHeight() * 10);
        ImageIO.write(textImage, "jpg", new File("jcaptcha0.jpg"));
        String result = instance.doOCR(new File("jcaptcha0.jpg"));
        System.out.println(result);
    }

顺便说一句,如果不训练,效果很差。

分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:7942463
帖子:1588486
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP