Programa que viabiliza a OCR (Optical Character Reading - leitura óptica de caracteres) de um PDF.

Last update: Oct 11, 2021

Related tags

Overview

Este programa tem o intuito de ser um modificador de arquivos PDF. Os arquivos PDFs podem ser 3: PDFs verdadeiros - em que podem ser selecionados o tipo de texto, PDFs-de-imagem - arquivos feitos de imagens e que o conteúdo é "aprisionado" e não pode ser acessado. Como terceiro tipo temos o PDFs-buscáveis: estes são os PDFs que resultam de aplicação OCR (Optical Character Recognition - Reconhecimento óptico de caracter), em que o documento é analizado e estruturado com uma nova camada de texto por detrás da camada de imagem do PDF-de-Imagem.

A criação do terceiro tipo de PDF a partir do segundo tipo é o intuito deste programa. Para isto é necessário a aplicação de alguns programas externos ao python.

Abaixo listarei o processo que utilizei para instalar estes programas externos:

Além de ter o python instalado e um ambiente virtual iniciado, é necessário utilizar o comando pip: pip install ocrmypdf. Esta biblioteca é um conjunto de pacotes que atuará sobre o PDF.

Primeiro de tudo, caso seja usuário de windows, é necessário ter um administrador de pacotes chamado Chocolotey . Após ter instalado ele, é necessário escrever os seguintes comandos:

choco install --pre tesseract
choco install ghostscript

Para mais informações sobre esse processo, caso utilizar MacOS ou Linux, acesse aqui.

Programa que viabiliza a OCR (Optical Character Reading - leitura óptica de caracteres) de um PDF.

Related tags

Overview

Owner

Daniel Soares Saldanha

A simple Digits Recogniser made in Python

A program that takes in the hand gesture displayed by the user and translates ASL.

A little but useful tool to explore OCR data extracted with `pytesseract` and `opencv`

This is a real life mario project using python and mediapipe

Character Segmentation using TensorFlow

第一届西安交通大学人工智能实践大赛（2018AI实践大赛--图片文字识别）第一名；仅采用densenet识别图中文字

Python package for handwriting and sketching in Jupyter cells

Dataset and Code for ICCV 2021 paper "Real-world Video Super-resolution: A Benchmark Dataset and A Decomposition based Learning Scheme"

Official PyTorch implementation for "Mixed supervision for surface-defect detection: from weakly to fully supervised learning"

📷 Face Recognition using Haar-Cascade Classifier, OpenCV, and Python

Source Code for AAAI 2022 paper "Graph Convolutional Networks with Dual Message Passing for Subgraph Isomorphism Counting and Matching"

Generating .npy dataset and labels out of given image, containing numbers from 0 to 9, using opencv

Smart computer vision application

Tesseract Open Source OCR Engine (main repository)

Random maze generator and solver

This is the implementation of the paper "Gated Recurrent Convolution Neural Network for OCR"

Course material for the Multi-agents and computer graphics course

Implementation of EAST scene text detector in Keras

A Vietnamese personal card OCR website built with Django.

An application of high resolution GANs to dewarp images of perturbed documents