Converta documentos escaneados em texto – Google OCR

Existem dois tipos de documentos PDF – os que são criados quando enviamos arquivos para impressão e aqueles criados quando escaneamos páginas de um livro, documentos, revistas, etc.

Os motores de busca do Google sempre indexaram esses arquivos PDF, mas agora eles também conseguem reconhecer o texto embutido em PDFs gerados pelo escaneamento de documentos de papel via software OCR.

Este é um documento escaneado e esta é a visualização em texto html do mesmo documento, convertido pelo Google.

Convertendo PDFs escaneados em texto
Se você tem muitos arquivos PDF escaneados em seu computador e não tem um OCR, veja o que você pode fazer para converter seus documentos em texto que possa ser lido, copiado ou editado no computador.

Crie uma pasta em seu site (algo como xyz.com.br/pdf) e faça o upload de todos as imagens PDF para este diretório. Agora crie uma página pública que tenha links para todos esses arquivos PDF. Espere até o Google indexar seu material.

Quando seus arquivos já estiverem aperecendo nas buscas, digite a seguinte sequência:

“site:xyz.com.br/pdf filetype:pdf”

Você verá seus documentos PDF convertidos em formato HTML.

14 Comments

  1. Elaine 5 de maio de 2012
    • Diêgo Bastos 25 de novembro de 2012
  2. FILIPE ABREU EUSÉBIO 23 de junho de 2011
    • Dany 17 de julho de 2011
  3. angela maria da silva 29 de maio de 2011
  4. claudia 12 de abril de 2011
    • caca roussef 7 de junho de 2011
  5. tais 30 de março de 2011
  6. likirey 12 de fevereiro de 2011
  7. lidya 22 de abril de 2010
  8. Helena 2 de março de 2010
  9. Carlos Alberto 22 de fevereiro de 2010
  10. Maria 3 de julho de 2009
  11. NELSON DOUGLAS DA SILVA 27 de junho de 2009

Deixe seu Comentário