OCR workflow start to finish

- Get research photos

       (more megapixels more           better)

- Store photos online
- OCR if necessary or
       Extract existing OCR

- Clean extracted text

- profit! (analyze)

OCR and HCR options

  • Print, small number of files:
    • Adobe Acrobat Pro
  • Print, large number of files:
    • Clean print quality: pytesseract via python
    • Poor print quality: Azure computer vision or other AI product via python
  • Handwritten, large number of files:
    • Transkribus in-browser uploads
    • Painfully hand transcribe

Sur le Rapport du Garde 4es Scseux,kinistr de la Justices, * DECRETS : Article Praster. Sont naturalisés Frangata per application ¢ L'article 6 § Ier de 1a Lot du 10 sot 1927 : ) LO BELLO (Trangots) magon,né le 24 actt 193 A Tunis, de pire italien, densurant a Maison Sarre.” (Alaer) Tu4 frsy PavAO (Fernando de Jésus) soldat au Ier Ré= ginent Btranger d'Infanterie A Sidi-Bel-:pbds (Oren) | né le 36 Avril TOF A Seint-lartin~de-iagores (Porta,

deck

By mkane

deck

  • 221