Huomasin että digitaaliarkistossa oleva Turun kaupungin vuoden 1917 henkikirja on koneella kirjoitettu, ks. esim. http://digi.narc.fi/digi/view.ka?kuid=73672177. Kokeilin siihen automaattista tekstintunnistusta ja lopputuloksena on alkeellinen hakupalvelu jossa voi etsiä henkikirjassa olevia nimiä: https://kku.lapanen.org/turku1917/
Ehkä tästä on iloa jollekin. Palautetta saa antaa. Ja kerro jos tiedät miten tekstintunnistuksen saa toimimaan paremmin (käytin mm. tesseract-nimistä ohjelmaa).
Ei kommentteja:
Lähetä kommentti