OCR-program till maskinskriven text

Permalänk
Medlem

OCR-program till maskinskriven text

Hej!

Har en drygt 80-årig bekant som håller på att samla ihop och organisera sitt livsverk. Som del i detta vill han digitalisera en del texter som han har i pappersform, maskinskrivet. Tänker att första steget är att scanna in dem till PDF-filer, men han vill också att det ska gå att kopiera delar av dem, så då behöver man någonslags OCR-lösning. Har ingen erfarenhet av detta, hoppas att någon har tips på program som både fungerar bra med svenska tecken och som är hyfsat användarvänligt. Finns det inga användarvänliga alternativ kan jag såklart hjälpa honom med den biten.

Permalänk
Medlem

Har du provat Adobe Acrobat? Man kan prova det gratis i 7 dagar.

Om du vill prova med fri mjukvara så finns Rescribe, men tyvärr så verkar det inte vara så användarvänligt.

Permalänk

Nu var det länge sedan jag provade OCR verktyg men jag vill minnas att min Epson scanner hade antingen egen eller tredjeparts mjukvara med i förpackningen som fungerade förvånansvärt bra. Kolla på din scanners hemsida vad det finns för mjukvara till det helt enkelt.

Permalänk
Rekordmedlem

Omnipage är bra och kan ingå med vissa scanners/skrivare men går även att skaffa en licens själv om man vill.

Visa signatur

R5 5600G, Asus ROG STRIX X470-F Gaming, WD SN850X 2TB, Seasonic Focus+ Gold 650W, Aerocool Graphite v3, Tittar på en Acer ET430Kbmiippx 43" 4K. Lyssnar på Behringer DCX2496, Truth B3031A, Truth B2092A. Har också oscilloskop, mätmikrofon och colorimeter.

Permalänk
Medlem
Skrivet av Deroan:

...Tänker att första steget är att scanna in dem till PDF-filer, men han vill också att det ska gå att kopiera delar av dem, så då behöver man någonslags OCR-lösning.

Jag använder Adobe Acrobat och scannar man in där så kan man välja att göra OCR samtidigt som dokumentet scannas in, eller i efterhand.

Permalänk
Medlem

Tack för hjälpen, uppskattas verkligen!

Permalänk
Medlem

Det är ju ett tag sedan nu, men jag var i samma situation och behövde kunna utföra OCR-läsning också.

Jag testade en gratistjänst på nätet som tillät 5 dokument i timmen och den funkade bra men begränsningen blev det inte riktigt användbart.

Så testade jag denna idag:
https://www.sweclockers.com/forum/trad/1669890-microsoft-powe...

Och den funkar i alla fall lika bra som nättjänsten, men utan några begränsningar. Jag ska göra ett lite mer seriöst test, men det känns mycket lovande.

Permalänk

Firefox Add-On: OCR - Image Reader

Permalänk
Medlem

Har inte testat det själv men det finns i PowerToys för Windows.

Permalänk
Medlem
Skrivet av baath:

Har inte testat det själv men det finns i PowerToys för Windows.

Det är sant, och det är ett bra verktyg, men det är ju ett verktyg anpassat för att snabbt plocka ut texten ur en bild på skärmen (typexemplet något som borde ha skickats som text) och lägga den i "clipboard". Väldigt sådär adhoc-anpassat, bättre än inget, man får i princip det man får och oftast så blir det smidigare än att skriva av även om det kanske inte blivit riktigt rätt.

Är dock lite skeptisk till att man blir sådär helnöjd med den lösningen om man nu ska scanna en hel massa sidor maskinskriven text. Dels tror jag arbetsflödet blir rätt drygt i längden, dels så finns det ju mycket begränsade inställningsmöjligheter, så om det är något som skulle behöva justeras så det inte blir samma fel om och om igen så lär det snabbt bli irriterande.

Visa signatur

Desktop: Ryzen 5800X3D || MSI X570S Edge Max Wifi || Sapphire Pulse RX 7900 XTX || Gskill Trident Z 3600 64GB || Kingston KC3000 2TB || Samsung 970 EVO Plus 2TB || Samsung 960 Pro 1TB || Fractal Torrent || Asus PG42UQ 4K OLED
Proxmox server: Ryzen 5900X || Asrock Rack X570D4I-2T || Kingston 64GB ECC || WD Red SN700 1TB || Blandning av WD Red / Seagate Ironwolf för lagring || Fractal Node 304

Permalänk
Medlem

Jag missförstod nog användningen. Såg att MickeBoy redan tipsat om PowerToys också

Permalänk

kan ju prova https://www.naps2.com/
när du har tagit hem och installerat det
starta programmet
klicka på "OCR" ikonen
välj språk :English är markerat som Default så scrolla bara till "Swedish" markera och ta hem.
välj "Swedish" som språk
kryssa ur "Automatically run OCR after scanning"
klicka "OK"
klart att användas

Permalänk
Medlem

Google har OCR-tolkning från bilder i Google Drive. Gratis.
Jag har testat med 40-sidors dokument. Fungerade överlag bra med kanske 3 ord per sida som blev feltolkade.

Permalänk
Medlem
Skrivet av Supreme8001:

Google har OCR-tolkning från bilder i Google Drive. Gratis.
Jag har testat med 40-sidors dokument. Fungerade överlag bra med kanske 3 ord per sida som blev feltolkade.

Jag valde att testa PowerToys ville använda google translate efter OCR-tolkning för att få en hyfsad översättning från engelska. Vet du om det är möjligt att låta google göra allt på en gång?

Jag bara tänker att det vore rimligt. I så fall ska jag nog testa det också.

Permalänk
Medlem

Det enklaste är nog att bara kopiera texten efter OCR-tolkning och klistra in i valfritt program för översättning. Att göra det helt automatiskt var ingen funktion jag såg eller minns i Google Drive.

Permalänk
Medlem
Skrivet av gagamelll:

Nu var det länge sedan jag provade OCR verktyg men jag vill minnas att min Epson scanner hade antingen egen eller tredjeparts mjukvara med i förpackningen som fungerade förvånansvärt bra. Kolla på din scanners hemsida vad det finns för mjukvara till det helt enkelt.

Ja, fick också en OCR-programvara med en scanner i slutet av 90-talet, som inget jag testat senare kunnat bräcka. Det var just maskinskriven och tryckt text jag använde den med.

Sedan kan det förstås vara så att den tidens OCR-programvaror var väldigt specialiserade på just det lilla antal typsnitt som dominerade på den tiden. Det är ju en helt annan situation med den saken idag, diversiteten är enorm i jämförelse, och programvarorna måste kunna hantera ett mycket bredare register.

Det kan ha varit en Epson-scanner också. Tyvärr minns jag inte detaljerna, den avyttrades ganska omedelbart när det kom scanners med USB-anslutning och LED-belysning.

Visa signatur

Nu lurade jag dig att slösa bort ett par värdefulla sekunder av ditt liv på att läsa denna fullständigt poänglösa signatur!

Permalänk
Medlem

Jag kör med Paperless-ngx som i kombination med mobilappen "Paperless Mobile" gör det väldigt smidigt att digitalisera dokument, varpå Paperless-servern därefter automatiskt OCR-inläser alla inskannade dokument så de blir sökbara och du kan kopiera ut delar av texter som du behagar.

Enda nackdelen skulle vara det faktum att Paperless-ngx är linux-baserat, så man behöver antingen en linux-dator att installera detta på, vilket enklast görs med Docker. Om man har en QNAP eller Synology NAS så kan man med fördel installera Paperless på denna för att mappa upp en insugsmapp i vilket Paperless suger in och OCR-bearbetar alla filer som placeras där. Ett tredje alternativ är att deploy:a Paperless-ngx via exempelvis elest.io som har en färdig mall för detta, se länk nedan.

Länkar
https://docs.paperless-ngx.com/
https://play.google.com/store/apps/details?id=de.astubenbord....
https://elest.io/open-source/paperless-ngx

Visa signatur

Also found as @piteball@mastodon.rockhost.se

Permalänk
Medlem

Min Canon-laserskrivare har en utmärkt inbyggd OCR-funktion. Jag har numera några GB med inlästa räkningar, abonnemangsavtal, BRF-papper och allt annat man brukade sätta i pärmar som är sökbara genom att de OCR:ats av skrivaren/skannern.