AllInfo

Tekst ophalen uit PDF-en afbeeldingsbestanden

Een PDF-document dat u wilt uitpakken van alle tekst uit? Wat te denken van image bestanden van een gescand document dat u wilt converteren naar bewerkbare tekst? Dit zijn enkele van de meest voorkomende problemen die ik gezien heb op de werkplek tijdens het werken met bestanden.

In dit artikel zal ik het hebben over de verschillende manieren waarop u kunt gaan over pogingen om de tekst uit een PDF of een afbeelding. De extractie resultaten zullen variëren afhankelijk van het type en de kwaliteit van de tekst in de PDF of afbeelding. Ook, uw resultaten zullen variëren afhankelijk van het gereedschap dat u gebruikt, dus het is het beste om te proberen zo veel mogelijk van de onderstaande opties mogelijk om de beste resultaten te krijgen.

Tekst ophalen uit een Afbeelding of PDF

De eenvoudigste en snelste manier om te beginnen is om te proberen een online PDF-tekst afzuigkap service. Deze zijn normaal gesproken vrij en kan u precies wat u zoekt zonder iets te hoeven installeren op uw computer. Hier zijn twee die ik heb gebruikt met zeer goede tot uitstekende resultaten:

ExtractPDF

ExtractPDF is een gratis tool om je afbeeldingen, tekst en lettertypen uit een PDF-bestand. De enige beperking is dat de maximale grootte op voor het PDF-bestand is 10 MB. Dat is een beetje klein, dus als je een groter bestand, probeer een aantal van de andere methoden. Kies je bestand en klik vervolgens op het bestand Verzenden knop. De resultaten zijn over het algemeen zeer snel en u ziet een voorbeeld van de tekst wanneer u klikt op het tabblad Tekst.

Het is ook een leuk extra voordeel dat het haalt de beelden uit het PDF-bestand, voor het geval je het nodig hebt! Kortom, de online tool werkt geweldig, maar ik heb een paar PDF-documenten die geven me grappig uitgang. De tekst wordt gewonnen prima, maar voor sommige reden het zal een lijn te breken na elk woord! Niet een groot probleem voor een korte PDF-bestand, maar zeker een probleem voor bestanden met veel tekst. Als dat bij u gebeurt, probeert u het volgende gereedschap.

Online OCR

Online OCR meestal de neiging om te werken voor de documenten die niet correct zijn geconverteerd met ExtractPDF, dus het is een goed idee om te proberen beide diensten om te zien welke geeft u een betere output. Online OCR heeft ook een aantal leukere functies die kunnen bewijzen handig voor iedereen met een groot PDF-bestand dat alleen dient om tekst om te zetten op een paar pagina ‘ s in plaats van het hele document.

Het eerste wat je wilt te doen is ga je gang en maak een gratis account aan. Het is een beetje vervelend, maar als u het niet maken van het gratis account aan, het zal slechts gedeeltelijk converteer uw PDF in plaats van het hele document. Ook, in plaats van alleen de mogelijkheid om te uploaden alleen een 5 MB document, kunt u uploaden tot 100 MB per bestand met een account.

Eerste, kies de taal en kies vervolgens het type van de output formaten voor het geconverteerde bestand. Je hebt een paar opties en u kunt meer dan een als je wilt. Onder document, kunt u de Pagina-nummers en kies vervolgens alleen de pagina ‘ s die u wilt converteren. Vervolgens selecteert u het bestand en klik op Zetten!

Na de conversie, zult u worden voorgelegd aan de sectie Documenten (als u ingelogd bent), waar u kunt zien hoe veel van de beschikbare vrije pagina ‘ s die u links en koppelingen voor het downloaden van uw geconverteerde bestanden. Het lijkt erop dat je alleen maar 25 pagina ‘s, gratis per dag, dus als je meer nodig hebt dan dat, je moet wachten een beetje, of koop meer pagina’ s.

Online OCR heeft uitstekend werk van het omzetten van mijn Pdf ‘ s, omdat het in staat was om het handhaven van de huidige lay-out van de tekst. In mijn test heb ik een Word-doc dat kogels gebruikt, verschillende lettergroottes, etc en omgezet naar een PDF. Toen ik het gebruikte Online OCR te converteren naar Word-formaat, en het was ongeveer 95% hetzelfde als de originele. Dat is behoorlijk indrukwekkend voor mij.

Plus, als u op zoek bent naar converteer een afbeelding naar tekst, en dan de Online OCR kan dat net zo makkelijk als het extraheren van tekst uit PDF-bestanden.

Gratis Online OCR

Sinds het praten waren over de afbeelding naar tekst met OCR, laat ik noem nog een goede website die werkt echt goed op beelden. Gratis Online OCR was erg goed en zeer nauwkeurig bij het extraheren van tekst uit mijn test foto ‘ s. Ik nam een paar foto ‘s van mijn iPhone van pagina’ s uit boeken, brochures, etc en ik was verbaasd over hoe goed het was in staat om te converteren van de tekst.

Kies je bestand en klik vervolgens op de knop Uploaden. Op het volgende scherm, er zijn een aantal opties en een voorbeeld van de afbeelding. Kunt u het bijsnijden als u niet wilt dat de OCR-het hele ding. Vervolgens klikt u op de knop OCR en uw geconverteerde tekst wordt weergegeven onder het voorbeeld van de afbeelding. Het maakt ook niet over de eventuele beperkingen, die is echt leuk.

In aanvulling op de online diensten, zijn er twee freeware PDF-converters wil ik vermelden in het geval dat u nodig hebt, is software draait lokaal op uw computer om de conversies uitvoeren. Met online diensten, zult u altijd een Internetverbinding nodig en dat kan niet voor iedereen mogelijk. Echter, ik heb gemerkt dat de kwaliteit van de conversies van de freeware programma ‘ s waren significant slechter dan die van de websites.

A-PDF Tekst Afzuigkap

A-PDF Tekst Extractor is freeware dat doet een vrij goed werk van het extraheren van tekst uit PDF-bestanden. Als u het downloaden en te installeren, klikt u op de knop Openen om te kiezen van uw PDF-bestand. Klik op tekst om het proces te starten.

Het programma vraagt u een locatie voor het opslaan van de tekst output bestand en dan zal het beginnen met het uitpakken. U kunt ook klikken op de Optie knop, waarmee u alleen bepaalde pagina ‘ s te halen en de extractie van het type. De tweede optie is interessant omdat het haalt de tekst in verschillende lay-outs en het is de moeite waard te proberen alle drie om te zien welke items geeft u de beste output.

PDF2Text Pilot

PDF2Text Piloot doet een ok job van het extraheren van tekst. Het heeft geen opties; u bestanden toevoegen of mappen zetten en hopen voor het beste. Het werkt goed op enkele Pdf ‘ s, maar voor de meerderheid van hen, er waren tal van problemen.

Gewoon klik op Bestanden Toevoegen en klik vervolgens op Converteren. Nadat de conversie is voltooid, klikt u op Bladeren om het bestand te openen. Je kilometers zal variëren met behulp van dit programma dus niet veel te verwachten.

Ook is het de moeite waard te vermelden dat als je in een zakelijke omgeving of kunt krijgen van uw handen op een kopie van Adobe Acrobat van het werk, dan kun je pas echt je veel betere resultaten. Acrobat is natuurlijk niet gratis, maar het heeft opties voor het converteren van PDF naar Word, Excel en HTML-formaat. Het is ook niet het beste werk van het behoud van de structuur van het originele document en het omzetten van ingewikkelde tekst.

Exit mobile version