Importieren von PDF-Dateien


Arten von PDF-Dateien

Leider sind nicht alle PDF-Dokumente gleich.

Auch wenn sie alle die Endung „.PDF” im Dateinamen haben, können sich ihr Erstellungsprozess und ihr Inhalt erheblich unterscheiden.

Diese Unterschiede erklären, warum Apps bestimmte PDF-Dateien nicht verarbeiten können.

In diesem Artikel wird der Unterschied zwischen einer „echten” PDF-Datei und einer „gescannten” PDF-Datei erläutert.

✔️ „Echte“ (oder „reale“) PDFs

Echte PDFs wurden digital mit einer Anwendung erstellt, die den Text, die Bilder und die Formatierungsinformationen in das Dokument selbst einbettet.

Wenn Sie ein Dokument in Google Docs, Microsoft Word oder ähnlichen Programmen bearbeiten, klicken Sie auf „Als PDF exportieren“, um eine echte PDF-Datei zu erstellen.

Da diese Dateien Textinformationen enthalten, können sie von Anwendungen wie Teleprompter for Video leicht verstanden und extrahiert werden.

❌ Gescannte PDF-Dateien

Die meisten Scanner oder Scan-Apps können Dateien im PDF-Format speichern.

Diese Scans enthalten keine eingebetteten Textinformationen. Stattdessen handelt es sich lediglich um ein Bild des Dokuments.

Daher können Anwendungen den Text nur verstehen, wenn sie OCR (optische Zeichenerkennung) durchführen, um den Text aus dem Bild zu extrahieren.

Wenn Sie Text aus einer gescannten PDF-Datei in Teleprompter for Video importieren möchten, müssen Sie eine spezielle OCR-Anwendung verwenden, um den Text aus dem Dokument zu extrahieren.