Importation de fichiers PDF
Types de PDF
Malheureusement, tous les documents PDF ne sont pas identiques.
Bien qu'ils aient tous l'extension « .PDF » à la fin de leur nom de fichier, leur processus de création et leur contenu peuvent varier considérablement.
Ces différences expliquent pourquoi certaines applications ne peuvent pas traiter certains fichiers PDF.
Cet article explique la différence entre un PDF « véritable » et un PDF « numérisé ».
✔️ PDF « véritables » (ou « réels »)
Les PDF véritables ont été créés numériquement par une application qui intègre le texte, les images et les informations de mise en forme dans le document lui-même.
Lorsque vous modifiez un document dans Google Docs, Microsoft Word ou un logiciel similaire, appuyez sur « Exporter au format PDF » pour créer un PDF véritable.
Comme ces fichiers contiennent des informations textuelles intégrées, ils peuvent être facilement compris et extraits par des applications telles que Teleprompter for Video.
❌ PDF numérisés
La plupart des scanners ou des applications de numérisation permettent d'enregistrer au format PDF.
Ces numérisations ne contiennent aucune information textuelle intégrée. Il s'agit simplement d'une image du document.
Par conséquent, les applications ne peuvent comprendre le texte qu'en effectuant une reconnaissance optique de caractères (OCR) afin d'extraire le texte de l'image.
Si vous devez importer du texte à partir d'un PDF numérisé dans Teleprompter for Video, vous devez utiliser une application OCR spécialisée pour extraire le texte du document.