Meta Daten aus mehreren PDF Dateien auslesen

Diskutiere Meta Daten aus mehreren PDF Dateien auslesen im Windows 10 Software Forum im Bereich Windows 10 Foren; Hallo, ich bin auf der Suche nach einer Möglichkeit um aus mehreren PDF Dateien Meta Infos wie die Seitenanzahl und den Flächeninhalt auszulesen...
A

anold

Erfahrener Benutzer
Threadstarter
Dabei seit
20.04.2017
Beiträge
293
Ort
Hessen
Version
Pro 1809
System
Samsung Q330-JS04, 8 GB RAM, SSD
Hallo,

ich bin auf der Suche nach einer Möglichkeit um aus mehreren PDF Dateien Meta Infos wie die Seitenanzahl und den Flächeninhalt auszulesen.

Um das ganze zu Präzisieren:
In einem Ordner befinden sich 1...n PDF Dateien.
Die PDFs haben unterschiedliche Seitenanzahlen und auch Formate. Die Formate sind teilweise keine DIN Standards und teilweise unterscheiden sich die Formate von Seite zu Seite innerhalb eines PDFs.

Ich suche jetzt eine Möglichkeit um für alle PDFs in einem Ordner den gesamten Flächeninhalt komfortabel auszulese, ohne jede PDF öffnen zu müssen und für jede Seite die Maße rausschreiben zu müssen.

Weiß eventuell jemand da eine Software für oder eine andere Methode?
Ich hoffe ich konnte mich einigermaßen verständlich ausdrücken. Bei Unklarheiten versuche ich auch gerne das noch weiter zu beschreiben.

Schon mal vielen Dank.
 
areiland

areiland

Super-Moderator
Dabei seit
25.08.2014
Beiträge
29.661
Ort
Ludwigshafen
Version
Windows 10 Pro x64 immer aktuell!
System
970M Pro3, FX8350, RX560, 16GB DDR3 1600, 860Evo256 GB, MK7559GSXP, SH224BB, BenQ GW2780
Lies mal das hier: https://www.win-10-forum.de/windows-10-allgemeines/9619-katalog-hdd-explorer-liste.html! Da hatte ich eine Methode gezeigt, wie man per Powershell auch die erweiterten Dateieigenschaften auslesen und weiter verarbeiten kann. Wenn die von Dir gewünschten Eigenschaften so darstellbar sind, dann ließen sie sich z.B. auch als Liste (Html, Csv. Txt, etc) speichern.
 
A

anold

Erfahrener Benutzer
Threadstarter
Dabei seit
20.04.2017
Beiträge
293
Ort
Hessen
Version
Pro 1809
System
Samsung Q330-JS04, 8 GB RAM, SSD
Danke für die Info. Das bringt mich allerdings leider nicht weiter, da diese Informationen dort nicht aufgeführt sind. Wahrscheinlich ist der Begriff Metadaten auch schlecht gewählt.

Aber die nötigen Angaben stehen im Klartext in den PDF Dateien. Für jede Seite extra. Da müsste ich mir die dann auslesen und aufaddieren.
Ich hatte
 
areiland

areiland

Super-Moderator
Dabei seit
25.08.2014
Beiträge
29.661
Ort
Ludwigshafen
Version
Windows 10 Pro x64 immer aktuell!
System
970M Pro3, FX8350, RX560, 16GB DDR3 1600, 860Evo256 GB, MK7559GSXP, SH224BB, BenQ GW2780
Wenn Du spezifizieren kannst, wo sie genau stehen dann geht das natürlich. Dafür böte die Powershell "Get-content" an, mit dem man sich Zeilen einer Datei direkt anzeigen lassen kann. Mit dem Parameter "-head n" kann man sich eine beliebige Anzahl der Zeilen vom Dateiheader aus auflisten lassen, mit "-tail n" ginge das vom Dateiende her. Experimente mal damit, vielleicht bringt Dir das eine Lösung des Problems.

Eine Beispielzeile wäre: get-content -path D:\pdf\*.pdf -head 10, die von allen PDF-Dateien in D:\PDF die ersten 10 Headerzeilen auflistet.
 
A

anold

Erfahrener Benutzer
Threadstarter
Dabei seit
20.04.2017
Beiträge
293
Ort
Hessen
Version
Pro 1809
System
Samsung Q330-JS04, 8 GB RAM, SSD
Hi,
danke schön für die Infos.

Leider kann ich nicht genau sagen wo die Infos in der Datei stehen. Die scheinen soweit ich das bis jetzt überblicke für jede Seite der PDF angegeben zu sein. Ich muss also die gesamte Datei auswerten. Aber ich weiß jetzt wie der Aufbau der Angaben ist und denke ich kann mir das dann per Regulärem Ausdruck rausziehen und dann weiter damit arbeiten. Werde mich dann nächste Woche mal ransetzen und ein kleines Java Tool dafür schreiben.
 
Thema:

Meta Daten aus mehreren PDF Dateien auslesen

Meta Daten aus mehreren PDF Dateien auslesen - Ähnliche Themen

OneNote-Notizbuch lokal auf Mac abspeichern - Wer weiss wie?: Hallo Meine Frage: Gibt es die Möglichkeit, OneNote-Notizbücher in irgendeiner Form, beispielsweise als ganzes OneNote-File oder als PDF, lokal...
Einfügen von PDF-Ausdrücken aufgrund fehlenden Buttons nicht mehr möglich: Hallo, seit einigen Wochen habe ich nicht mehr die Möglichkeit, PDF-Ausdrücke in OneNote einzufügen, da mir der „OneNote-Button“ nicht mehr beim...
KB5004745 Cumulatives Update für Win11: Hallo Windows-Insider, Wir sind so aufgeregt, dass so viele von euch die erste Vorschau von Windows 11 ausführen, und wir sind damit beschäftigt...
One Note für Windows 10 startet nicht und hat ungesicherte und defekte Daten: Hallo miteinander, Ich habe auf meinem Surface mit Windows 10 das Problem, dass OneNote (2019?) für Windows 10 über Nacht aufgehört hat, zu...
OneNote App PDFs: Guten Abend zusammen, ich habe mir in der vergangenen Woche ein Surface pro gekauft um es für die Universität zu nutzen. Langsam fühle ich mich...

Sucheingaben

powershell dateiattribute auslesen

,

powershell 5.0 Metadaten auslesen

,

POWERSHELL ERWEITERTE DATEIEIGENSCHAFTEN

,
pdf-datei in powershell anzeigen
, powershell pdf auslesen, pdf metadaten mit vba auslesen, vba metadaten von pdf auslesen, powershell seitenanzahl datei, metadaten von pdf datein auslesen
Oben