Meta Daten aus mehreren PDF Dateien auslesen

Diskutiere Meta Daten aus mehreren PDF Dateien auslesen im Windows 10 Software Forum im Bereich Windows 10 Foren; Hallo, ich bin auf der Suche nach einer Möglichkeit um aus mehreren PDF Dateien Meta Infos wie die Seitenanzahl und den Flächeninhalt auszulesen. Um das ...


+ Antworten + Neues Thema erstellen
Ergebnis 1 bis 5 von 5
  1. #1
    Standardavatar
    Version
    Pro 1703

    Meta Daten aus mehreren PDF Dateien auslesen

    Hallo,

    ich bin auf der Suche nach einer Möglichkeit um aus mehreren PDF Dateien Meta Infos wie die Seitenanzahl und den Flächeninhalt auszulesen.

    Um das ganze zu Präzisieren:
    In einem Ordner befinden sich 1...n PDF Dateien.
    Die PDFs haben unterschiedliche Seitenanzahlen und auch Formate. Die Formate sind teilweise keine DIN Standards und teilweise unterscheiden sich die Formate von Seite zu Seite innerhalb eines PDFs.

    Ich suche jetzt eine Möglichkeit um für alle PDFs in einem Ordner den gesamten Flächeninhalt komfortabel auszulese, ohne jede PDF öffnen zu müssen und für jede Seite die Maße rausschreiben zu müssen.

    Weiß eventuell jemand da eine Software für oder eine andere Methode?
    Ich hoffe ich konnte mich einigermaßen verständlich ausdrücken. Bei Unklarheiten versuche ich auch gerne das noch weiter zu beschreiben.

    Schon mal vielen Dank.

  2. Hi,

    schau dir mal diesen Ratgeber an. Dort findet man viele Hilfestellungen.
    Registrieren bzw. einloggen, um diese und auch andere Anzeigen zu deaktivieren
  3. #2
    Avatar von areiland
    Version
    Windows 10 Pro x64 Build 1607 14393
    System
    970M Pro3,FX6350,ATI 7730,16GB DDR3 1600,SSD256 GB,MK7559GSXP,SH224BB

    Meta Daten aus mehreren PDF Dateien auslesen

    Lies mal das hier: Katalog eines HDD vom Explorer in eine Liste! Da hatte ich eine Methode gezeigt, wie man per Powershell auch die erweiterten Dateieigenschaften auslesen und weiter verarbeiten kann. Wenn die von Dir gewünschten Eigenschaften so darstellbar sind, dann ließen sie sich z.B. auch als Liste (Html, Csv. Txt, etc) speichern.

  4. #3
    Threadstarter
    Standardavatar
    Version
    Pro 1703

    Meta Daten aus mehreren PDF Dateien auslesen

    Danke für die Info. Das bringt mich allerdings leider nicht weiter, da diese Informationen dort nicht aufgeführt sind. Wahrscheinlich ist der Begriff Metadaten auch schlecht gewählt.

    Aber die nötigen Angaben stehen im Klartext in den PDF Dateien. Für jede Seite extra. Da müsste ich mir die dann auslesen und aufaddieren.
    Ich hatte

  5. #4
    Avatar von areiland
    Version
    Windows 10 Pro x64 Build 1607 14393
    System
    970M Pro3,FX6350,ATI 7730,16GB DDR3 1600,SSD256 GB,MK7559GSXP,SH224BB

    Meta Daten aus mehreren PDF Dateien auslesen

    Wenn Du spezifizieren kannst, wo sie genau stehen dann geht das natürlich. Dafür böte die Powershell "Get-content" an, mit dem man sich Zeilen einer Datei direkt anzeigen lassen kann. Mit dem Parameter "-head n" kann man sich eine beliebige Anzahl der Zeilen vom Dateiheader aus auflisten lassen, mit "-tail n" ginge das vom Dateiende her. Experimente mal damit, vielleicht bringt Dir das eine Lösung des Problems.

    Eine Beispielzeile wäre: get-content -path D:\pdf\*.pdf -head 10, die von allen PDF-Dateien in D:\PDF die ersten 10 Headerzeilen auflistet.

  6. #5
    Threadstarter
    Standardavatar
    Version
    Pro 1703

    Meta Daten aus mehreren PDF Dateien auslesen

    Hi,
    danke schön für die Infos.

    Leider kann ich nicht genau sagen wo die Infos in der Datei stehen. Die scheinen soweit ich das bis jetzt überblicke für jede Seite der PDF angegeben zu sein. Ich muss also die gesamte Datei auswerten. Aber ich weiß jetzt wie der Aufbau der Angaben ist und denke ich kann mir das dann per Regulärem Ausdruck rausziehen und dann weiter damit arbeiten. Werde mich dann nächste Woche mal ransetzen und ein kleines Java Tool dafür schreiben.


Meta Daten aus mehreren PDF Dateien auslesen

Meta Daten aus mehreren PDF Dateien auslesen - Ähnliche Themen


  1. Word bestimmte Daten aus Excel auslesen lassen: Guten Tag Ich muss für jeden Wochentag einen "Tagesbefehl" schreiben. Jeder Tagesbefehl ist ein einzelnes Dokument. Darin wird erwähnt, wer an...



  2. Edge öffnet keine Dateien (Word, Excel und auch PDF) nicht mehr aus dem Sharepoint: Hallo Community! Wenn ich ein Dokument aus unserem Sharepoint 2013 direkt öffnen möchte, bekomme ich im Edge-Browser die Meldung: "Der Inhalt...



  3. Meta-Daten in WAV-Dateien eintragen, anzeigen, ändern: Ich archiviere meine Musik-CDs i.d.R. immer als WAV-Dateien. Ggf. zusätzlich noch als MP3-Dateien. Bei WAV-Dateien hat man gegenüber der CD keinerlei...



  4. Daten im ADS auslesen: Hi, Ich habe testweise mal ein .jpg in einem anderen .jpg versteckt, allerdings weiß ich nicht wie ich die .jpg öffnen kann, welche ich in einer...



  5. Übernahme von Daten aus mehreren Datendateien in bereits vorhandene Tabellen (generiert aus Vorlage): Guten Abend, ich habe ein Problem, bei dem ich Euch um Mithilfe zur Lösung bitte. In einer Datei befinden sich drei Tabellen mit Daten (Dat1,...


Stichworte