Poppler : Pdfinfo の使い方

TOP > Poppler ツール > *


四継ぎ獅子

概要

PDFの文書と各ページに関する情報を画面上に表示します。

※Manuals を参考に自分用のメモとして残します。

Pdfinfo のヘルプ

Poppler Versio 0.45 を使用してHelp を表示した場合です。

001 >pdfinfo -h 002 pdfinfo version 0.45.0 003 Copyright 2005-2016 The Poppler Developers - http://poppler.freedesktop.org 004 Copyright 1996-2011 Glyph & Cog, LLC 005 Usage: pdfinfo [options] <PDF-file> 006 -f <int> : first page to convert 007 -l <int> : last page to convert 008 -box : print the page bounding boxes 009 -meta : print the document metadata (XML) 010 -js : print all JavaScript in the PDF 011 -struct : print the logical document structure (for tagged files) 012 -struct-text : print text contents along with document structure (for tagged files) 013 -isodates : print the dates in ISO-8601 format 014 -rawdates : print the undecoded date strings directly from the PDF file 015 -enc <string> : output text encoding name 016 -listenc : list available encodings 017 -opw <string> : owner password (for encrypted files) 018 -upw <string> : user password (for encrypted files) 019 -v : print copyright and version info 020 -h : print usage information 021 -help : print usage information 022 --help : print usage information 023 -? : print usage information


 Highlight:プログラミング言語のソースコードを構文で色分け (GUI編)
 

形式

pdfinfo [options] <PDF-file>

これ以降は各種 option の説明です。

-f <int>

PDFのページ情報出力をする時に対象とするページ範囲の最初の番号を指定します。基本的に「 -l 」と対で使用します。無指定は最初からの扱いになります。

例:

5頁から10頁までのBOX情報を表示

pdfinfo -f 5 -l 10 -box abcd.pdf

-l <int>

PDFのページ情報出力をする時に対象とするページ範囲の最後の番号を指定します。基本的に「 -f 」と対で使用します。無指定は最後までの扱いになります。

例:

5頁から7頁までのページサイズ情報を表示

pdfinfo -f 3 -l 7 abcd.pdf

-box

ページのバウンディングボックスを表示。MediaBox, CropBox, BleedBox, TrimBox, and ArtBox。

001 I:¥Tools¥Run¥Poppler-0.45¥bin>pdfinfo -f 1 -l 3 -box test.pdf 002 Title: Title 003 Subject: Subject 004 Keywords: Keywords 005 Author: Author 006 Creator: Creator 007 Producer: My Producer 008 CreationDate: 07/17/52 22:50:04 東京 (標準時) 009 ModDate: 07/17/52 22:50:04 東京 (標準時) 010 Tagged: no 011 UserProperties: no 012 Suspects: no 013 Form: none 014 JavaScript: no 015 Pages: 16 016 Encrypted: no 017 Page 1 size: 480 x 453.12 pts 018 Page 1 rot: 0 019 Page 2 size: 458.88 x 480.96 pts 020 Page 2 rot: 0 021 Page 3 size: 1104 x 991 pts 022 Page 3 rot: 0 023 Page 1 MediaBox: 0.00 0.00 480.00 453.12 024 Page 1 CropBox: 0.00 0.00 480.00 453.12 025 Page 1 BleedBox: 0.00 0.00 480.00 453.12 026 Page 1 TrimBox: 0.00 0.00 480.00 453.12 027 Page 1 ArtBox: 0.00 0.00 480.00 453.12 028 Page 2 MediaBox: 0.00 0.00 458.88 480.96 029 Page 2 CropBox: 0.00 0.00 458.88 480.96 030 Page 2 BleedBox: 0.00 0.00 458.88 480.96 031 Page 2 TrimBox: 0.00 0.00 458.88 480.96 032 Page 2 ArtBox: 0.00 0.00 458.88 480.96 033 Page 3 MediaBox: 0.00 0.00 1104.00 991.00 034 Page 3 CropBox: 0.00 0.00 1104.00 991.00 035 Page 3 BleedBox: 0.00 0.00 1104.00 991.00 036 Page 3 TrimBox: 0.00 0.00 1104.00 991.00 037 Page 3 ArtBox: 0.00 0.00 1104.00 991.00 038 File size: 196307 bytes 039 Optimized: no 040 PDF version: 1.4


 Highlight:プログラミング言語のソースコードを構文で色分け (GUI編)
 

  • MediaBox : メディアボックス
    ページ内の余白を含まない領域です。
  • CropBox : クロックボックス
    ページの余白も含んだ可視領域です。
  • BleedBox : 裁ち落としサイズ
    印刷専門業者が扱うサイズです。
  • TrimBox : 仕上がりサイズ
    印刷専門業者が扱うサイズです。
  • ArtBox : 
    PDFページを画像に変換する時の領域です。

-meta

文書レベルのメタデータを表示。(PDFのCatalogオブジェクトからメタデータ( XML )のストリーム)

メタデータに2バイト文字が存在すると文字化けの状態でDos画面に表示されます。但し標準出力をリダイレクトに変えてテキストファイルへ出力し、文字コードを自動判別できるエディタで表示すれば日本語表示は可能です。プログラム内での処理が未確認です。

-js

PDF内のすべてのJavaScriptを表示します。

例:14行目の「yes」でJavaScriptの存在有り。23行目からJavascriptコードが表示される。

001 I:¥Tools¥Run¥Poppler-0.45¥bin>pdfinfo -js test-js.pdf 002 Title: Title 003 Subject: Subject 004 Keywords: Keywords 005 Author: Author 006 Creator: Creator 007 Producer: My Producer 008 CreationDate: 07/17/52 21:35:42 東京 (標準時) 009 ModDate: 12/16/62 04:35:49 東京 (標準時) 010 Tagged: no 011 UserProperties: no 012 Suspects: no 013 Form: none 014 JavaScript: yes 015 Pages: 16 016 Encrypted: no 017 Page size: 480 x 453.12 pts 018 Page rot: 0 019 File size: 201076 bytes 020 Optimized: no 021 PDF version: 1.4 022 023 Before Close Document: 024 var abc = 123; 025 026 After Print Document: 027 var bcd = 999;


 Highlight:プログラミング言語のソースコードを構文で色分け (GUI編)
 

-struct

論理文書構造を表示します。(タグ付きファイルの場合)

-struct-text

文書構造と一緒にテキストコンテンツを表示します。(タグ付きファイルの場合)

-isodates

ISO-8601形式で日付を表示します。

例 -isodates 未指定時:
CreationDate:   07/17/52 23:49:26 東京 (標準時)
ModDate:        07/17/52 23:49:26 東京 (標準時)

例 -isodates 指定時:
CreationDate:   2006-01-24T11:17:41-08
ModDate:        2006-01-24T11:17:41-08

-rawdates

PDF ファイルから直接デコードされていない日付文字列を表示します。

例 -rawdates 未指定時:
CreationDate:   07/17/52 22:24:24 東京 (標準時)
ModDate:        12/16/62 05:24:31 東京 (標準時)

例 -rawdates 指定時:
CreationDate:   D:20060124111741-08'00'
ModDate:        D:20160624111748+09'00'

-enc <string>

出力テキストのエンコーディング名を指定します。デフォルトは UTF-8。

Xpdf の日本語の言語ファイルをインストールしたら使えそですが、EUC-JP , Shift-JIS , ISO-2022-JP はPopplerでは使えませんでした。PopplerはXpdfの拡張版なので同様の手順でインストールできそうですが、成功しませんでした。※他のサイトで出来た、と言う情報有り。

-listenc

利用可能なエンコーディング名の一覧を表示します。以下は言語ファイルをインストールする前の状態です。

001 I:¥Tools¥Run¥Poppler-0.45¥bin>pdfinfo -listenc 002 Available encodings are: 003 UCS-2 004 ASCII7 005 Latin1 006 UTF-8 007 ZapfDingbats 008 Symbol


 Highlight:プログラミング言語のソースコードを構文で色分け (GUI編)
 

-opw <string>

暗号化されたファイルのオーナーパスワードを指定します。

-upw <string>

暗号化されたファイルのユーザーパスワードを指定します。

-v

著作権とバージョン情報を表示します。

-h , -help , --help , -?

形式、引数などの使用方法を簡単に表示します。

終了コード

Pdfinfo ツールは次の終了コードを返します。

  • 0 : エラー無し
  • 1 : 入力PDFファイルを開く時にエラーが発生した
  • 2 : 出力ファイルを開く時にエラーが発生した
  • 3 : 入力PDFファイルのアクセス権に関連するエラーが発生した
  • 99 : その他のエラー

VBA関数からの起動

以下のVBA関数を利用してPoppler の Pdfinfo.exe をコマンドライン起動できます。 

< Poppler へ戻る >

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA



SAMURAI Plugin

コメントをする時は出来れば以下もお願いします。

  • OS名 バージョン
  • Acrobat バージョン
  • ツール(Excel等) バージョン
コメントにサンプルコードを入れる時はコードを全て全角文字列にしてください。コチラで半角に戻します。それでもエラーが回避できない時はコメント下さい。個別に対処します。



お仕事で当サイトを見ている方へ
考え込んだら、ご質問下さい。
一緒に解決策を考えましょう。

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください