TOP > Poppler ツール > *
概要
PDFの文書と各ページに関する情報を画面上に表示します。
※Manuals を参考に自分用のメモとして残します。
Pdfinfo のヘルプ
Poppler Versio 0.45 を使用してHelp を表示した場合です。
001 >pdfinfo -h
002 pdfinfo version 0.45.0
003 Copyright 2005-2016 The Poppler Developers - http://poppler.freedesktop.org
004 Copyright 1996-2011 Glyph & Cog, LLC
005 Usage: pdfinfo [options] <PDF-file>
006 -f <int> : first page to convert
007 -l <int> : last page to convert
008 -box : print the page bounding boxes
009 -meta : print the document metadata (XML)
010 -js : print all JavaScript in the PDF
011 -struct : print the logical document structure (for tagged files)
012 -struct-text : print text contents along with document structure (for tagged files)
013 -isodates : print the dates in ISO-8601 format
014 -rawdates : print the undecoded date strings directly from the PDF file
015 -enc <string> : output text encoding name
016 -listenc : list available encodings
017 -opw <string> : owner password (for encrypted files)
018 -upw <string> : user password (for encrypted files)
019 -v : print copyright and version info
020 -h : print usage information
021 -help : print usage information
022 --help : print usage information
023 -? : print usage information
Highlight:プログラミング言語のソースコードを構文で色分け (GUI編)
形式
pdfinfo [options] <PDF-file>
これ以降は各種 option の説明です。
-f <int>
PDFのページ情報出力をする時に対象とするページ範囲の最初の番号を指定します。基本的に「 -l 」と対で使用します。無指定は最初からの扱いになります。
例:
5頁から10頁までのBOX情報を表示
pdfinfo -f 5 -l 10 -box abcd.pdf
-l <int>
PDFのページ情報出力をする時に対象とするページ範囲の最後の番号を指定します。基本的に「 -f 」と対で使用します。無指定は最後までの扱いになります。
例:
5頁から7頁までのページサイズ情報を表示
pdfinfo -f 3 -l 7 abcd.pdf
-box
ページのバウンディングボックスを表示。MediaBox, CropBox, BleedBox, TrimBox, and ArtBox。
001 I:¥Tools¥Run¥Poppler-0.45¥bin>pdfinfo -f 1 -l 3 -box test.pdf
002 Title: Title
003 Subject: Subject
004 Keywords: Keywords
005 Author: Author
006 Creator: Creator
007 Producer: My Producer
008 CreationDate: 07/17/52 22:50:04 東京 (標準時)
009 ModDate: 07/17/52 22:50:04 東京 (標準時)
010 Tagged: no
011 UserProperties: no
012 Suspects: no
013 Form: none
014 JavaScript: no
015 Pages: 16
016 Encrypted: no
017 Page 1 size: 480 x 453.12 pts
018 Page 1 rot: 0
019 Page 2 size: 458.88 x 480.96 pts
020 Page 2 rot: 0
021 Page 3 size: 1104 x 991 pts
022 Page 3 rot: 0
023 Page 1 MediaBox: 0.00 0.00 480.00 453.12
024 Page 1 CropBox: 0.00 0.00 480.00 453.12
025 Page 1 BleedBox: 0.00 0.00 480.00 453.12
026 Page 1 TrimBox: 0.00 0.00 480.00 453.12
027 Page 1 ArtBox: 0.00 0.00 480.00 453.12
028 Page 2 MediaBox: 0.00 0.00 458.88 480.96
029 Page 2 CropBox: 0.00 0.00 458.88 480.96
030 Page 2 BleedBox: 0.00 0.00 458.88 480.96
031 Page 2 TrimBox: 0.00 0.00 458.88 480.96
032 Page 2 ArtBox: 0.00 0.00 458.88 480.96
033 Page 3 MediaBox: 0.00 0.00 1104.00 991.00
034 Page 3 CropBox: 0.00 0.00 1104.00 991.00
035 Page 3 BleedBox: 0.00 0.00 1104.00 991.00
036 Page 3 TrimBox: 0.00 0.00 1104.00 991.00
037 Page 3 ArtBox: 0.00 0.00 1104.00 991.00
038 File size: 196307 bytes
039 Optimized: no
040 PDF version: 1.4
Highlight:プログラミング言語のソースコードを構文で色分け (GUI編)
- MediaBox : メディアボックス
ページ内の余白を含まない領域です。 - CropBox : クロックボックス
ページの余白も含んだ可視領域です。 - BleedBox : 裁ち落としサイズ
印刷専門業者が扱うサイズです。 - TrimBox : 仕上がりサイズ
印刷専門業者が扱うサイズです。 - ArtBox :
PDFページを画像に変換する時の領域です。
-meta
文書レベルのメタデータを表示。(PDFのCatalogオブジェクトからメタデータ( XML )のストリーム)
メタデータに2バイト文字が存在すると文字化けの状態でDos画面に表示されます。但し標準出力をリダイレクトに変えてテキストファイルへ出力し、文字コードを自動判別できるエディタで表示すれば日本語表示は可能です。プログラム内での処理が未確認です。
-js
PDF内のすべてのJavaScriptを表示します。
例:14行目の「yes」でJavaScriptの存在有り。23行目からJavascriptコードが表示される。
001 I:¥Tools¥Run¥Poppler-0.45¥bin>pdfinfo -js test-js.pdf
002 Title: Title
003 Subject: Subject
004 Keywords: Keywords
005 Author: Author
006 Creator: Creator
007 Producer: My Producer
008 CreationDate: 07/17/52 21:35:42 東京 (標準時)
009 ModDate: 12/16/62 04:35:49 東京 (標準時)
010 Tagged: no
011 UserProperties: no
012 Suspects: no
013 Form: none
014 JavaScript: yes
015 Pages: 16
016 Encrypted: no
017 Page size: 480 x 453.12 pts
018 Page rot: 0
019 File size: 201076 bytes
020 Optimized: no
021 PDF version: 1.4
022
023 Before Close Document:
024 var abc = 123;
025
026 After Print Document:
027 var bcd = 999;
Highlight:プログラミング言語のソースコードを構文で色分け (GUI編)
-struct
論理文書構造を表示します。(タグ付きファイルの場合)
-struct-text
文書構造と一緒にテキストコンテンツを表示します。(タグ付きファイルの場合)
-isodates
ISO-8601形式で日付を表示します。
例 -isodates 未指定時:
CreationDate: 07/17/52 23:49:26 東京 (標準時)
ModDate: 07/17/52 23:49:26 東京 (標準時)
例 -isodates 指定時:
CreationDate: 2006-01-24T11:17:41-08
ModDate: 2006-01-24T11:17:41-08
-rawdates
PDF ファイルから直接デコードされていない日付文字列を表示します。
例 -rawdates 未指定時:
CreationDate: 07/17/52 22:24:24 東京 (標準時)
ModDate: 12/16/62 05:24:31 東京 (標準時)
例 -rawdates 指定時:
CreationDate: D:20060124111741-08'00'
ModDate: D:20160624111748+09'00'
-enc <string>
出力テキストのエンコーディング名を指定します。デフォルトは UTF-8。
Xpdf の日本語の言語ファイルをインストールしたら使えそですが、EUC-JP , Shift-JIS , ISO-2022-JP はPopplerでは使えませんでした。PopplerはXpdfの拡張版なので同様の手順でインストールできそうですが、成功しませんでした。※他のサイトで出来た、と言う情報有り。
-listenc
利用可能なエンコーディング名の一覧を表示します。以下は言語ファイルをインストールする前の状態です。
001 I:¥Tools¥Run¥Poppler-0.45¥bin>pdfinfo -listenc
002 Available encodings are:
003 UCS-2
004 ASCII7
005 Latin1
006 UTF-8
007 ZapfDingbats
008 Symbol
Highlight:プログラミング言語のソースコードを構文で色分け (GUI編)
-opw <string>
暗号化されたファイルのオーナーパスワードを指定します。
-upw <string>
暗号化されたファイルのユーザーパスワードを指定します。
-v
著作権とバージョン情報を表示します。
-h , -help , --help , -?
形式、引数などの使用方法を簡単に表示します。
終了コード
Pdfinfo ツールは次の終了コードを返します。
- 0 : エラー無し
- 1 : 入力PDFファイルを開く時にエラーが発生した
- 2 : 出力ファイルを開く時にエラーが発生した
- 3 : 入力PDFファイルのアクセス権に関連するエラーが発生した
- 99 : その他のエラー
VBA関数からの起動
以下のVBA関数を利用してPoppler の Pdfinfo.exe をコマンドライン起動できます。
< Poppler へ戻る >