文書情報(Document Information)ディクショナリ
PDF構文 [PDF Syntax ISO 32000-2]
PDF1.7は、ISO技術委員会によって2008年1月に“ISO 32000-1規格”として承認されました。2017年7月にはPDF2.0の規格ISO3200-2が承認され、2020年12月にはそれが第二稿に更新されました。
ここでは32000-2規格に基づいたPDF2.0の構文(構造)について説明しています。
PDFファイルは8-bitデータを単位として構成されていて一般の文書編集アプリケーションで開くことができその内容を読取ることができます。ただし、バイナリのデータもそのまま(表示可能な文字に変換されずに)格納されていますので文字化けしているように表示されますが、これはPDFの仕様です。
ここではそのデータの一部を読み解くことでPDF文書へのデータ追加などPDF再構成の意味を説明しPDF StructureやPdftools SDKでのPDFデータ解析や編集をより詳細にできるようにします。
ここでは32000-2規格に基づいたPDF2.0の構文(構造)について説明しています。
PDFファイルは8-bitデータを単位として構成されていて一般の文書編集アプリケーションで開くことができその内容を読取ることができます。ただし、バイナリのデータもそのまま(表示可能な文字に変換されずに)格納されていますので文字化けしているように表示されますが、これはPDFの仕様です。
ここではそのデータの一部を読み解くことでPDF文書へのデータ追加などPDF再構成の意味を説明しPDF StructureやPdftools SDKでのPDFデータ解析や編集をより詳細にできるようにします。
「PDF 構文 メタデータ」<<< >>>「PDF 構文 オブジェクト ストリーム」
「PDF 構文 メタデータ」<<<
>>>「PDF 構文 オブジェクト ストリーム」
9. 文書情報(Document Information) ディクショナリ
文書情報(Document Information)ディクショナリはPDFのトレイラーでInfo項目に記載される省略可能な情報です。
バージョン2.0より以前のPDFファイル形式では文書レベルのメタデータを表すために文書情報(Document Information)ディクショナリを使用していましたが、PDF2.0ではCreationDateとModDateの2つのエントリを除きこのような使用は非推奨となりました。
ドキュメント インフォメーション ディクショナリには、以下の項目が含まれます。
キー | タイプ | 値 | ||||||
---|---|---|---|---|---|---|---|---|
Title | text string | (オプション、PDF2.0では非推奨)文書のタイトル | ||||||
Author | text string | (オプション、PDF2.0では非推奨)文書を作成した人の名前 | ||||||
Subject | text string | (オプション、PDF2.0では非推奨)文書のサブジェクト | ||||||
Keywords | text string | (オプション、PDF2.0では非推奨)文書に関するキーワード | ||||||
Creator | text string | (オプション、PDF2.0では非推奨)PDF以外の形式から変換した場合に、そのオリジナルの作成ツール | ||||||
Producer | text string | (オプション、PDF2.0では非推奨)PDF以外の形式から変換した場合に、その変換ツール | ||||||
CreationDate | 日付 | (Document CatalogにPieceInfoがある場合:必須、他の場合:オプション)文書が生成された日時
注: メタデータ ストリーム内のxmp:CreateDateエントリを文書の作成日時を表すために使用できます。
| ||||||
ModDate | 日付 | (オプション)文書が更新された最終の日時
注: メタデータ ストリーム内のxmp:ModifyDateエントリを文書が最後に変更された日時を表すために使用できます。 | ||||||
Trapped | name | (オプション、PDF2.0では非推奨)文書がトラッピング情報を含むように変更されたかどうかを示す名前オブジェクト
|
オブジェクトのタイプは「2.5オブジェクト」を参照してください。
以下は、文書情報の例です。
2 0 obj << /ModDate (D:20251022901234) /Producer (PDF Creator Trust Software System) >> endobj
PDF Imager-LP(無償版)で「文書情報」を表示するソースコード
C# | C/C++ | Python |
「PDF 構文 メタデータ」<<< >>>「PDF 構文 オブジェクト ストリーム」
「PDF 構文 メタデータ」<<<
>>>「PDF 構文 オブジェクト ストリーム」