| PDFの「隠しテキスト」に注意。黒塗りの下に機密が残っている実例 | |
|---|---|
| 作成日時 26/06/17 (08:19) | View 27 |

企業間の情報共有や行政対応、契約関連のやり取りにおいて、PDFは最も一般的なファイル形式のひとつです。
しかし近年、「黒塗りしたはずの機密情報が、実際にはPDF内部に残っていた」というインシデントが世界中で発生しています。
特に問題となるのが、“見た目だけ”を隠した不適切なマスク処理です。
画面上では確かに黒く塗りつぶされているため、担当者自身も「情報は消えている」と思い込みやすく、気づかないまま外部公開や第三者共有が行われてしまいます。
しかし実際には、
・コピー&ペーストで文字が取得できる
・PDF内部のテキスト層に情報が残っている
・OCRや検索機能で復元できる
編集ソフトで黒塗り部分を削除できる
といったケースが少なくありません。
この記事では、PDFの「隠しテキスト」問題について、
・なぜ発生するのか
・実際にどのような事故が起きているのか
・不適切なマスク処理の典型例
・正しい機密情報抹消の手順
・企業として整備すべき運用ルール
を解説します。
なぜPDFの黒塗り事故は起きるのか
PDFは単なる画像ファイルではありません。
多くのPDFには、
・テキスト情報
・レイヤー構造
・メタデータ
・OCR情報
・コメント
・編集履歴
などが内部に保持されています。
つまり、見た目を黒くしても、内部データが残っていれば情報漏えいは防げません。
特に危険なのが、以下のような処理です。
・PowerPointで黒い図形を重ねる
・ExcelからPDF化後に塗りつぶす
・スクリーンショット感覚で黒線を引く
・PDF編集ソフトで描画だけ行う
これらは「見えなくしただけ」であり、「削除した」わけではありません。
実際に発生した「黒塗り漏えい」事例
1. 政府機関による機密情報漏えい
海外では、政府公開資料に黒塗り処理されたPDFが公開されたものの、コピー&ペーストによって機密情報が抽出できた事例が複数報告されています。
表面上は黒く塗られていても、PDF内部のテキスト層には情報が残っていたためです。
公開文書には、
・関係者名
・内部識別番号
・捜査関連情報
・非公開メールアドレス
などが含まれていたケースもありました。
これは「視覚的マスク」と「データ削除」が別物であることを示す典型例です。
2. 法務資料の開示事故
契約書や訴訟関連文書では、個人情報や金額を伏せたうえで社外共有することがあります。
しかし、
・黒塗り部分を選択できる
・PDF検索でヒットする
・Acrobatで編集すると表示される
といった状態のまま送付されるケースがあります。
法務部門では「紙文化」の延長でPDFを扱うことが多く、「見えなければ安全」という認識が残っている場合があります。
しかし電子ファイルでは、「非表示」と「削除」はまったく異なります。
3. 報道機関・自治体の公開資料事故
公開資料のPDFで、
・マイナンバー
・住所
・電話番号
・職員情報
などが漏えいしたケースもあります。
特に自治体では、
・Excel
・Word
・スキャンPDF
が混在しており、担当者ごとに処理方法が異なることが事故原因になります。
また、「前任者からのやり方を踏襲していた」というケースも珍しくありません。
危険な「見せかけマスク」の典型例
黒い四角形を重ねる
もっとも多い誤操作です。
文字の上に黒い図形を配置しただけでは、背後の文字データは残っています。
その結果、
・コピーで取得可能
・レイヤー除去で表示
・OCR解析で抽出
される場合があります。
画像化されていないPDF
WordやExcel由来のPDFでは、内部にテキスト情報がそのまま保持されています。
つまり、黒塗りしたつもりでも、
・Ctrl+A
・コピー
・テキスト抽出
で全文が取得できることがあります。
コメント・注釈の残存
PDFにはコメント機能があります。
例えば、
・「後で削除予定」
・「ここは伏せる」
・修正履歴
などが残っているケースがあります。
これらは画面上で見えなくても、PDF内部に保持されている場合があります。
OCR情報の残存
スキャンPDFでも安心はできません。
OCR(文字認識)が有効な場合、画像として見えていても内部に検索可能なテキスト層が存在します。
つまり、画像上で黒塗りしても、OCR層に元テキストが残るケースがあります。
「黒塗り」と「削除」は別物
ここは非常に重要です。
多くの担当者は、
「見えなくなった=削除された」
と認識しています。
しかし実際には、
|
処理 |
状態 |
|
黒塗り |
見えないだけ |
|
削除 |
データ自体が存在しない |
という大きな違いがあります。
PDFセキュリティでは、「レンダリング結果」ではなく、「内部構造」を意識する必要があります。
正しいPDF機密情報抹消の手順
では、どのように対応すべきなのでしょうか。
以下は推奨される安全な手順です。
1. 専用の「墨消し(Redaction)」機能を使う
最も重要なのは、専用機能を使うことです。
代表的なPDF編集ソフトには、
・Redaction
・Sanitization
・Remove Hidden Information
などの機能があります。
これらは単なる描画ではなく、
・テキスト削除
・メタデータ除去
・レイヤー除去
・コメント削除
を実施します。
単なる「塗りつぶしツール」とは別物です。
2. 編集後にテキスト検索を行う
処理後は必ず、
・氏名
・メールアドレス
・顧客番号
・契約番号
などを検索してください。
検索でヒットする場合、情報は残っています。
3. コピー&ペースト検証を行う
PDF全体を選択してテキストエディタへ貼り付けます。
ここで機密情報が表示される場合、削除は失敗しています。
これは非常に有効な確認方法です。
4. 「隠し情報削除」機能を利用する
多くのPDFには、
・コメント
・添付ファイル
・JavaScript
・埋め込みオブジェクト
・フォーム情報
などが残っています。
「Remove Hidden Information」などの機能で内部情報を削除してください。
5. 最終的に画像化する
機密性が高い場合は、
1.適切な墨消し
2.PDF再生成
3.画像化
4.再PDF化
まで実施する企業もあります。
これによりテキスト層そのものを排除できます。
ただしOCR再付与には注意が必要です。
企業で整備すべき運用ルール
技術対策だけでは不十分です。
重要なのは「誰でも安全に処理できる運用」を整備することです。
PDF公開前チェックリストを作成する
例えば、
・コピーできないか
・検索できないか
・コメントが残っていないか
・OCR層が残っていないか
・メタデータが残っていないか
などを標準化します。
属人的な確認では事故を防げません。
「黒塗り禁止」を明文化する
「図形で隠す行為は禁止」というルールを定めるだけでも効果があります。
現場では、
・PowerPoint
・Excel
・Teams画面キャプチャ
感覚で処理されることが少なくありません。
禁止事項を明確化することが重要です。
使用ツールを統一する
部署ごとに異なるツールを使うと、操作品質がばらつきます。
例えば、
・無料PDF編集ソフト
・ブラウザ変換
・オンラインPDFサービス
などは機能差が大きく、危険です。
企業として推奨ツールを統一しましょう。
外部公開前レビューを設ける
広報資料・IR資料・法務文書などは、第三者レビューを設けるべきです。
「本人確認のみ」は非常に危険です。
特に、
・M&A関連
・顧客情報
・セキュリティ事故報告
・行政提出資料
ではダブルチェックが望まれます。
PDFの隠し情報は攻撃者にも狙われる
ここで重要なのは、こうした情報が単なる“ミス”で終わらないことです。
攻撃者は公開PDFを積極的に収集しています。
なぜならPDFには、
・組織構造
・社員名
・メール形式
・内部システム名
・契約情報
・拠点情報
など、攻撃準備に有用な情報が含まれるためです。
特にOSINT(公開情報収集)では、PDFは非常に価値の高い情報源として扱われます。
漏えいしたPDFはダークウェブにも流通する
一度公開されたPDFは、
・キャッシュ
・アーカイブサイト
・データ収集サービス
・ダークウェブフォーラム
などへ拡散する場合があります。削除しても完全回収は困難です。
また、攻撃者は漏えい情報を組み合わせ、
・フィッシング
・なりすまし
・BEC(ビジネスメール詐欺)
・初期侵入
に悪用するケースがあります。
つまりPDFの黒塗り事故は、単なる「公開ミス」ではなく、サイバー攻撃の足掛かりになり得ます。
まとめ
PDFの黒塗り処理は、「見えなくする」だけでは不十分です。
重要なのは、「内部データとして存在しない状態にする」ことです。
特に企業では、
・契約書
・IR資料
・顧客資料
・行政提出文書
・セキュリティ事故報告
など、機密情報を含むPDFを日常的に扱っています。
そのため、
・正しいRedaction機能の利用
・公開前検証
・ツール統一
・運用ルール整備
が不可欠です。
また近年は、公開PDFから情報収集を行う攻撃者も増えています。
自社の機密情報や内部情報が、
・ダークウェブ
・漏えいフォーラム
・OSINTデータベース
で流通していないかを継続的に監視することも重要です。
特に、
・自社ドメイン
・社員メールアドレス
・契約関連情報
・過去公開資料
などが攻撃準備に利用されるケースもあります。
PDFの管理は、単なる文書管理ではなく、企業全体の情報セキュリティ対策の一部として見直す必要があります。