iText 7 pdfSweep
pdfSweepを使用すれば、PDF文書の分割やマージだけでなく、PDF文書のデータを安全に削除(編集)することもできます。
How it works
With just a few lines of code you can use the powerful PDF redaction capabilities of pdfSweep to irretrievably remove content. The following example will find and redact all instances of the word "Alice" in a document, regardless of casing:
1
2
3
4
5
try (PdfDocument pdf = new PdfDocument(new PdfReader(SRC), new PdfWriter(new_File(SRC, "redact")))) {
final ICleanupStrategy cleanupStrategy = new RegexBasedCleanupStrategy(Pattern.compile("Alice", Pattern.CASE_INSENSITIVE)).setRedactionColor(ColorConstants.PINK);
final PdfAutoSweep autoSweep = new PdfAutoSweep(cleanupStrategy);
autoSweep.cleanUp(pdf);
}
1
2
3
4
5
PdfDocument pdf = new PdfDocument(new PdfReader(SRC), new PdfWriter(DEST));
ICleanupStrategy cleanupStrategy = new RegexBasedCleanupStrategy(new Regex(@"Alice", RegexOptions.IgnoreCase)).SetRedactionColor(ColorConstants.PINK);
PdfAutoSweep autoSweep = new PdfAutoSweep(cleanupStrategy);
autoSweep.CleanUp(pdf);
pdf.Close();
The original PDF
The redacted PDF
Resources
Here you will find the needed resources to install and use pdfSweep.
Other resources
iText 7 pdfSweepのコア機能
pdfSweepでは、iText 7の文書スタンプとウォーターマークツールを用いてPDF文書を編集する際に介入します。pdfSweepでは、センシティブなテキスト上にデジタルの「黒線」を追加した後、文書のレンダリング指示を変更し、隠したコンテンツが抽出できないようにします。これはテキストにも画像にも動作するので、 文書のセキュリティが徹底的に向上します。さらに、pdfSweepは5行のコードしか使っていないので、PDFワークフローへの統合に頭を悩ませることはほとんどありません。
語句を自動的に削除
正規表現などのパターンに基づいて、文書からテキストの一部分を分割、マージ、削除します。
削除領域のカスタマイズ
デジタル黒線のように、必要に応じてコンテンツを削除する機能を提供します。
安全かつ信頼できる削除
pdfSweepは、PDF文書の表示や印刷を行う際にレンダリングする外観の上で、基礎となるレンダリング命令とデータ構造も処理して、削除した情報が回復不可能であることを確保します。
テキストと画像を部分的に削除
編集領域がコンテンツを部分的に覆っている場合、選択した領域のテキストや画像を削除することができます。
iText 7 pdfSweepを使う理由
コンテンツをただ隠すのではなく、削除します。テキストのみならず画像も編集するので、徹底した機密保持が実現できます。
データを安全に保つ
PDF文書を 開示する前に機密情報や個人情報を削除することができ、 「黒線」での編集と同等のデジタル処理などを使用します。
柔軟なオプション
社会保障番号、日付、IPアドレスなど、一般的なケース用に 事前に定義したパターン一式と一緒に正規表現を使用して、文書全体の編集を自動化します。 座標を用いてカスタム編集領域を定義し、 その中にあるコンテンツを削除します。