Adobe TrustMark技術の解説
truvisが採用しているAdobe TrustMarkは、ディープラーニングを活用した最先端の不可視電子透かし技術です。本記事では、TrustMarkの技術的な仕組みや特徴、従来の電子透かし技術との違いを詳しく解説します。
Adobe TrustMarkとは
Adobe TrustMarkは、Adobeが2023年に発表したオープンソースの電子透かし技術です。Content Authenticity Initiative(CAI)の一環として開発され、デジタルコンテンツの信頼性と来歴を確保するための技術基盤の一つです。 従来の電子透かし技術がルールベースのアルゴリズム(DCT変換、DWT変換など)を使用していたのに対し、TrustMarkはニューラルネットワークを活用したエンコーダー・デコーダーアーキテクチャを採用しています。
技術的な仕組み
エンコーダー(埋め込み)
エンコーダーは、入力画像とペイロード(埋め込みたい情報)を受け取り、ペイロードが埋め込まれた画像を出力します。ニューラルネットワークが画像の内容を解析し、視覚的に目立ちにくい領域に情報を分散して埋め込みます。これにより、人間の目では元画像との違いを認識できないレベルの画質を維持できます。
デコーダー(検出)
デコーダーは、画像からペイロードを抽出するネットワークです。画像が圧縮やリサイズなどの処理を受けていても、埋め込まれた情報を高い精度で復元できます。
TrustMarkの特徴
高い画質維持
TrustMarkは、PSNR(ピーク信号対雑音比)で40dB以上の画質を維持します。これは、人間の目では元画像と透かし入り画像の違いを区別できないレベルです。
耐久性(ロバスト性)
JPEG圧縮、リサイズ、クロップ、スクリーンショットなど、一般的な画像処理や変換に対して高い耐性を持ちます。SNSへの投稿による画像の再圧縮後でも、透かしを検出できるケースが多いです。
オープンソース
TrustMarkはオープンソースとして公開されており、誰でも利用・検証できます。透明性が高く、技術の信頼性を第三者が確認できます。
従来技術との比較
| 特徴 | 従来手法(DCT/DWT) | TrustMark |
|---|---|---|
| 埋め込み方式 | 周波数領域の係数操作 | ニューラルネットワーク |
| 画質維持 | 中〜高 | 非常に高い |
| 耐久性 | 中程度 | 高い |
| 容量 | 少ない | 最大100ビット |
truvisでの実装
truvisでは、Adobe TrustMarkの技術をWebブラウザから手軽に利用できる形で提供しています。専門的なプログラミング知識がなくても、画像をアップロードして透かし文字を入力するだけで、不可視電子透かしの埋め込みと検出が可能です。
TrustMarkの技術的詳細
TrustMarkのエンコーダーは、入力画像を畳み込みニューラルネットワーク(CNN)で特徴量に変換し、ペイロードのビット列と組み合わせて透かし入り画像を生成します。この際、知覚損失関数(Perceptual Loss)を使用して、人間の視覚特性に基づいた画質維持を実現しています。 デコーダーは、透かし入り画像から特徴量を抽出し、元のペイロードを復元するネットワークです。訓練時にはJPEG圧縮、リサイズ、ノイズ付加、クロップなどの攻撃シミュレーションが組み込まれており、これにより実世界での高い耐久性を獲得しています。 TrustMarkの論文「TrustMark: Universal Watermarking for Arbitrary Resolution Images」は、2023年に発表され、従来手法を上回る性能を実証しました。特にビットアキュラシー(埋め込んだ情報の復元精度)において、従来手法の90%程度に対して、TrustMarkは98%以上の精度を達成しています。
他の電子透かし技術との詳細比較
StegaStamp
StegaStampは2019年に発表されたディープラーニングベースの電子透かし技術です。物理的な印刷・撮影サイクルに耐えることを目的としており、紙に印刷された画像をカメラで撮影しても透かしを検出できます。ただし、TrustMarkと比較して画質維持の面でやや劣ります。
HiDDeN
HiDDeNは、エンコーダー・ノイズレイヤー・デコーダーの3段階構成を持つ初期のディープラーニング方式です。TrustMarkのアーキテクチャの基礎となった手法の一つですが、容量と耐久性の両面でTrustMarkに改善されています。
従来の周波数領域方式(DCT/DWT)
DCT(離散コサイン変換)やDWT(離散ウェーブレット変換)を用いた従来方式は、数十年の歴史を持つ確立された技術です。アルゴリズムが単純で計算コストが低いという利点がありますが、容量が少なく、複合的な画像処理に対する耐性が限定的です。