andyman1764

科学をハックする

このブログは、科学技術に関してより的確・迅速に新しい情報を提供するものです。 また、このコーナーでは皆さんから忌憚のないご意見を頂き、より良いブログとして改善しながら充実した内容に作り仕上げて行くことにありますので、どんなことでも結構ですのでご意見を頂きますようご協力をお願いします。 参加メンバーを募りますので、遠慮なくご連絡ください。

このブログは、新しい世代の若者を主な対象として掲載します。
特に理科系に強くなれることを目標に、できるだけわかりやすく説明します。
掲載する内容は、画像表現技術、宇宙論、量子工学などについてです。
読者の皆さんとの双方向のコミュニケーションをとりたいと考えておりますので、どんどん参加して、忌憚のないご意見を頂けると幸甚です。
21 Dec

カラマネの基礎知識 No.3361


カラマネの基礎知識 〜最終回〜
 カラーマネージメント(CMS)の定義には、「広義の意味」と「狭義の意味」があり、その意味は、下図の通りです。現状でのCMSは、どちらかといえば狭義の意味で運用されています。
7-0-115-1

要約しますと、
・ディスプレイやプリンタなど物理的デバイスが理論的なカラースペース内で再現できる領域をガモットといい、各デバイスによって固有なものである。
・カラーの入出力機器の発色の仕組みや、利用目的や、置かれている環境はそれぞれ固有であり、管理されていない装置間では相似の色の再現はできない。
・デバイスインディペンデントカラーは、画像の入力から出力までの工程全体で、個々の機器に依存しない一貫した色再現を目指す。これを実現するために、CIEなどの標準的なカラースペースをデータの基準にする。この基準値を個々の機器のカラースペースに適正にマッピングするために、機器ごとに補正値を用意して色再現を行う。
・発色の仕組みによる特性を捉えるキャラクタライゼーションによって、装置の色を決めている要因と値をデータ化したデバイスプロファイルを作る。これは装置開発をするベンダーが用意する。
・機器の発色は変動するので、各装置の特性をデータ化したときの値を基準にして、使用中のデータを計測して基準値に合わせ込むキャリブレーションを行う。
・色評価を行う環境は標準光源を用い、また外部の色の映り込みを排して、色評価条件を一定に保つ。
・DTPにおけるカラーマネージメントの目的は、印刷再現の予測であり、画面では紙で再現できる範囲の色だけが表示できればよいが、電子出版では離れたモニタ間でも色が相似になる仕組みとして使われる。
などが挙げられます。

現在では、まだ「狭義の意味」でしか運用されていませんでしたが、今後は、究極の目的を達成するために「広義の意味」を目指し、「思い通りの画像」を創出するために何をすべきかを真剣に考える必要があります。これを実現するために可能な限りの技術手段や手法(テクニック)を醸成することによって、映像関連の新たな文化が創生されることが期待できることでしょう。

これまで、カラーマネージメントに特化して、いろいろと新しい情報を提供してきましたが、如何でしたでしょうか?
現在に至るまで「カラマネ(CMS)の基礎知識」というテーマで約2年半(2010年4月からスタート)という長期にわたって情報を提供してきましたが、今回が最終回となります。ただし、ブログ全体年としては、2005年11月から2012年12月までの約7年間継続。
今までお付き合いをして頂きました読者に、心よりお礼を申し上げます。
更に、デジタルカメラ、モニタ、プリンタとういういわば三種の神器を使った色再現をみても、物理的な法則に従うために、思ったより色合わせが難しくなります。
最終的には、限りなく近似した色で置き換えて(これを色域圧縮と言います)、一応満足できる色として仕上げていくプロセスが重要になります。

長い間、お読み頂きまして、誠にありがとうございました。

14 Dec

カラマネの基礎知識 No.335

CMS理論-114

カラマネのまとめ 〜その3 〜
・カラーマネージメントの今後の発展

 カラーマネージメントシステムは、奇麗な色を出したり、思った通りの色を創出するのではなく、あくまでも忠実な色再現を行うことが目的になっています。そういった意味で限界があるのです。
今後は、これらの問題を解決するために、更なる研究を進め、よりマッチした新しいカラーマネージメントシステムを構築できるように新しい仕組みを開発する必要があります。
7-0-114-1

その手段の1つとして、「管理」から「創造」へと転換しなければならないと考えます。
つまり、「イメージクリエーション」(概念は上図参照)を思考し、推進して行くことだと考えています。
そして、画像形成に必要な全てのファクタを関連付けて新しい画像の世界を醸し出すことを今後のテーマとして、ステップアップを図るようにすべきであると確信します。
イメージクリエーションの発展形は、映像部門にのみ限定しても、下図に示しましたように、これからの新しい文化の発展にかかってきます。従って、これらに関わる全ての人達の弛まない努力と揺るぎのない発展を目指すことに他なりません。
7-0-114-2




7 Dec

カラマネの基礎知識 No.3341

CMS理論-113

カラマネのまとめ ~ その2 〜
・カラーマネージメントの概念とその本質

 これまで「WYSIWYG」という言葉は、DTPの登場の時期に多用されました。これは、
What you see is what you get. の頭文字を採ったもので、「現在、(モニタ表示で)見ている画像が、最終的に(成果物として)得られる画像である。」という意味になります。
かつて使われていたWYSIWYGとは、ページの大きさや罫線の大きさ、書体形状や文字の並びなど、どちらかというと空間的な意味合いでしたが、Color WYSIWYGになってからは、色的・階調的な意味合いを持つ意味で使われるようになりました。(下図参照)
7-0-113-1

 カラーマネージメントシステムを導入すれば、現在使われているモニタ上の色が再現されるという保障がありますので、失敗を恐れずもっと気楽に色を作って(創って)も良いはずです。絶対に再現出来ない色は使うべきではありませんが、コンピュータが色を管理しているので都合の悪い場合にはそのことを利用者に教えてくれますし、その色を表現させないようにコントロールすることも出来ます。このことは、画像処理でも同じで、カラーの「数値を読む」能力がないとプロではないといえなくもありませんが、ことさら神経質に数値を読まなくとも、「現在モニタで見たものが、正しく再現できるのだから良い」と気楽に画像処理やデザインに臨んで頂きたい。特にアートに指向する場合には、このことが大変重要だと考えます。
 カラーマネージメントを行うということは、下図に示す通り、本来の画像データの色を、複数のモニタ同士や、モニタとカラースペースの違うプリンタ、プリンタと色材の違う印刷機など各デバイス(機器)で同じように伝え再現することが目的です。従って、「画像をきれいに加工する」とか「色を鮮やかにする」などは、単に補正に過ぎず、期待色や記憶色を含めて如何に「忠実に再現」できるかがポイントとなります。別の言葉でいえば、カラーマネージメントしたからといって、色補正が正しく行われていない画像データがとりわけきれいな色になるということはあり得ない。補正はあくまでも画像の編集や加工の領域であってカラーマネージメントと同一視してはいけない。
7-0-113-2


30 Nov

カラマネの基礎知識 No.3331

CMS理論-112

カラマネのまとめ ~ その1 〜
・カラーマネージメントの意義

 これまで、取り上げてきましたカラーマネージメントは、画像を創っていく上でとても重要なアイテムです。(下図のように、関わっている学術分野も多岐にわたっています)
7-0-112-1

現在における映像技術は、アナログからデジタルへとシフトし、誰でもがデジタル画像を創り、パソコンでみて、所望の色に仕上げるためにレタッチ編集作業を行いながら、クライアント(次工程も含む)の要求に対応してきました。
 カラーマネージメントの基本は忠実な色再現にありますが、このことは「2つ以上の異なる色空間において、測色的、視覚的に色の一致を実現する」ことが最も重要なことになっています。カラーマネージメントをよりきめ細かく運用していくためには、「測色的」な面においては、適用できるツールやデバイス、アプリケーションソフトなどといったハード/ソフト面が充実していましたが、残念ながら「視覚的」な面においては、殆ど検討されて来ませんでした。周知のことと思いますが、色というものはいくら測定器などをつかって精度よく計っても、実際に別の人が見た場合必ずしも同じであるとは言えないことにあります。それは、最終的に色として識別するためには、人間の眼で色を検知して、その色情報を脳に伝え、そこで初めて色を知覚することができる仕組みになっているからです。
しかし、人間は、同じ色(物体)を見ても、照明条件や眼の構造、性別、年齢、人種、健康状態、その日の気分などによって色を弁別する能力が異なり、色が違っているのです。
これを主観色と言いますが、カラーマネージメントにおいては、とても重要なファクタとなります。このことを考慮しなければ、色の一致生を追求してもなかなかマッチングがとれないことになります。
 大事なことは、色再現を忠実に行うために、撮影からプリント出力を得るまでに関わる人達に共通した指標の下に画像データを送ることと、ファインデータを創り画像処理のプロセスで不要な作業を行わないことにあります。

23 Nov

カラマネの基礎知識 No.3321

CMS理論-111

g.理想的な色空間の変換
 色空間変換(color space conversion )は、例えばYUVからRGBといったように、現在の色が表現されている色空間から別の色空間への変換を行うことである。1例を挙げるとデジタルビデオは、YUVで色が表現されている場合が多い。ところが、それをPCのディスプレイに出力しようとすると、RGBへの変換が必要となるため、色空間変換が必要になる。
 しかしながらこれまでのカラーマネジメントシステム(CMS)は、入力デバイスから画像信号を受けた時点から、従来のカラーマネジメントを行い、出力デバイスに渡すまでがその適用範囲であり、それらに必要な色空間変換は、市販のアプリケーションソフトを使って処理してきた。しかし、単純にCMSを応用しただけでは、モニタと出力した画像の差が発生していわゆる「目標色」や「記憶色」の色再現性が狙った通りの結果を得ることができないとう問題などに直面し、解決の糸口さえ見えない場合があった。
 理想的には、下図に示したように、‘出力デバイスのICCプロファイルを作成する、機器独立(デバイスインディペンデント)の共通の色空間を使って画像データを展開する色変換はCIEは推奨している均等色空間の間で相互変換を行う、など重要なプロセスを順守することが絶対的な条件である。それでも実践的な面において、カラーマネジメントによって画像の一致は望めず、限りない近似による実現しかできず、最終的には印刷会社や出力センターなどにしわ寄せさせられるケースが数多く見受けられる。現状ではカラーマッチングの必要性を感じつつも、どのような解を与えたらよいかを模索している状態である。
7-0-111-1

 カラーマネジメントシステム(CMS)は、「少なくとも2つの色空間において、カラーが測色的、視覚的に一致すること」が基本となっている。しかし、実際にカラーが一致することはなく、画像処理によって限りなく近似させる行為である。これは上図に示すように、本来、CMSでカラーマネジメントする範囲は、画像データを受け取ってから、画像処理し、データを出力デバイスに渡すまでとなっている。また、これまでも何回も述べたが、CMSの基本は「忠実な色再現」(金太郎飴のどこを切っても同じ絵のよう)にあるから表現が良くないが「美しいものは美しく」「美しくないものは美しくなく」する、つまり原画の持つ情報を損なわないで忠実に表現することであるので、「同一視」ということが大切になる。ところが、先に述べた定義の中の「・・・測色的、視覚的に一致・・・」の「測色的」はCMSの応用である程度の表現が可能になるが、「視覚的」と言うことが大問題なのである。つまり、視覚は、各個人を指しているので、これは個人の感覚によって左右される。つまり、肉体的、生理的、感覚的な要因がからみ、一元的に捉えることができず、クライアントないしは次工程で問題を引起す原因になる。更に、ディスプレイで見た画像とプリンタの出力が合わないということで、画像データを合わせ込むために徹夜で作業を行う結果にもつながっている。
ディスプレイとプリンタが合わない理由は色々と考えられるが、根本的に異なることがある。それは、ディスプレイは光の三要素であるRGBのカラー(透過光)で見ているが、プリンタは色材の三要素であるCMY(Kも入れる)のカラー(反射光)で見ているという本質的な違いがあるため、完全な一致性は期待できない。これらの問題を解決できない限り色を完全に一致させることはあり得ない。ではどうすべきかと言うことになるが、下図に示すように、「色空間(三刺激値など)」「状態要因(反射、透過など)」と「色覚レベル」の3つを一致させれば、この問題は解決できる。しかし、これらを一致させることは、最新技術を駆使しても不可能である。従って、段階的移行を図る必要がある。そのために、まずやるべきことは、本書の副題ともなっている、Colorgraphy(色彩画像工学)の理論的体系を確立することにある。判り易くいえば、TIC(トータルイメージクリエーション)で述べたように、照明光源、入力デバイスの色作り、出力デバイスの画像形成技術、特に、画像評価方法、測色技術、キャラクタライゼーションの方法、インクや用紙に最適の色作り方法(プリンタドライバなどの確立)を1つ1つ確立してゆくことである。
 それでは、Colorgraphyが確立するまで、売り物になる画像は出来ないかといえば、そうではない。例えば、照明光源、使用するカメラ(カメラ特性、映像エンジン)、現像ソフト(RAWデータを使う場合)、アクセラレータ基板(画像処理基板)などの出来具合と相性性、インクの種類、使用する用紙などを吟味することでも、当面の対応が十分に可能であるといえる。(下図参照)
7-0-111-2

16 Nov

カラマネの基礎知識 No.3311

CMS理論-110

f.ニューラルネットワークによる色変換
 ニューラルネットワーク(Neural network)は、脳機能に見られるいくつかの特性を計算機上のシミュレーションによって表現することを目指した数学モデルである。生物学や神経科学との区別のため、人工ニューラルネットワークとも呼ばれる。
シナプスの結合によりネットワークを形成した人工ニューロン(ノード)が、学習によってシナプスの結合強度を変化させ、問題解決能力を持つようなモデル全般を指す。狭義には誤差逆伝播法を用いた多層パーセプトロンを指す場合もあるが、これは誤った用法である。
ニューラルネットワークは、教師信号(正解)の入力によって問題に最適化されていく教師あり学習と、教師信号を必要としない教師なし学習に分けられる。明確な解答が用意される場合には教師あり学習が、データ・クラスタリングには教師なし学習が用いられる。結果としていずれも次元削減されるため、画像や統計など多次元量のデータでかつ線形分離不可能な問題に対して、比較的小さい計算量で良好な解を得られることが多い。このことからパターン認識やデータマイニングをはじめ、さまざまな分野において応用されている。
・代表的な人工ニューラルネットワーク
−フィードフォワードニューラルネット
 最初に考案された、単純な構造の人工ニューラルネットワークモデル。ネットワークにループする結合を持たず、入力ノード→中間ノード→出力ノードというように単一方向へのみ信号が伝播するものを指す。
7-0-110-1

*単層パーセプトロン
*多層パーセプトロン
*自己組織化写像 (SOM)
*学習ベクトル量子化 (LVQ)
*サポートベクターマシン (SVM)
−リカレントニューラルネット
 フィードフォワードニューラルネットと違い、双方向に信号が伝播するモデル。すべてのノードが他の全てのノードと結合を持っている場合、全結合リカレントニューラルネットと呼ぶ。
ホップフィールド・ネットワーク
・確率的ニューラルネット
 乱数による確率的な動作を導入した人工ニューラルネットワークモデル。モンテカルロ法のような統計的標本抽出手法と考えることができる。
 参考:ボルツマンマシン 、ベイジアンネットワーク
・応用例
 下図は、L*a*b*からCMYKへ色変換する事例である。ニューラルネットワーク(神経回路網)の概念を従来の計算に取り入れたものである。
7-0-110-2


9 Nov

カラマネの基礎知識 No.3301

CMS理論-109

e.ユビキタス社会におけるコンピュータの役割
7-0-109-1

.罐咼タス(ubiquitous)
 ユビキタスの語源はラテン語で、いたるところに存在する(遍在)という意味である。インターネットなどの情報ネットワークに、いつでも、どこからでもアクセスできる環境を指し、ユビキタスが普及すると、場所にとらわれない働き方や娯楽が実現出来るようになる。「ユビキタス・コンピューティング」、「ユビキタス・ネットワーク社会」のようにも使われ、「パーバシブ(pervasive)・コンピューティング」ということもある。
ユビキタス・コンピューティングは、メインフレーム(複数で一台を使用)、PC(一人一台)、に続く、一人が複数のコンピュータを使う第3世代を示したもので、マーク・ワイザー氏が提唱した。
 アクセスに使う端末は、パソコンや携帯電話に限らず、冷蔵庫や電子レンジといった家電製品、自動車、自動販売機等もインターネット接続され、ウェアラブル・コンピュータと呼ばれる身に付けるコンピュータも開発中である。
 自由度を高めるため、これらの情報端末間はケーブルではなく、無線LANやブルートゥースという無線ネットワークで接続される。また、現在のインターネットの接続規約(IPv4)では約43億個のアドレスしかなく、一人が複数の端末を使うようになると不足するので、IPv4の4乗個と、ほぼ無限のアドレスを持つIPv6の導入が予定されている。
 無線LANは米国で既に実用化されており、ホット・スポットと呼ばれるノートパソコンやPDA(携帯情報端末)を利用するユーザーが多い空港、ホテルのほか、スターバックス店舗等でも利用可能だ。日本でも、モスバーガーやJR東日本が、現在の携帯電話より高速でインターネットにアクセスできる無線LANサービスの実験を発表している。
▲罐咼タス・コンピューティング / ユビキュタス・コンピューティング  
 Ubiquitous Computing / UbiComp

 米ゼロックス パロアルト研究所のマーク・ワイザー(Mark Weiser)が、メインフレーム(みんなで1台のコンピュータを使用)、パーソナル・コンピュータ(1人で1台を使用)に続く第3世代のコンピュータ利用形態として、1988年に提唱したコンセプト。縮めて“UbiComp”ともいう。ユビキタスとは、ラテン語の“ubique=あらゆるところで”という形容詞を基にした、「(神のごとく)遍在する」という意味で使われている英語で、ユビキタス・コンピューティングとはユーザーにとって目に見える形でコンピュータの筐体が存在せず、「人間の生活環境の中にコンピュータチップとネットワークが組み込まれ、ユーザーはその場所や存在を意識することなく利用できるコンピューティング環境」をいう。この概念は、ワイザーのHCI(human computer interaction)研究の中から生まれてきたもので、場所的な制約ばかりでなく、使いにくさという制約の解消がテーマとなっており、キーボード、アイコンとマウスといった伝統的なユーザー・インターフェイスに変わって、ペン入力や音声認識、そのほかのデバイスを活用したコンピュータ操作、さらにはコンピュータ・ネットワーク側が個人や現実環境の状況を把握・判断し、アクティブに働きかけるといったことまでが視野に入っている。例えば、正しいバッジを着用した者にのみに開くドア、名前によってあいさつする部屋、相手の場所に応じて自動的に転送される電話などが理想的に語られる。
 またワイザーは、ユビキタス・コンピューティングを語る際に「見えない」(invisible)ことを強調しており、その究極的な姿は「区別がつかないほど日常生活に織り込まれる」と説明している。
 “ユビキタス”は、もともとはこうしたコンピューティングの基礎的な研究プロジェクトの中におけるビジョンを表す言葉だったが、1990年代の終わりになって、日本では携帯電話を始めとした小型情報端末の進化・普及に伴い、「どこからでもコンピュータを利用できる」という意味で“ユビキタス”が使われるようになった。「ユビキタス・ネットワーク」などは、基本的にこの用法である。
ユビキタスによって、社会はこう変わる
 家電や普通の電話、時計やポータブルMDプレーヤなどがネットワークで結ばれ、駅の自動券売機やコーラの自販機までもがネットワークにつながれ、車や電車の中からでもインターネットにアクセスできるような社会が「ユビキタス社会」だという。
 すでに車に関していえば、GPSの搭載と携帯電話などを利用した双方向のカー・ナビゲーション・システムなどでネットワークへアクセスしていく原型はできている。また、インターネット家電としては、庫内の残り物で作れる料理のレシピを探し出してくれるインターネット冷蔵庫のプロトタイプや、留守中に洗濯を指示できるインターネット洗濯機(ただしイタリア製)などが登場した。パソコンとキーボード(それに電源!)を確保したり、難しいプロトコルの設定に苦労したり、アクセス用回線の遅さにイライラする必要はなくなる。
 もっと良いこともあるらしい。例えば、体に障害があって、いまのパソコンや携帯電話の利用は難しいという人たちにとっても、ユビキタス・コンピューティングが実現すれば、もっと簡単にネットワークにアクセスでき、必要な情報を引き出すことができるようになる。ユビキタス社会の実現は、人々がデジタル・デバイドから解放されることも意味する。
 また、思いついたとき、ちょっと時間があるときに、自分が端末を持っていなくても気軽にネットワークでオンライン・ショッピングができるようになれば、あっという間に消費者の間に電子商取引が広まるだろう。
ぅ罐咼タスがもたらすもの
 企業においては、いつでもどこでも簡単に会議ができるようになるだろう。オンラインでの受発注などはいまでもマーケットプレイスで行われているが、競りや仕入れにだれでも、どこからでも参加できるようになれば、中小企業にもビジネスチャンスが広がるのではないか。
 なにより、ユビキタス社会には新しいコミュニティが育つ可能性がある。常時、いつでもどこでもネットワークに参加できるようになれば、人々は電話代や時間やアクセスの速度を気にせずに情報の交換をすることができる。
 「便利さ」こそが21世紀の社会で、人々に最も支持されるキーワードになるはずだ。もちろんこれは「だれにでも(便利)」という条件付きである。そのためにも、高所得層ほどITの恩恵を受けるような社会ではなく、貧富の差や国を越え、ネットワークが提供されるようにならなければなるまい。
ゥ罐咼タス実現へ向けての課題
 では、そうした社会が実現するためにはどのようなハードルをクリアしていかなければならないのだろうか。 まず考えられるのは、ネットワークの高度化とアクセス技術の標準化だ。特にネットワークのオープン化、有線接続と無線接続のシームレス化は必須なのだという。まだ実用化されていないIPv6*1だが、あらゆる電化製品がネットに加わるユビキタス社会の実現には、IPアドレス資源確保のために、IPv6の実現が不可欠だ。
 いつでもどこでも、さらにだれでもが利用できるためには、接続技術は標準化され、簡素化され、もっと使いやすくならなければならない。ユビキタス環境下での常時接続では、ネットワークに参加する個人の認証さえあれば接続が可能となる。それはちょうど、実際の店舗がいつでも顧客を迎え入れ、買い物をするときだけ、クレジット・カードやメンバーズ・カードの提示を求めるようなものだ。
 そうなると、一番大切なのはセキュリティの確保であろう。認証を行う際の個人情報の保護や、認証システムのセキュリティ技術の向上は真っ先に必要な分野である。しかもそれによってコストがかさめば、普及の大きな障害になってしまう。

*1:アドレス資源の枯渇が心配される現行のインターネットプロトコル(IP)IPv4をベースに、管理できるアドレス空間の増大、セキュリティ機能の追加、優先度に応じたデータの送信などの改良を施した次世代インターネットプロトコルである。

7-0-109-2


2 Nov

カラマネの基礎知識 No.3291

CMS理論-108

c.International Color Consortium(ICC、国際カラー・コンソーシアム)
・プロファイル(信号値と測色値の関係)
 デバイス依存の色再現特性と、デバイス非依存であるカラースペースPCS(Profile Connection Space)と呼ばれるL*a*b*やXYZ色空間とに相互展開する仕組みを提供するのがカラーマネジメントモジュール(CMM)で、各機器の特性を記述したものがデバイスプロファイルである。これらを使うことによってプリンタや印刷機などCMYKカラーで表現できる色空間をL*a*b*にマッピングし、それをモニタで用いるRGB色空間に展開させ、結果としてプリンタや印刷機の色再現特性をモニタに再現させたり、最終的に出力させる印刷機の色再現特性を手持ちのプリンタでシミュレートさせることが可能となる。各デバイスの色域を機器に依存しないもので数値比較することにより、工程の早い段階から印刷する最終結果を予測することが可能となる。しかし、これは表示されている色がそのまま印刷されるというわけではない。
ICCプロファイルを用いたカラーマネジメントの流れには,次のようなものがある。
RGBからCMYKへ
 入力側デバイスプロファイル(RGB値→L*a*b*値)は、スキャナなどの入力側のRGBのデータをL*a*b*の値に置き換えるために使われるケースがほどんどである。出力側デバイスプロファイル(L*a*b*値→RGB値)は、入力側のスキャナでいったんL*a*b*に換算したものをモニタ上に表示させるための変換テーブルである。出力側デバイスプロファイル(L*a*b*値→CMYK値)は、入力側のもっているL*a*b*のデータを出力用のCMYKのデータに変換するプロファイルである。
RGBからRGBへ
 RGBからCMYKへとの違いは単に出力側のカラースペースがRGBになるのみである。
このように、入力側プロファイルと出力側プロファイルが非常に単純な仕組みで使われている。つまり、入力側プロファイルから出力側プロファイルに向かう過程で、L*a*b*やXYZのような一つの共通のカラースペースをもつことによって、同じような形の入出力を行える。このプロファイル同士を合体させる役割をもつデバイスインディペンデントな色空間がPCSと呼ばれるものである。実際の印刷現場からは、スミ版の保存やカラーコレクションなどを含め、どこまでICCプロファイルで可能なのかと質問されることがあるが、現状のICCプロファイルにはスミ版保持機能がないので今後の改善が待たれるところである。
・ICCプロファイルの分類
 デバイスで分けた場合、次のように大別される。
RGBプロファイル
 これにはモニタやスキャナ、ごく一部のプリンタ、sRGB、AdobeRGBやAppleRGBなどの閾値定義プロファイル(色空間を定義している)が相当する。
CMYKプロファイル
 プリンタや印刷出力機に使用される。上述のRGBプロファイルとほぼ同じである。
L*a*b*/XYZプロファイル
 これを使うデバイスが現実には見つからないため、目的が現時点では不明である。基本的な構造は先のRGBやCMYKのプロファイルと同じである。
NamedColorプロファイル
 スポットカラーや特色のインク番号に対するL*a*b*値を記述している。これをサポートしているプリンタ、アプリケーションは非常に少ない上、現存するプロファイルを探すのも難しい状態である。
・ICCプロファイルの構造・概略
 ICCプロファイルは大きく分けると、プロファイルの情報を記述しているヘッダの部分とプロファイルを構成する要素の一覧を記述しているタグテーブル、それぞれの構成要素タグの内容を記述しているタグドエレメントデータの3つの部分から構成される。
・ポストスクリプトプリンタの色管理
 独自の色変換テーブルをRIP内にもっており、色管理には次の2種類の手法が用意されている。両者とも、トランスファ関数*1やハーフトーニング*2は濃度調整には関係しているが、色変換には何ら関係していないといって差し支えない。
*1:トランスファ関数とはデータの値はそのままに、出力時にデータの値を変更させる機能である。トランスファ関数を与えることによって、編集時には通常の状態のままで、出力時には明るさを反転した状態で出力することなども可能になる。
*2:ハーフトーニングとは多値階調を持つ画像などを2値出力の(もしくは少ない階調しか持たない)機器で出力するために、多値の階調を2値(もしくは少ない階調)の面積比率で置き換えることにより出力する方法のことである。
CIEベースのカラーを使わない方法
 この方法ではスミ版保持が可能なため、印刷業界では一般的であると考える。入ってきたデータに対して色変換を行うのが、CMYK各色の濃度を調整するトランスファ関数とハーフトーニングの2つの要素である。非常にシンプルな方法であるが、そのシンプルさゆえにいくつかの問題点をはらんでいる。
CIEベースのカラーを使う方法
 与えられた色情報をUseCIEColorというCIEベースの色空間(XYZ色空間)にいったん展開して色変換をする方法である。入ってきたCMYKデータをまずColorSpaceTableに通し、再びCIE色空間からCMYKデータへの変換時にColorRenderingDictionaryと呼ばれる色変換テーブルを通す。この後にトランスファ関数やハーフトーニングをかける。上記の方法と比較すると処理が複雑な分だけ速度的には不利である。いったんCIE色空間に変換するため、スミ版保持ができないことが問題として挙げられる。しかし、各社RIPメーカーは独自機能で墨版保持を可能としている。
・RGBデータが入力された場合
 RGBデータが入力されると、その白色点情報、RGBソースプロファイル、ガンマ特性、RGB色度座標といったものをRGBリソーステーブルに格納する。このRGBリソーステーブルは色空間変換機能をもっており、RGBデータをCIE色空間に変換する。そして、このCIE色空間からデバイスCMYKカラーに色変換を行う。この工程はICCプロファイルをベースとした色変換に酷似している。
・ColorPolishについて
 自分自身でプロファイルビルダーを使ってプロファイルを作ろうとしても、微妙な色ずれを調整する部分であるCLUTまで編集できるツールは存在しなかった。
そこで、編集や解析が可能なプロファイルエディタとしてColorPolishを作り、これまでは手が届かなかったICCプロファイルの内部のすべての要素を確認・改造できるようにした。
・ ICCプロファイルの活用
 現実問題としてCMYKプリンタと印刷機のインクの色が合わない場合がある。染料系のインクと顔料系のインクとではガモットも発色の度合いも違うためである。一次色が合っており、単に濃度を調整する場合ならトランスファ関数のみの調整でも十分だと考えるが、一次色がマッチングしないケースにはプロファイル作成ツールでは対応できない。例えば、Cの値が合わない時、Cのトランスファ関数を調整しても絶対に色は合わない。そのようなカラーコレクションが必要になった時にはCLUTに手を入れることになるだろう。いずれにせよ、CMSの中でICCプロファイルが果たす役割をつかんでいることが大変重要でと考える。

d.デフォルト色空間によるCMS
・sRGB (or AdobeRGB)色空間の活用

 −この規格のディスプレイで見た時が正しい色と定義
 −ディスプレイ上でみる機会の増大〜ユビキタス社会との融合
 →事実上、多用されている(デファクトスタンダード、de fact standard)
 現実のコンピュータ環境をみると、ある部分においては、広色域であるAdobeRGBが優れているものの、それに対応するデバイスが少なく、またあっても高額であるためなかなか一般にまで普及できない。そこでsRGBの登場ということになるが、これにしても理想から程遠くかけ離れているが、取り敢えずの凌ぎとしてデフォルト色空間にすべきである。
7-0-108-1
26 Oct

カラマネの基礎知識 No.3281

CMS理論-107

7.4 最近話題のデジタル画像処理
a.インターネット上の画像取り扱い

・圧縮ファイルは、一般的に使用されているものにPNG(GIFの代替)とJPEGなどがある。
・画像フォーマッットであるFlashPix*1におけるピラミッド形態の画像構造を下図に示す。
7-0-107-1

 この画像構造は、用途別に圧縮率(概略値)を示したもので、どのレベルで圧縮したらよいかを考慮して設定すべきである。圧縮の目安を下記する。
 プリント画像  :1~1/4
 高精細表示用画像:1/4~1/16
 低精細表示用画像:1/16~1/64
 インデックス  :1/64~256
サムネイル   :1/256以下
 特に、使用する用紙や雑誌などの印刷形態に合わせて対応することを推奨する。
*1:FlashPixは、画像フォーマットのひとつである。Microsoft社、Kodak社、Hewlett-Packard社、Live Picture社が共同で開発した。複数の解像度のデータを1つのファイル内に階層的に保持しており、出力デバイスに応じた適切な表示が可能である。たとえば、インターネットのWebブラウザで表示するときには低解像度画像、プリンタに出力するときには高解像度画像というように使い分けることができる。

b.カラーマネジメントシステム
7-0-107-2・デフォルト色空間とICC
 数式を使った色を表す方法に、CIE(国際照明委員会)がL*a*b*という3次元表色系を開発した。簡単に言えば、L*は明るさ、a*b*(これをクロティクネス指数という)は双方とも色相と彩度を表している。このCIE L*a*b*は、デフォルトの色空間となっている。
 デジタル上では色を変換する作業は「RGB→L*a*b*→CMYK」になり、この変換ソフトと設定に何を使うかによって結果が異なってくる。ここで登場するのがICCプロファイルである。ICCという言葉に馴染んでいないという人もいるのではないかと思う。辞書的な記述では、「International Color Consortium(ICC)が定義した書式のプロファイルのことを指す、といえる。「RGB→L*a*b*→CMYK」の色変換する仕組みを国際間で取り決めた規約(色変換するための道具になるもの)で、モニタやプリンタなど各機器が表現できるカラースペースを示したデータである。
 「Gamut(ガモット)」という言葉も最近よく耳にするが、これはモニタ、プリンタまたは印刷インクなどある特定の機器が表現できる色領域をいう。カラースペース(Yxy色度図)上に各機器のGamutを重ね合わせると、どの色が表現できないか一目で分かって便利である。(下図参照)
色空間の表示には、次のようなものがある。
−AdobeRGB
−sRGB
−Japan Standard v2
−Japan Web Coated (Ad)
−Japan Color 2001 Coated 等々
7-0-107-3
19 Oct

カラマネの基礎知識 No.3271

CMS理論-106

s.鮮鋭性変換(続き2)
・ノイズ低減フィルタの作用

7-0-106-1

 代表的なメディア(出力デバイス)のノイズ測定結果を上図に示す。
 図で、レーザープリンタの特性が最も良く(参考のCRTとほぼ同じ)、インクジェットプリンタの特性は極端に悪い。このノイズ量は、かなり画質を左右するので、ノイズ低減フィルタなど改善策が必要である。
・非線形フィルタ
7-0-106-2 −ノイズ性を改善するためには、鮮鋭性強調フィルタを利用するとよい。
 左図−左側は、線形フィルタの特性であるが、左図−右側に示すように、それらは非線形フィルタの特性である。これらのフィルタを使うと、分散や差の少ない方向で平均する場合に有効である。
7-0-106-3

  一般的に画像は、雑音を含む入力を持つ逆フィルタによって本質的に雑音を発生する特性があるため、取り出した画像信号のSN比が高くなかった。このような場合、雑音の性質に対応してフィルタの伝達特性を修正してフィルタ特性を向上させる適応フィルタ(Adaptive filter)があり、その一種に、雑音を含んだ信号と真の信号の二乗誤差を最小にする方法で特性を向上させる、ウィナーフィルタがある。ウィナーフィルタを適用してノイズの多い画像を再構成することを試みると、単純な逆フィルタに比較してSN比が飛躍的に向上することが判っている。また、ウィナーフィルタに修正係数を導入することにより、ウィナーフィルタによって再構成したノイズ部分に現れるぼけを軽減すると同時に、指示の大きさと画像あらさの関係を向上させる可能があることも判ってきている。
・中央値の計算とその位置
7-0-106-4 −自身を含めた近傍画素を並べた中央値
 右図は、ノイズ低減フィルタを使って計算する方法を示している。
 9つの画素情報値の中で中央値(この場合5番目)に着目して重み付き平均を取ることでノイズ低減フィルタの効果を引き出している。

12 Oct

カラマネの基礎知識 No.3261

CMS理論-105

s.鮮鋭性変換(続き1)
7-0-105-1・非線形な手法

 右図のノイズ成分をなくすために、非線形な関数を与えることでノイズ部分を不感帯にすることができる。(非線形関数f)
このときのエッジ抽出のパラメータを(1)に示す。
更にこのとき、重み付け平均は(3)の通り、
Dnew= Dold+f(E)
で表される。

・重み付け平均
 「コンボリュージョン=畳み込み演算」とは関数を使った数学の計算方法のひとつである。つまり、IRという測定データを利用して色を再現するための計算のことを指す。  IR(Intermediate representation)とは、プログラムへの入力データから構築されるデータ構造であり、そこからさらにそのプログラムの出力データが構築されるものをいう。
コンボリューション演算を行う場合は、フィルタマスクを使う。フィルタマスクは図示したA~I(中央部)の9個のデータを抽出したものである。 
分子のaA+bB+cC+dD+eE+fF+gG+hH+iIは、a〜iの重み付け係数で、それらを順次掛け合わせたものである。これを、分母のa+b+c+d+e+f+g+h+I で割ることで、計算できる。
7-0-105-2


−コンボリューション行列について
7-0-105-3図:フィルタ/汎用/コンボリューション行列
 コンボリューション行列では画像のそれぞれのピクセルに対して行列演算を施し、自分でオリジナルのフィルタを作り処理をさせることが出来る。





ノイズの評価の目的
・ノイズに人間の周波数を掛け合わせる
 −閾値を設ける
・メディア間の差をなくす
 −ノイズ量は画質を決める


5 Oct

カラマネの基礎知識 No.3251

CMS理論-104

s.鮮鋭性変換
 鮮鋭性を変換する方法は、周波数領域で行う方法と、空間領域で変化する方法の2つがある。
・周波数領域での変換
 下図は、実空間(リアル空間ともいう)から周波数空間に高速フーリエ変換を用いて変換し、ゲイン調整する。その後、周波数空間から逆変換して実空間に戻すときの機能ブロック図である。
 これには、これまで述べてきた高速フーリエ変換(FFT)や離散フーリエ変換(DFT)を使って周波数領域での鮮鋭性を変換することができる。この変換過程では、周波数空間に逆変換する前にゲイン調整を行うことによって、より良い変換が可能となる。
7-0-104-1

・実空間(リアル空間)と周波数空間
 画像処理の中で空間周波数ではとか実空間ではなどの言葉がでてくる。この周波数領域での表現と実空間とはどのように違うのかを簡単に説明する。
 実空間とは単なる普通の画像のことである。パソコンの中から見える画像は縦横のピクセル(たとえば128X128)で示された画像である。この画像を単に実空間の画像と呼んでいるだけである。実空間でフィルタをかけるという意味は、普通の画像に3x3や64x64とかのピクセルで表したフィルタを使用して数学的処理をすることなのである。ここでどのような方法であるのかは重畳積分(コンボリューション積分)をおこなえばよいのである。この方法は数式では難しい積分の式を用いているが、数式など考えないで実際の方法を覚えれば簡単に計算できる。
 数十年前は、前処理フィルタは1次元フィルタをかけると言っていた。いまでは2次元フィルタといっている。1次元、2次元フィルタ・・・・2次元フィルタは縦横の正方形のピクセルので、1次元とは横に並んだピクセルの固まりなのである。
 次は周波数空間の話であるが、前の実空間(実際の画像)のカウントの変化(濃度変化)をグラフに描いてそれを離散フーリエ変換すれば、この画像の周波数特性が求められる。この離散フーリエ変換も参考書では難しく書いてあるが、方法さえつかんでしまえば数式など不要である。
 実空間のカウントを調べてそれを離散フーリエ変換すれば、その画像の周波数特性が求まる。この周波数特性を離散逆フーリエ変換と言う手法を用いれば、もとの実空間の画像がもとまる。
 ここまでの説明は、1次元(画像の1ピクセル分の水平方向だけ)についての説明であったが、2次元(縦横)方向(はじめは横方向、次に縦方向の順)に離散フーリエ変換すれば、2次元での周波数特性が求まる。実空間に戻すにも2次元で離散逆フーリエ変換すればよいのである。
画像処理には周波数領域と実空間での2つの方法がある。
画像のざらつきを無くすには、そのときにフィルタをかけることで解決できる。これを解くときは3x3や64x64とかのピクセルで表したフィルタを用いて処理をすると述べたが、これは実際の画像(マトリックスで出来ている画像)との処理ですので実空間で処理をしたことになる。
 周波数空間で処理をするには、実際の画像を離散フーリエ変換し、そのものと、実際のフィルタを離散フーリエ変換したものとを掛け合わせて(実際の画像の周波数×フィルタの周波数)やれば、フィルタ処理した周波数空間で表した画像が出来上がり、それを逆の手法(離散逆フーリエ変換)を用いて、実空間に戻してやれば、フィルタがかかった目に見える画像ができるのである。
 このように、周波数領域と実空間領域とは数学的な手法を用いれば、周波数で示した画像から実際の実空間画像ができ、反対に実空間画像から周波数空間に戻すことができる。

28 Sep

カラマネの基礎知識 No.3241

q.高精度な色変換方法
・LUTと補間演算
−汎用的、高速

7-0-103-1 実際の応用例では、トーンカーブを修正する場合、16ビットの補間演算を行うことがある。また、画像処理補間演算(バイキュービック・スプライン補間演算)処理IP(intellectual property)をハードウェア・エンジン拡張部に集積し、その回路をFPGA上に実装して画像拡大時にスケーリング表示処理を行っている例も見られる。
−LUT
 LUT、つまりルックアップテーブルは、Look Up Table (lookup table)の略で、入力輝度に対する出力輝度の割当テーブルのことである。
一般的に画像のコントラストを改善したり、明るさの変更などに利用される。 
この、LUTとはコンピュータにおいて、効率よく参照や変換をする目的でつくられた配列や連想配列などのデータ構造のことをいう。例えば大きな負担がかかる処理をコンピュータに行わせる場合、あらかじめ先に計算できるデータは計算しておき、その値を配列(ルックアップテーブル)に保存しておく。コンピュータは配列から目的のデータを取り出すことによって、計算の負担を軽減し効率よく処理を行うことができる。またあるキーワードを基にあるデータを取り出すとき、その対応を表としてまとめたものもルックアップテーブルといえる。
 右図は、LUTを用いてRGBからCMYKに色変換する模式図を示す。
違う色空間に色変換する上で、大切なことは色再現性が大きくなければならないということである。
 

r.鮮鋭性の評価: MTF
・スリット(エッジ)を測定
・サインカーブを測定

 7-0-103-2左図は、鮮鋭性を評価するための方法を示したものである。
 シフトインバリアントな光学系の伝達特性を評する場合はPSFを用いるが、画像の鮮鋭性を評する場合、点像を用いるよりは線像を用いた方がより多くの情報を得られるため、画像機器のLSFを取得してフーリエ変換によりMTFを求めた方がよい。線像には通常スリットやナイフエッジチャートを用いることが多い。画像入力で場デバイスのMTFを測定する場合、線像を撮影して得られた画像データをDFTすればよいが、画像出力デバイスMTFを測定する場合は、エッジチャートをプリントアウトし、その出力画像をマイクロデンシトメーター(MD:Micro Densitometer)を用いてエッジ部の情報を抽出しDFTを行う。MTFの幅や強さにより画像の鮮鋭性が評価できる。
 画像のコントラストという観点からインコヒーレント光学系の伝達特性を考えると、コントラスとは次のように定義される。
  C=(Imax-Imin)/(Imax+Imin)
 C:コントラスト(Contrast)、Imaxは最大強度で、Iminは最小強度である。
 インコヒーレント光学系では、一般にコントラスを低下する。コントラストの低下の度合いを空間周波数νの関数として表したのが、変調伝達関数(Modulation Transfer Function 、MTF)である。
 鮮鋭性補正で重要なことは、特性を測定するでことである。鮮鋭性を補正する際、ノイズを増やさず画像の鮮鋭性を元に戻すには、ノイズスライスを行い、ノイズを強調しないで鮮鋭性を強調できるような欲張な方法を選択する。そこで、エッジを保つためにノイズ低減処理が必要となる。

21 Sep

カラマネの基礎知識 No.3231

CMS理論-102

p.色域の概念
・色素で出せる色が決定

7-0-102-1

 カラースペース(色域)とは、可視色域内(Lab領域内)における色再現可能範囲を意味している。コンピュータ周辺機器やアプリケーションソフトウエアで扱えるカラースペースには、sRGBやAdobeRGB、CMYK等がある。また、デバイスによっても色域は異なっている。(上図参照)
 デジタルカメラやスキャナが持つ能力の中で、カラースペースは可視領域より狭い領域で単純に比較できない構造であり、そのままでは他のコンピュータ機器では表現できないため、カラースペースをsRGBやAdobeRGBなどに変換して画像データを書き出している。
7-0-102-2 sRGBは、コンピュータや周辺機器が扱うことができる標準カラースペースで、WindowsやMacOS等のOSレベルでサポートされている色域である。
 AdobeRGBはsRGBに比べ特にグリーン側の色域が広く、高い彩度まで表現が可能なため、水面 や新緑などを表現するのに適している。また、AdobeRGBはDTP用のCMYKよりカラースペースが広いため、DTP業界の主流になっている。
 高品質なカラーマネジメントシステムを導入することによって、同一のICCプロファイルをカメラ・スキャナ・モニタ・プルーフ・印刷機に使用して美しい仕上がりを実現することが可能である。
 プルーフと実際の仕上がりはΔ(デルタ)値に対して3EV以内という精度が可能であるので、今まで印刷仕上がりの色に疑問を持っている人も満足できるものと考える。

r.色域圧縮(マッピング)
 どの方法を選択するかは用途に応じて選択するのが肝要である。
 マッピング(mapping)は、 あらかじめ用意された画像データの色空間を別の色空間に変換する、あるいは色域圧縮することによって再現色を創出することである。また、3Dグラフィックでは、形状の表面属性を部分的に変化させるために使用される技法である。つまり、あらかじめ用意された画像データを表面に貼り付ける(マッピングする)ことで質感を表現する方法である。
7-0-102-3

色域圧縮の方向
 上図は、CIEが勧告した4つのレンダリングインテントを使用した例である、
 これは、CMMエンジンが、あるデバイスのガモットから別のデバイスのガモットでカラー変換(マッピング)するために利用する方式である。知覚的、彩度、相対的な色域を維持、絶対的な色域を維持の4つの方式がある。
 目標機器と再現機器の関係は、左図に示すが、線型圧縮する場合は比例関係にある。しかしクリッピング*1や高彩度圧縮を行う場合は、左図のように直線よりも上に凸の特性となる。
7-0-102-4*1:クリッピングとは、特定範囲の矩形内部のみを描画対象とするテクニックで、GDI の描画命令は、例え指定範囲が対象矩形の外を指定していてもクリッピングさえしていれば、その外に描画されるようなことがなくなる。
左図は、色域圧縮の程度を示したものである。
14 Sep

カラマネの基礎知識 No.3221

CMS理論-101

m.色再現のためのステップ
・座標変換の繰り返し

 高度に色再現性を実現させるには、原稿(紙焼き写真や印刷写真)の色域と、インクジェット記録(写真紙・普通紙)の表現色域との差分をいかに表現するかがポイントとなる。一般的に色再現域を変換する手法としては、色差を重視する方法と階調性を重視する方法がある。色差を重視すると、色一致性が高い領域が広くなるが、階調再現が悪化する領域も出現する。階調性を重視すると、全体に階調性は維持されるが、全体にメリハリが不足してしまう。
 CMSの構成としては、画像出力デバイスの組合せ毎に1つの変換テーブルを持つパターンもあるが、デバイス(機器)の組合せ毎に変換テーブルを作成しなければならないこと、また未知の機種に対応することが困難であることから、現在ではデバイス及びメディア毎にその特性をファイルという形で持ち、入出力デバイスが組合された時点でそれぞれのプロファイルから変換テーブルを作成する方法が主流になってきている。
7-0-101-1

n.機器の特性評価: 加色法
・加色法(加色混合)を利用したマトリクス演算:CRTの例

7-0-101-2

 上図は、光の三原色であるRGB値を色彩計で計測して、白色点や新しいRGBデータを作成する例である。上式で示したように、濃度値を測定し、XYZ三刺激値を掛け合わせて計算することができる。HDTV(High Density Television)の変換式も参考として記載した。
 計算方法は、ルックアップテーブル(LUT、参照表、辞書)を使ってRGB値をXYZやLabなどに変換するのではなく、連立方程式を解く方法と同じようにして計算 するものである。
7-0-101-3

 上図は、CRTディスプレイのデジタル値と強度の関係を示したものである。

o.機器の特性評価:プリンタの例
・デジタルチャートを測色・対応付け

7-0-101-4
 色域は色再現性を可能とする色の範囲であるが、できるだけ広い色域を持つことが、高品質のカラーマネジメントを行うために大切である。
 この図は、マトリクス計算または重み付け平均によってマゼンタ−イエローの色領域にある色をキャリブレーションするために補正(色変換)する例である。
 デジタルチャートをプリンタから出力して、それを測色計で測定し、その結果から補正される値を計算するというのがこの例の特徴である。
7-0-101-5

7 Sep

カラマネの基礎知識 No.3211

k.機器独立色を用いた色再現
・カラーマネージメントや画質評価の国際標準化動向を把握する
・均等色空間で合致させる(目標色と再現色の関係)
 光源が違っても、色空間HSVを共通の色空間(インデペンデントカラー)として使用し、機器環境独立適合させて、色を知覚することで、色を一致又は近似させることができる。
・『忠実な色再現』と人間の視覚特性を考慮した『好ましい色再現』がポイント
7-0-100-1


l.色の評価方法
・規格による色差評価

7-0-100-2 人間の知覚とマッチした「均等色空間」で評価する。
 2つの色の違いを表す数値を「色差」といい、ΔE(デルタ・イー)で表す。つまり、色空間中に位置づけられる2つの色の間の直線距離を色差という。
 下表は色差値と感覚の関係表(右図の表を更に細分したもの、CIE規定値に近い)を、下図は色差の模式図をそれぞれ示す。

ΔE     英語       色差の感覚
0〜0.5    Trace       かすかに感じられる
0.5〜1.5  Slight       わずかに感じられる
1.5〜3.0  Noticeable   かなり感じられる
3.0〜6.0  Appreciable  目立って感じられる
6.0〜12.0 Much       大きい
12以上   Very much   非常に大きい

7-0-100-3
31 Aug

カラマネの基礎知識 No.320

CMS理論-099

i.疑似階調化の原理
・スクリーンの考え方

7-0-99-1

 この考え方は、解像度と階調数という2つのパラメータに着目したもので、解像度が高く階調数が低い方がより疑似階調化の精度は細かく(微調整できる)なることである。
・ディザと誤差拡散
7-0-99-2

 上図は、ディザ法と誤差拡散法の疑似階調化を比較したものである。
 適応的に閾値を変更した場合、ディザ法では、利点としては簡単なパターンで疑似階調化ができるが、欠点としては目障りなパターンが発生することである。一方、誤差拡散法では、利点としては大局的には無数の階調を持ちモアレが生ずる心配はないが、欠点としては緩やかに階調変化する画像で、俗に言う芋虫状のイズが発生することと均一なハイライト部、シャドウ部でドットの出現が遅いことである。

・ディザ: 2次元への拡張
 下図は、左からベイヤ型、ドット集中型、ライン型の3種のディザ法を示す。
7-0-99-3

 ディザは、ある決められた階調でより豊富な階調を表現する技法である。たとえば、白と黒しか使えない状態でさまざまな濃さの灰色を表現する方法である。元の画像の画素の階調に応じて一定の規則の基に白黒を生成していき、黒白の出現頻度によって中間調が表現される。階調を表示する方法としてはほかに、濃度パターン法/誤差拡散法がある。ディザ法は原画の1画素を1ドットで表現する処理であるが、濃度パターン法/誤差拡散法は、1画素を複数ドットで表現する。ディザや濃度パターン法/誤差拡散法での階調表現を面積階調あるいは疑似階調という。ディザリング(dithering)ともいう。

.誤差拡散: 2次元への拡張
・計算時間やざらつき感で決定

7-0-99-4記号●で示した部分は、誤差拡散を行う場合の「注目画素」である。
 誤差拡散は、この注目画素を基点としてその周辺の画素の重み分散係数を掛け合わせて、ざらつき感のない画像を形成する。
 この方法には、図示した3種類の方法があるが、いずれを採用するかは使用目的に合ったものを選定することが重要である。

24 Aug

カラマネの基礎知識 No.3191

CMS理論-098

e.空間成分の感じ方7-0-98-1
・明度成分: バンドパス
・色度成分: ローパス

 人間の眼の解像力は、空間周波数に対する人間の視覚システムの感度を示す尺度である。実験的には、
ゝ嬰戮水平方向にサイン関数で変化するパターンを作成し、このコントラストを次式で定義する。
 Contrast(Vr)=(Imax−Imin)/(Imax +Imin)
ただし、Imaxはパターン中の輝度の最大値、 Iminは、最小値を示す。
輝度の平均値を変えずに、コントラストを小さくしていき、輝度の最大値と最小値の差が認識できなくなったコントラストの値の逆数を人間の眼の解像力と定義する。
6間周波数と観察時の明るさをパラメータとして同様の測定を続ける。
 以上の測定結果が報告(A.S.Pastel)されている(上図参照)。

f.視覚特性7-0-98-2
・色成分

 −分光データ→等色関数→三刺激値→明度・色相・彩度
  *人間の眼は非線形(約1/3乗カーブy=x1/3の形)
・空間成分
 −等色関数→反対色応答→空間周波数特性フィルタ
  *輝度は細かく見える
  *色度は細かいところは見えない

g.2通りのぼかし方7-0-98-3
 画像のぼかし方は、フィルタ機能を使って行う場合もあるが、色調整機能を使って行う方法もある。
 その方法は、右図に示すように、「色度ぼかし」と「明度ぼかし」があるが、前者ではぼかしの変化少ないが、後者では大きな変化となって現れる。


h.階調性7-0-98-4
・階調性(強度変調)
−ハイライトからシャドウまで滑らかに

*視覚的に等間隔にするLUTを使用
 画像や映像などの色の濃淡の変化の度合い、グラデーション表現のことを階調という。色と明暗のバランスに優れた滑らかな色、濃淡表現のことを階調性、階調表現力に優れているとされている。インクジェットプリンタではより滑らかな階調性を実現するために、プリントデータに応じて微小インクを打ち分けてプリントする技術、エプソンのMSDT(マルチ・サイズ・ドット・テクノロジー)や、基本のCMYK4色に加えライトシアンやライトマゼンタなどの中間色インクを使用することで、写真に迫る優れた色再現力と階調表現力を実現している。
・階調性(面積変調)7-0-98-5
−固定閾値

 *スクリーン
 *ディザ
 *ノイズ
−可変閾値
 *誤差拡散法→最近の主流


17 Aug

カラマネの基礎知識 No.3181

CMS理論-097

c.色の感じ方
・網膜の分光感度と人間の色知覚

 −LMS: 人間の網膜の出力
 −HSV: 心理値(経験式)
7-0-97-1

 これまで、色知覚のメカニズムは、人間の網膜に備えられたRGB3つのセンサで感知していることを説明した。しかし、現実には、空間周波数が支配的な視覚システムの基本になっていることである。つまり、Long(長波長:赤を感知)、Middle(中波長:緑を感知)及びShort(短波長、青を感知)の3つの感知機能によって色情報を得ていることが判った。
ただ、上で述べたように、LongはRedに、MiddleはGeenへ、そしてShortはBlue にそれぞれ対応しているので従来の考え方を踏襲しても何ら問題ない。
 色の知覚は、分光感度に大きく関わりを持ち、これがHSVの表色系で表すことができる。
7-0-97-2

つまり、L*a*b*空間で見ると、L*軸、a*軸、b*軸の3次元で表示され、全ての色がこの3次元空間の範囲内に表現できる。
HSVでHは色相、Sは彩度、Vは明度を示す。

 色の感じ方は、人間の五感を使っているので、厳密には単に目に色刺激だけを与えるだけでは正しい色を知覚することはできない。また、人間の様々な感情が絡み合って色が創出されるので、視覚的な要素をもっと重視すべきである。(現状では、圧倒的に測色的な要素のみを扱っている)
 また、知覚を伴う網膜上の色検知センサをRGB錐体とかLMS錐体とか用語の使われ方が統一されていない。
(医学書や参考文献では、「RGB錐体という表現が圧倒的に多い。」、ことは事実である)
筆者が使用している定義は、RGB錐体と呼ぶときは、色検知センサを網膜の色覚感度として使い、LMS錐体と呼ぶときは、知覚色空間周波数(波長に相当する分光感度、L:Long、M:Middle、S:Short)として使う、ことにしている。
RGB錐体を使うのは、撮影→色管理→画像出力する際に使用しているしている色空間がRGB(CMYK)なので、色情報の在り方に矛盾を来さないように考慮している(そう、大学生に教えている=両方の使い分けを明確にするようにと・・・)。その方が一貫した色情報(画像データ)の流れがだれにでも理解しやすいし、第一に理論的に矛盾しないためである。(かなり以前から、ある企業の研究所で使われている)

10 Aug

カラマネの基礎知識 No.3171

CMS理論-096

7.3 カラー画像の評価と処理
a.基本的な考え方
_菫処理の位置づけ

・画像評価の方法を確立(次の4項目は必須)
−階調性
−色再現性(色域)
−鮮鋭性
−ノイズ性(ノイズ感)
⊇侘狼ヾ錣伐菫処理の役割
 感覚的な要素を決定する
・好みのまま→主観的
・見たまま →客観的 (ColorWYSIWYG)
・評価基準→ 階調性、色再現性(色域)、鮮鋭性、ノイズ性

b.画質評価の基礎知識
・人間はどのように感じているか?
−色覚

 色覚は網膜の視細胞のうち、中心部に多くある錐体細胞の働きで、光の波長を感じとり、それを大脳に伝えて色を感じる。  
 色を感じる三大学説
.筌鵐亜Ε悒襯爛曠襯弔了安舁彖農

 網膜の錐体細胞には,赤・緑・黄(または青)を感じる3種の要素があって,これらがすべて興奮すると白になり,まったく興奮しなければ黒になり、3つの要素がいろいろな割合で適当に興奮することで、すべての色を作り感じることができるという説である。つまり、三つの原色の絵具ですべての色を作ることができるのと同じ原理である。
▲悄璽螢鵐鞍紳仗Ю
 白と黒,赤と緑,黄と青の三つの物質があると仮定して、それらの物質が分解したり合成(同化)されるときに,白,赤,黄,黒,緑、青の色を感じることができるという説である。
ラッド・フランクリンの発達説
 長波に属する黄の感覚をおこす物質と、短波の青の感覚を分化していくと、長波長、短波長の両側の波長の光をおこす物質が次々とできてくるという説である。なお、人間の目は、最高の条件*1のもとで100万種類の色を識別することができるといわれている。たとえば、最も精度の高い光電式分光光度計でも、人間の目に比べると40%の精度しかないので、いかに人間の目が素晴しいかわかるであろう。
*1:最高の条件とは次の3つが整っていることをいう。
(1) 両目を使う
(2) 明るい照明のもと
(3) 広い面積の色を比較する
 光覚とは光を感じその強さを区別する感覚のことで、色調、明度、彩度の三つの要素を持っている。明るいところでは、網膜の視細胞中の錐体細胞(約700万)が、暗所では桿体細胞(1億5000万)が光エネルギーを電気エネルギーに変えて脳に伝えることで光覚を感じることができる。
 ○色調 → スペクトル中の各単色光に特有な色
 ○明度 → 色の明るさ
 ○彩度 → 白がどの程度、混じっているかによって決まる要素
また、同じ色でも明るさが異なると目立つ度合が違う。つまり、明るいところでは黄色と緑がもっとも明るく見え、たそがれ時には、青色と緑色の部分がもっとも明るく見える。このようなことをプルキニエ現象という。
−色覚異常
 全部の色、または一部の色を識別できない異常を一般に色覚異常といい、先天性と後天性に分けられるが、先天的なものがほとんどである。なお、「色盲」「色弱」と呼ばれることもあったが、誤解を与えるとして現在は「色覚異常」「色覚障害」等と呼ばれることが多い。「異常」も「盲」も字に否定的な印象があるとして「少数派色覚」と呼ばれることもある。この場合正常色覚は「多数派色覚」ということになる。
7-0-96-1

 上図は、視覚メカニズムと認識概念を示したものであるが、網膜のRGBセンサで色情報を検知するとい考え方(図の上)と色成分を視覚の空間周波数として捉えた考え方(図の下)の2つがあることを示している。どちらをとっても不都合なことはない。
 図の上の部分は、従来の色認識概念を表したもので、眼の網膜上に配置されたRGB3つのセンサによって検知され、色信号に変換された情報は、視神経を介して大脳視覚野に伝送され、そこで色の認識がなされる。
 図の下の部分は、網膜で検知されたカラー情報が、光の強度としてLong(長波長)、Middle(中波長)、Short(短波長)の形で分けられる。その信号は、反対色応答の色差信号(r-g,y-b,w-kの3信号)に変換される。これは視覚空間周波数であり、その特性が視神経信号回路網を経て大脳皮質に送られ、そこで初めて色として知覚される。

3 Aug

カラマネの基礎知識 No.3161

CMS理論-095

l.画像の補正
・明るさ・コントラスト補正

 コントラストを上げすぎる(明るいところはより明るく、暗いところはより暗くする)と、中間調が飛んだ"どぎつい画像"になり、微妙な明るさの違いで表現された模様が消えてしまう。一般に、高いコントラストの画像は、モニタ上だけに表現させる場合はよいが、プリントアウトする場合には適さない。
 逆に、コントラストを下げすぎると、レンジ幅が小さくなり、明るい部分(ハイライト部分)や暗い部分(シャドウ部分)を使わない中間調だけの"のっぺりとした画像"になる。
明るさを上げすぎると、明るい部分(ハイライト部分)の模様が消えてしまい、逆に、明るさを下げすぎると、暗い部分(シャドウ部分)の模様が消えてしまう。
・レベル補正
 RGB各チャンネルのヒストグラム(どの明るさがどのくらいの面積を占めるのかを高さで示すもの)を目安に階調の分布をコントロールする。
 例えば、各チャンネルの最も暗いピクセルと最も明るいピクセルを黒と白にそれぞれマップすれば、画像の色調範囲を拡張することができる。
 通常、こうしたレベルを補正する場合、他のチャンネル内で対応するピクセルも比例して調整されるので、カラーバランスへの影響はない。
 なお、グレー階調の中間範囲の値の強さを変更することもできる。
・色かぶりの補正
 補色の関係から必要色と不要色とを判断し、ヒストグラムによって必要色の色チャンネルを増やしたり、不要色のチャンネルを減らしたりして調整する。
例えば、黄色っぽく見えている場合、イエロー成分を弱くすればよい。つまり、補色の関係から、ブルー成分を増やせばよい。
・カラーバランス
 画像全体の色が、ある色に偏ってしまったような画像を補正する。
通常、画像のカラーの全体的な混合率を変更して一般的なカラー補正を行うことができる。
基本的には、「赤」「緑」「青」と、それぞれの補色「シアン」「マゼンタ」「イエロー」の彩度を調節することができる。
 また、カラーホイール上の隣り合う2色や、補色の隣り合う2色を調整することによって、カラーを調節することもできる。
例えば、RGB画像でマゼンタの量を減らすには、赤と青を減らすか、緑を追加すればよい。
・カラーの置き換え 特定の絵柄部分の色味だけを変化させてシミュレーションしたい場合は、カラーの置き換えが有効である。
 すなわち、特定のカラーについて、一時的にマスク(シミュレーションしたくない部分を覆い隠す処理)を作成し、マスクで識別された領域(マスクされていない領域)の色相・彩度・明度の値を自由に調整することによって、これを別の特定のカラーに置き換えることができる。
・アンシャープマスク
 画像補正の終了後、アンシャープマスクフィルタを使って、画像をシャープにする。
これは、プリントする際には、欠かせない処理である。
デジタルカメラの場合、撮影時にシャープネスをかけることもできるが、画像レタッチソフトで補正やサイズ変更してからアンシャープマスクを施したほうが仕上がりがきれいになる。アンシャープマスクを適用すると、画像エッジ部分のコントラストが高くなり、全体的に細部が鮮明になる。
 また、撮影時のブレも、多少は調整されることになる。
アンシャープマスクの制御値には、適用量、半径、しきい値の3つがある。
このうち、
 −「適用量」は、コントラストを強める度合いを示すもの、
 −「半径」は、シャープにするピクセルの範囲を示すもの、
 −「しきい値」は、シャープを適用するピクセルと隣接ピクセルの明るさの差を示すも
   の、である。
  「しきい値」は、人肌部分など、非常に微妙な変化の画像に適用して有効である。
・CMYKデータの最適化
 色バランスを整える場合、基本的なカラーモード(カラーバランスの調整など)はRGBモードで行い、その後、CMYK変換する。
CMYKの網%の数値で色を類推できる人以外は、CMYKデータで調整することは避けたほうがよい。CMYKは、基本的に、フォトレタッチと呼ばれる画像合成の場合に使うようにする。
CMYKの場合は、トーン(調子)によるコントロールを基本と考える。
例えばCMYKの全て(中間調のみ)を「−10%」すれば、全体的に明るい画像になる。
7-0-95-1

図は、画像補正の例(色補正) 出典:市川ソフトラボラトリー

27 Jul

カラマネの基礎知識 No.3151

CMS理論-094

k.異なるデバイス間の色変換
・加法混色と減法混色

 色を重ね合わせて別の色を作ることを混色という。RGBのように、混ぜるほど明るくなる混色を加法混色という。例えば、白いスクリーンに色つきのスポットライトを当てるような感覚である。反対に混ぜるほど暗くなっていく混色を減法混色という。
 赤い光と青い光を混ぜ合わせれば紫になるし、赤い光と緑の光を混ぜれば黄色になる。人間の目は、赤、緑、青(R,G,B)の3色に反応するように出来ているから、この3色を原色とする色空間は人間の目の構造に沿った色空間といえる。このレッド、グリーン、ブルーの要素からなる表色系をRGB表色系と呼ぶ。これは代表的な加法混色である。
 赤緑青の捕色からなる表色系に、シアン、マゼンダ、イエローの要素からなる表色系をCMY表色系と呼ぶ。これは代表的な減法混色である。
・RGB 
RGB色空間は、加法混色の代表である。液晶ディスプレイ、ブラウン管を問わずカラーの発光と深いかかわりがある。R,G,Bの3色が混ざると白になる。また、3色を均等に混ぜ合わせるほど明るくなる。混ぜ合わせの仕組みは以下の様になる。
紫(マゼンタ)=R+B、水色(シアン)=B+G、黄色(イエロー)=R+G、白=R+G+B
・CMY
 CMY色空間は、減法混色の代表である。中心部が黒くなっている。絵の具やインクにかかわりを持ち、C,M,Yの3色が重なると黒になる。CMYはディスプレイのような光を扱う場合よりも、印刷に用いられる。3色の混ぜ合わせで黒を表現しようとすると仕上がりがきれいな黒にならないこととインクがもったいないこともあり、実際の印刷には、CMYに黒(ブラック、K)を補って CMYK と呼ぶ表現を用いる。
CMYは、RGBの補色になっている。CはRの補色、MはGの補色、YはBの補色である。
つまり、C,M,Y はそれぞれ R,G,B 単色をそれぞれ吸収するインクと考えてよい。Cは白色光からRを吸収してGとBを反射するインクである。だから水色(シアン)に見える。 同様に Mは白色光から Gを吸収して RとB を反射し、紫(マゼンタ)に見える。CとMを混ぜると、RとGを吸収するのでBを反射し、青く見える。
青(ブルー)=C+M、赤(レッド)=M+Y、緑(グリーン)=C+Y、黒=C+M+Y
RGB表色系とCMY表色系の変換公式は、以下の様になる。
7-0-94-1 




・YIQ
 NTSC(National Television Standard Committee) が用いている表色系である。Y (輝度) I(オレンジ-シアン) Q(緑-マゼンダ) の三要素からなる。カラーテレビのブラウン管はRGBで画像を発色するが、テレビ放送電波は画像をこの YIQ表色系 で送信している。
 この色空間は、人間の視覚特性に近い特徴をもっている。人間の目はY(輝度)の刺激に特に敏感であるため、Yの情報を特に広い帯域で送信する。反対に人間の視覚特性は色に鈍感であるため、IとQ を間引いて狭い帯域で送信することで帯域を有効に利用できる。
 カラーテレビが採用する色表現を選択するにあたっては、「カラー以前の旧式モノクロ受像機でカラー電波を受信でき、再生できなくてはならない」という条件をクリアする必要があった。従って、色空間の要素のうち一個は輝度情報である必要があった。Y I QのYは輝度そのものであるから、モノクロ用の送信情報と一致していたため、都合が良かったのである。 色情報である、I と Q は Y に重ね合わせることで送信されることになった。 カラー情報を輝度にどのように混ぜ合わせるのであろうか。それは以下の様に行われる。
テレビ画像は、細い水平走査線を縦に並べた構造を持っている。
この Y の偶数番目水平走査線(Yo)にカラー信号を足し、Yの奇数番目水平走査線(Ye)からカラー信号を引く。 具体的には、
  Ye=Y-C , Yo=Y+C
 受信後にYとCを分離する場合は、反対にする。
  Y=(Ye+Yo)/2 , C=(Yo-Ye)/2
 モノクロ受信機には、隣り合う水平走査線上に交互に逆の凹凸が含まれるが、見た目にはほとんどわからない。隣あう2本の水平走査線の輝度や色差はほとんど等しいという仮定を最大限に利用している。しかしながら、急激に輝度が変化する場合は誤差が大きくなる。カラーテレビに白黒の細い縦ストライプの服を着た人が映るとちらちら赤や緑の干渉縞が見えるが、あれはこのYC分離時の誤差である。
 RGB表色系との変換公式は、以下の様になる。
7-0-94-2


・YUV(Y Cb Cr、YCC)
 YUV は YIQ とほぼ同じである。Yの値は同一で、U,V の座標軸が I,Q と少し異なるだけである。 最近のHPで恐らく最も良く利用される、JPEG 等の静止画コンテンツは内部情報ではこの YUV を利用している。 また、デジタル動画像のフォーマット MPEG も内部情報では YUV 表色系を用いている。 人間の視覚特性に鋭敏な要素とそうでない要素が分離しているので、情報圧縮に非常に適している。
 RGB表色系との変換公式は、以下の様になる。
7-0-94-3

 
20 Jul

カラマネの基礎知識 No.3141

CMS理論-093

j.フィルタ機能
7-0-93-1 フィルタ機能は、画像編集ソフトで色相、彩度、明度を調整するフィルタである。
 図に示すように、Photoshopに組み込まれているフィルタで画像補正するときの機能は、「カスタム」で行なうことができる。
これまで説明したように、「カスタム」内9つの引数を色々と変化させることによって、あらゆるフィルタ機能を活用することができる。
 フィルタ(フィルタ、filter)とは、与えられた物の特定成分を取り除く(あるいは弱める)作用をする機能をもつものである。ある成分以外の全成分を弱めることにより、その成分だけを強調する効果を得る場合もある。さらに、各成分に対し何らかの処理を施す場合もある。
・フィルタの例
−光学フィルタ

透過する光を波長や偏光で制限するもの。他に、光源の周りに光条を発生させたり、明るい部分が暗い部分ににじみ出すような効果を生じさせるものもフィルタの一種とされる場合もある。
−電気フィルタ(濾波器)
加えられた電気信号の特定の周波数領域のみを強めたり弱めたりする電子回路のこと。詳しくはフィルタ回路を参照。ローパスフィルタ(高い周波数を弱め、低い周波数を通過させる)、ハイパスフィルタ(高い周波数を通過させる)、バンドパスフィルタ(特定の周波数範囲を通過させる)などがある。
−デジタルフィルタ
光学フィルタ、電気フィルタと同等の効果を、デジタル演算(デジタル信号処理)で実現したフィルタ。パーソナルコンピュータの音声再生ソフトのトーンコントロールやグラフィックイコライザー機能、フォトレタッチソフトの画像処理(ぼかし等)機能もこれに相当する。
−フィルタ(数学)
ある集合Xの部分集合の族Fが、空でなく、有限交叉性を持ち、A∈FでA⊂BならばB∈Fであるとき、Fをフィルタと言う。
コンピュータ・ソフトウェアにおいて、入力に対し何らかの選択・変換動作を行い結果を出力する機能を持つものをフィルタと呼ぶことがある。例えばテキストファイルを入力して、大文字を小文字に変換するプログラムはフィルタの一種である。
フィルタリングソフトは、インターネット上において、有害なサイトを遮断するソフト。
 
7-0-93-2

 
 上図は、Photoshop に具備されたフィルタ機能をまとめたものである。
 図の上部に示した4つの機能は、いずれも「フィルタ」の機能の中にある内容で、その機能を操作(マウスでクリック)するだけで、自動的に該当する機能の処理が行なわれる。図の下部にある「コンボリューション」の枠内の機能は、「フィルタ」→「その他」→「カスタム」を開くとカスタムフィルタダイアログが表示され、その中に9個の数字を入れることによってそれぞれのフィルタ機能が作動する。それぞれの数字にはプラス(+)かマイナス(−)の符号を持ち、それらの符号によって、処理結果が違ったものになってしまう。 これらの処理は、数学的な手法で処理されるが、特に、微分(エッジ強調、輪郭抽出など)や積分(ぼかしや平滑化など)が多用されており、また、電気的にもローパスフィルタ、ハイパスフィルタ、バンドパスフィルタなどの回路網などが応用されており、 いろいろな画像処理の機能を使用できるようになっている。

13 Jul

カラマネの基礎知識 No.3131

CMS理論-092

・階調画像圧縮: JPEG(非可逆圧縮)
−DCT(離散コサイン変換)符号化

 *周波数領域への変換(視覚系に合わせる)
7-0-92-1

 図は、4x4画素に対する離散コサイン変換符号化の例と計算式を示す。
直交変換は、画像を空間座標から周波数座標に変換する方式である。(上式参照)
直交変換の方式には、JPEGで採用されている離散コサイン変換(DCT)を始め、ウォルシュ・アダマール変換(WHT)、離散フーリエ変換(DFT)、離散サイン変換(DST)、ハール変換、スラント変換、カルーネン/レーベ変換(KLT)などがある。
−量子化
 *高周波領域ほど荒く高周波数の階調数を減らす。
7-0-92-2
量子化の例 (量子化係数=[1, 4, 4, 4, 4, 4, 4,4])
−ハフマン符号
 良く使用されるコードほど短いコードを与える(統計的な工夫する)。
 ハフマン符号とは、1952年にデビット・ハフマンによって開発された符号である。 コンパクト符号やエントロピー符号の1つである。 シャノン符号化が最適ではない場合が存在する不完全な符号であったのに対し、ハフマン符号は(整数の符号語長という制約のもとでは、)常に最適な符号を構成できる。 擬似的に実数の符号語長を割り振る算術符号と比較すれば、データ圧縮効率は劣る。
算術符号やその他の高効率の符号化法と異なり、特許の問題が無い。 そのため、JPEGやLHAなどの圧縮フォーマットで使用されている。
符号化の原理上、木を構成する前に各記号の出現頻度をあらかじめ知っておく必要がある。 1度目の読み込みで、データのすべての記号を調べておき、2度目に符号化を行う方法を、静的ハフマン符号と呼ぶ。 一方、1記号を読み込むごとに木を作り直し、1度の読み込みで符号化を行う方法を動的符号と呼ぶ。
−符号化の原理
 データに出現する記号の個数を求める。 それが木構造の葉に相当すると見なし、ボトムアップで木を構成する。まず、葉を含むすべての節点のうち、親を持たないものを集める。 その中から、最小の値をもつものと2番目に小さい値をもつものを取り出す。 それらを子供にもつ新しい節点を作る。 このとき、新しい節点の値は、両方の子供の値の和とする。以上を繰り返して根節点まで到達して木が完成される。 次に、根から順に左右に0と1の値を割り振っていく(左右のどちらに0と1を与えるかは任意)。 すると、それぞれの葉(記号)に対して、一意にビット列が与えられる。 この記号とビット列の関係をもとに、もとのデータの記号をビット列に変換していくことで符号化が行われる。
−例
 入力DAEBCBACBBBC に対して上記のアルゴリズムを適用すると、出現頻度と割り当てられた符号
文字個数符号
7-0-92-3

が得られ、個数の多い文字ほど短い符号が割り当てられていることが判る。

6 Jul

カラマネの基礎知識 No.3121

CMS理論-091

i.画像圧縮
・2値画像圧縮: ランレングス(可逆圧縮)

7-0-91-1

 連長圧縮(ランレングス圧縮、RLE:Run Length Encoding)は、データ圧縮アルゴリズムの1つで、可逆圧縮に分類される。
−符号化の原理
連長圧縮では、ある連続したデータを、そのデータ1つ分と連続した長さで表現することで圧縮している。
例えば、「A A A A A B B B B B B B B B A A A」は「A 5 B 9 A 3」と表せる。 これは、Aが5回続き、そのあとにBが9回、そしてAが3回続いていることを表している(連続回数を、元のデータを表す符号の前に記録することもある。その場合、符号化した後は「5 A 9 B 3 A」と表される)。
さらに、データがこの2種類だけで、最初にAが来ることにしておけば、「5 9 3」だけで表せる。 このルールに従ったときにBが最初に見つかった場合は、最初にAが0回連続していることにすれば良い。 例えば、「B B B A A A A A B B B B B A A A」は「0 3 5 5 3」で表せることになる。
こういったことから、白と黒以外にほとんど情報がないモノクロファクシミリでよく使われている。
−連長圧縮の欠点とその解決方法
連長圧縮の欠点は、データが連続していないと、符号化後のデータが元のデータより膨らんでしまうという点。 例えば、「A B C D A B C A B A B C D E」は「A 1 B 1 C 1 D 1 A 1 B 1 C 1 A 1 B 1 A 1 B 1 C 1 D 1 E 1」となる。 この場合の圧縮率は200%、つまり元の2倍に膨らんでしまった。 さらに、C言語など、動的にメモリを確保出来ない言語でプログラムする場合、メモリの確保を容易にするために元のサイズを記録しておいた方が都合が良いので、さらに大きくなってしまうことになる。
それを防ぐ方法はいくつかあるが、その中でも最も単純なのが、ある一定数だけ同じデータが繰り返した場合にだけランレングス圧縮を施すという方法である。例えば、次のデータを圧縮したとしよう。
7-0-91-2



この方法で符号化することで、通常の方法では8文字も必要だったものが6文字で済むようになる。
−PackBits
ところが、この方法では逆に連続するデータの圧縮率が低下してしまう。例えば、次のようなデータを圧縮したとしよう。
7-0-91-3



このように、場合によっては逆に圧縮率の低下に繋がることもある。そこで、連続しないデータが見つかった場合は、連続するデータが現れるまでの長さを記録していく方法がある。 たとえば先の「A A A A B B C C C C C C D E F G」という列があったとして、 4 A 2 B 6 C -4 D E F G と符号化する。- が付いた長さデータは連続しないデータの長さを表し、この例では「"A"が4、"B"が2、"C"が6ずつ続き、圧縮できない"DEFG"の4文字がある」と符号化されたことになる。 この方法をPackBitsと言い、TIFFやPICTなどで使われている。
−Switched Run Length Encoding
しかし、PackBitsでは、連続するデータの長さを保持出来る量が128バイト程度に限られてしまう。通常はそこまで連続することはなかなかないが、色数の少ない画像などでは十分に考え得る。その対策としては、コードの変わり目で連続データとして扱うか非連続データとして扱うかを交互に切り替えていくSwitched Run Length Encoding がある。
次のデータを圧縮しながら原理を解説する。
元のデータ:A B C D E E E E F F F F F F F
まずは非連続データとして扱い、PackBits同様に連続したデータが現れるまでの長さを記録し、その後ろに非連続データをそのまま出力する
5 A B C D E
連続したデータに出会ったら、次に連続しないデータに出会うまでの長さを記録する
5 A B C D E 3
再度、連続したデータが現れるまでの長さを記録し、その後ろに非連続データをそのまま出力する
5 A B C D E 3 1 F
△鉢をデータの末尾まで交互に繰り返していく
5 A B C D E 3 1 F 6
となる。
復号時は以下の手順に従う。
まずは非連続データとして扱い、最初の1文字を読み込んで長さを求めた後、後ろに続く非連続データをそのまま出力する
5 A B C D E 3 1 F 6 → A B C D E
復号し終えたら連続データとして扱うように切り替え、1文字だけ読み込んで連続する長さを求めた後、復号した最後の文字をその長さだけ繰り返し出力する。
5 A B C D E 3 1 F 6 → A B C D E E E E
再度非連続データとして扱い、1文字読み込んで長さを求めた後、続く非連続データをそのまま出力する
5 A B C D E 3 1 F 6 → A B C D E E E E F
2と3をデータの末尾まで交互に繰り返していく
5 A B C D E 3 1 F 6 → A B C D E E E E F F F F F F F
PackBitsとは違い、フラグビット※を用意する必要がないため、Switched Run Length Encodingでは256バイト程度までの長さを表現出来る。
※PackBitsでは長さを表す符号の左1ビットで非連続データか連続データかを区別するが、このような用途に使うビットをフラグビットと言う。
29 Jun

カラマネの基礎知識 No.3111

CMS理論-090

g.モザイク処理
・画素数を減少させる処理

−周囲の画素に一つの値を用いる
モザイク処理とは、画像ならびに映像において、表示させたくない部分をピクセル単位でぼかすために使用されるフィルタリング処理のことである。
このモザイク処理は、TVなどで盛んに使われる手法で、映像をぼかしてしまうようなシーンに採用されている。
 デジタル画像では、画素数(ビット数)を減らすことによってモザイク化が可能である。
どの程度ビット数を低減させるかは用途に応じて決めると良い。(下図参照)
7-0-90-1

「非可逆変換」によってモザイク処理を施したものは、元に戻すことができない(シャノン=ハートレーの定理を参照)。非可逆変換の方法としては、一定領域の色情報を読み込んでその平均値を算出し求められた結果をもとに画像を処理する方法や、一定領域の代表値で全体を塗りつぶす方法などがある。大半の動画・静止画のモザイク処理は、非可逆変換である。
可逆変換の方法としては「処理範囲を縦横に分割して並べ替える」という方法が代表例。静止画では、パソコン通信などにおけるわいせつ画像など非合法画像の合法化処理用ソフトウェアとして実用例がある。
動画では皆無であるか、稀有である。しかしながら、静止画における可逆変換モザイクは、その後「復元が可能な方法でモザイクをかけたものは、復元が可能であるため、合法化したものとはみなせない」という法的判断が出されたことから急速にすたれ、現在(21世紀)ではほとんど見かけることがなくなった。

h.画像合成
・クロマキー

−特定の色をスイッチに利用する。
 クロマキー(Chroma key)もしくはクロマキー合成は、キーイングの一種で、特定の色の成分から映像の一部を透明にし、そこに別の映像を合成する技術である。
 フィルムでは古くから使われてきたブルーバック合成を模したもので、均質な色の背景の前で人物を撮影し背景に別の映像をはめこむなどの使い方がなされる。アナログビデオ、デジタルビデオの両方で利用され、ライブでの使用も可能である。背景色には人物の肌色と補色の関係にあるブルーやグリーンが多く使用される。最も身近な例はニュースの天気予報の映像である。色(クロマ)を基にしたキー信号を使用するため、クロマキーと呼ぶ。
7-0-90-2

 テレビでのクロマキー合成はスイッチャーなどのM/K機能を用いるので、技術的には背景の青(緑)映像を元にキー信号を生成する回路が必要になる。簡単な原理は、入力映像信号を基準となる青(緑)の色信号と比較し、指定した誤差範囲で一致すれば有効なキー信号を発生するものである。背景と前景との境界部分にキー信号の変化を適切に処理して、境界部分で背景色が見えたり前景が隠されたりせず、すっきりと合成できる性能が求められる。このため、キー信号は2値キーでなく境界に傾斜を持たせられるリニアキー(ソフトキー)とするのが普通である。
 CMや映画など高品質の映像合成を求められる場合には、従来より35mmフィルムとブルーバックによる光学合成が利用されてきたが、90年代後半よりコンピュータによるデジタル合成技術が広まり、より高品質な合成映像を得ることが出来るようになっている。コンピュータ・ソフトウェアによるクロマキー合成では、ultimatte(アルチマット)、Primatte Keyer(プライマットキーヤー)、Keylight(キーライト)など専用の合成ソフトウェア(プラグイン)が用いられることが多い。
Adobe Premiereなどの映像ノンリニア編集ソフトにも簡単なクロマキーが出来る機能が入っている。


22 Jun

カラマネの基礎知識 No.3101

CMS理論-089

e.色変換
・マトリクスによる変換例

 −彩度を強調させた場合(上の変換サンプル)
 −彩度を低下させた場合(下の変換サンプル)
7-0-89-1

 原画像のRGBから新しいR’G’B’へマトリクスを変更して色変換をする例である。この例に示すように、「彩度を強調」する場合と「彩度を低下」させる場合の値の取り方に違いがあることに着目する。
・特定色の強調例
 原画像のRGBから新しいR’G’B’へマトリクスを変更して色変換して特定色を強調する例である。この例に示すように「赤色強調」の場合と「ピンク色強調」の場合では、値の取り方に違いがることに着目する。
7-0-89-2


f.空間周波数変換
・コンボリューションの原理(重み付け平均、畳み込み積分など)
 −シャープニングと平滑化

 
7-0-89-3

 上図は、原画像にシャープネスを施す場合と平滑化する場合の違いを表したものである。
それぞれ、フィルタマスクの掛け方を数字で示してあるので、その効果と意味を理解しできるであろう。結果として、シャープネスはエッジ強調、平滑化はぼかしの効果がある。
・エッジ強調(微分的)→シャープネス
・ぼかし(積分的)→平滑化
7-0-89-4

・シャープネス
 デジタルカメラでは、R・G・B・Gの4ピクセルから画像を生成する関係から、どうしてもシャープさにかけた画像になってしまう。そのためにアンシャープマスク処理は必須である。しかし、最近のデジタルカメラに搭載されているシャープネスは、このアンシャープマスクと同等のものもでてきたようなので、必ずしも Photoshop でかける必要はないかも知れない。
 アンシャープマスク処理にはもうひとつの意味がある。それは「輪郭強調」である。もともと原理的には輪郭強調なのであるが、効果としてはいろいろな使い方が考えられる。例えばきめ細かくかけることにより、画像全体を引き締める目的や、コントラストの強い部分にかける本当の意味の輪郭強調と言った目的がある。
 特にこの輪郭強調が有ると無いでは印刷時においてかなり印象が違ってくる。われわれは普段銀塩写真になれているが、フィルムはもともと現像時にエッジ効果と呼ばれる輪郭強調処理が物理的に発生している。しかしながらデジタルではないために、なんか不自然さが画像に見えてしまうのである。
 アンシャープマスク処理は2回行うとよい。1回目は通常のアンシャープマスク処理を施し、2回目に輪郭強調用のアンシャープマスク処理を施す。順番は関係ないが、できればL*a*b*カラーに変換し、「L」チャンネルにかけるとより精度を上げることができる。

・平滑化
平滑化フィルタは次のように9個の成分が全部1/9になっている。
1/91/91/9
1/91/91/9
1/91/91/9
7-0-89-5

 この平滑化フィルタは9個の成分値の合計を計算して最後に9で割るのと同じである。つまり9個の平均を計算している。でこぼこがなくなり、変化がなめらかになる。

15 Jun

カラマネの基礎知識 No.3091

CMS理論-088

d.階調変換
 階調変調には、ポスタリゼーションとイコライゼーションの2つがある。
・ポスタリゼーション
−階調数を減少させる処理

7-0-88-1

 ポスタリゼーション(階調変更)とは、グラフィックの階調を変える処理である。通常のフルカラーグラフィックはRGBそれぞれ256階調で表現されているが、この階調を変えてやることで様々な効果を出すことが可能で、さらに他の処理の前処理として使われることも多いようである。
−階調の変更
 ここでは、RGB各256段階の階調を任意の数の階調に変更してみる。つまり、0~255の値を階調数分の区間に区切るわけである。この分割は簡単で256を階調数で割れば、区間に含まれる階調数が求まる。例えば、2階調に分けるのなら0-127、128-155と各区間に元の256階調の内の128階調が含まれるわけである。3階調の場合は、割り切れず86、85、85となるので0-85(この区間のみ86階調)、86-170、171-255などとすることになる。
 区間が求まってから問題になるのは、その区間の「値」。これは、やはり全体を等分に分ける値を採用したいところである。ただし、コントラストを低下させないために最初と最後の区間は最小値である0、最大値である155にする。例えば、256段階0-255の階調を2階調にするのなら、0-127、128-255と分けられるが、それぞれの値は0-127が0,128-255は255とする。また、3階調なら最初と最後は最小・最大である0と255を対応させ、間にはその中間である127か128を置くと良さそうである。4階調なら、最初と最後の間が2つあるので階調の幅を85にすると(0、85、170、255)ちょうど収まる。
7-0-88-2

 以上の例を見てみると、階調の値の増加幅は255を階調数-1で割ったもの、になりそうである。実際、簡単な図を描いてみれば最初と最後を除いた「間」にある区間の数は階調数-2なので、その間に区間の数だけの値を等分に配置するには全体の増加数255を階調数-1で割れば良いことがわかる。これは、値が0となる最初の階調を除いた区間を残りの区間数(全体の区間数-1)で等分する、と考えても良い。
 ただし、こうして求まった階調の増加幅を順次加えていくことで得られる階調の値は、「全体を」等分に分ける値なので「各区間の」中央値とは一致しない場合もある点に注意する(例えば、上の4階調の例を見ても一致していない)。場合によっては、間の区間については区間の中央値をとった方が良いこともあるかもしれない。
・イコライゼーション
−ヒストグラムを平坦 にする処理

7-0-88-3

 イコライゼーションとは、階調変換処理を行うことである。
図示したように、ヒストグラムを使って画像データを平坦化して階調変換する。この画像の場合、入出力の関係は、ガンマ=1に対してS字カーブを描く特性になる。
−医療分野に応用した具体例
7-0-88-4

 これら3枚の図は、イコライゼーションする仕組みと通常のイコライぜーション処理を説明するものである。通常のイコライゼーション処理では鮮明でなかった画像が、専用のアルゴリズムを使って改善処理を施した後で、実写画像を見ると再現された画像は、実物に近い仕上がりになっている。


8 Jun

カラマネの基礎知識 No.3081

CMS理論-087

c.画像の補間
・色域と色変換
 −色域(カラースペース)

  モニタ(テレビやコンピュータ等)、プリンタ、デジタルカメラなど、近年、RGB 
 カラーモードを扱うデバイスが多く存在する。
  しかし、これらデバイスは、それぞれRGBの色域が異なるため、同一RGB値の色
 を表示する場合であっても、デバイスが異なれば、異なる色が表示されてしまうことが
 ある(通常、機器固有の色域の中で最も近い色が表示される)。
  なお、色域(カラースペース)とは、再現できる色の鮮やかさの限界範囲である。
  銀塩フィルムでも、フィルムや現像するラボ機が違えば、色味が異なる。
  (いろいろな色域)
   ・CIE系色空間(人間が識別可能な色域)
   ・RGB(カラーポジフィルムの色再現範囲と略等しい)
   ・CMYK
  (色域の範囲)
   CIE系色空間>RGB>CMYK
  (国際標準色空間)
   ・sRGB
    デジタルカメラの色合いは、一般に、Exifというフォーマット形式でsRGB  
   (色彩や彩度などを規定・統一した国際標準色空間)という色空間を利用するとい
   うように決められている。
    すなわち、デジタルカメラでは、実際のRGB色の再現性が機種により様々であ  
   っても、sRGBにより、入力機器に依存されないRGB空間が定められている。
    このため、sRGB対応の機器ならば、同一のRGB値が与えられれば、機器同士の
   間で同一の色が再現されるようになる。
    なお、標準のデジタルカメラ(コンシューマ機)は「sRGB」に対応しているが、
   高級一眼カメラ等には「AdobeRGB」に対応するものもある。
    「AdobeRGB」は、「sRGB」よりも大きなカラースペースを持っているため、よ
   り豊かな色再現が可能になる。
 −色変換
  測色的色再現は、あるデバイスでの三刺激値を(X1、Y1、Z1)、別のデバイス
 での三刺激値を(X2、Y2、Z2)とするとき、
  「X1=X2、Y1=Y2、Z1=Z2」
  のような関係式が成り立つような色再現である。
  測色的色再現では、
   測色値を均等色空間(L*u*v*やL*a*b*)で扱うか、
   観測用照明光源を撮影系の光源と一致させるか、
  などの問題があるものの、三刺激値あるいは色度値の一致に基づいた色再現を目標と
 することに変わりはない。
  ただし、実際の処理では、画像デバイスにより色再現範囲が異なるため、各デバイス
 が持つガモット範囲外の再現をどうするかが重要になる。
  この場合の処理としては、
   .モット範囲外の色は全て最大再現域の色に置き換える。
   ⊆臟板垢鯤儔修気擦困縫モット範囲内にて線形補間あるいは非線形補間を行う。
  などがある。
  また、色変換としては、
   (儡好泪肇螢ス
   LUT(Look Up Table)
   ニューラルネットワーク
  などを用いる手法が採用されている。
  いずれも色票間の色差を最小にするような変換が行われる。
  (CMYK変換)
   PhotoshopでCMYK変換する場合、大事なポイントは、「カラー設定」と「プロフ
  ァイル変換
」と「アンシャープマスク」のかけ方である。
   → CMYKデータの最適化
   → アンシャープマスク
  カラー設定は、色域(カラースペース)に何を選ぶか、ということである。
   プリンタで印刷する場合、受け取ったファイルのカラースペースに合わせて、カラ
  ースペースを選択する必要がある。
   → 色域(カラースペース)
・補間方法(近似法)7-0-87-1
 多値画像(グレー画像)やカラー画像を用いて、高精度な画像処理(回転、拡大、変形等)を行う際に避けて通れないのが、画像補間法である。
 次の3つがあり、高次になるほど画質は良くなる。
 −最近傍法(0次近似)
 −線形補間(1次近似)
 −高次補間(N次近似)
・画像補間の例
 画像を拡大、縮小表示する時の補間方法を変更することができる。
 
7-0-87-2

 色変換法には、最も良く使われている「最近傍法」「線型補間」「高次補間」などがあり、上図に示した計算式で色変換が行われる。当然のことであるが、色変換の次数を上げるほど、画質はよくなる傾向にある。
 この中で「線型補間」の計算例では、画像データ上にある点(画素)Dは、補間曲線上の座標点D(x、y)に位置することが判る。計算は、図の式にxy座標と位置データ(d0〜d3)を与えることによって求められる。


1 Jun

カラマネの基礎知識 No.3071

CMS理論-086

7.2 基本的な画像処理
a.画像変換
・アフィン変換

 アフィン変換とは、ユークリッド幾何学的な線型変換と平行移動の組み合わせによる図形や形状の移動、変形方式である。例えば、4×4の行列演算で表現できる移動、回転、左右反転、拡大、縮小、シアーの座標変換をいう。
7-0-86-1

7-0-86-2
7-0-86-3





b.任意の形状に変換
・アフィン写像

 数学とくに幾何学において、アフィン写像あるいはアフィン線型写像とは、アフィン空間の構造を保つような写像のことである。とくに始域と終域が同じであるようなアフィン写像をアフィン変換という。
−定義
2つのアフィン空間 (A, V(A)), (B, V(B)) に対し、写像 f: (A, V(A)) → (B, V(B)) がアフィン写像であるとは、写像 f: A → B と線形写像 V(f): V(A) → V(B) の組 (f, V(f)) であって、条件
任意の a ∈ V(A) に対し、 a={PQ}バー (P, Q ∈ A) ならば、V(f)(a) ={f(P)(Q)}バー 。
任意の P ∈ A, a ∈ V に対し、f(P + a) = f(P) + V(f)(a) が成り立つ。ただし、+ a, + V(f)(a) はそれぞれ、A, B でベクトル a, V(f)(a) が定める平行移動。
を満たすもののことである。これを単にアフィン写像 f: A → B ということがある。(<- fix me.)
特に、写像 f: A → B が全単射で線形写像 f: V(A) → V(B) がベクトル空間の同型であるならば、アフィン写像 f: (A, V(A)) → (B, V(B)) は同型である、あるいはアフィン同型写像であるという。
n 次元アフィン空間 A から m 次元アフィン空間 B へのアフィン線型写像は、座標系を固定してやることにより、アフィン空間の各元の座標の変換式として、m 行 n 列の行列 T と定ベクトル b を用いて、
  x → y = Tx + b    (1)
の形で与えられる。特に m = n かつ行列 T が正則ならば、このアフィン線型写像は正則であるという。
アフィン変換は直線を直線に写し、線分比を保つ。アフィン空間 A 内の図形 C が A 上の正則なアフィン変換 f によって別の図形 D に移されるなら C と D はアフィン合同であるという。ユークリッド空間において相似な図形、とくに合同な図形は、互いにアフィン合同である。
−アフィン変換群
 二つのアフィン変換の合成は、やはりアフィン変換である。あるアフィン空間 A 上のアフィン変換の全体 aff(A) は合成に関して群を成す。(<- fix me.)
−工学応用7-0-86-5
 画像処理、特にベクトルベースでベジェ曲線を扱うソフトなどでは、アフィン変換により拡大・縮小、平行移動、回転を処理する。効果の合成を行列積で表現できるため、入れ子の図形を扱うのも容易である。
・アフィン変換を用いた顔の動きの表現
 顔の向きを推定するにあたって、本手法では、目や鼻、口などの顔の各特徴は3次元空間内で同一平面上にのっているという仮定を用いる。この平面を以下、平面Pとする。つまり、平面Pの法線ベクトルの方向を求めることが人間の顔の向きの推定となる。そこで、画像上での顔の各特徴を追跡することで、それらの位置の変化をアフィン変換を用いて表現し、それにより平面Pの3次元空間中の運動を求め、法線ベクトルの方向の推定を行う。
平面Pが光軸に垂直なときの顔の各特徴の画像上での座標をそれぞれの初期位置とする。追跡する特徴の数をM個(実験システムではM=10)としたとき、その初期位置をxk (k=1,2,3,・・・,M)
とおく。人間が顔の向きを変化させるとき、画像平面上で各特徴の位置は移動する。顔の各特徴は同一平面上にのっていて、その位置関係は不変であると仮定する。従って、それらの移動後の位置x’kと初期位置xkの関係は (2)式のように回転、拡大・縮小、せん断を表すアフィン変換行列と並進ベクトルで表現することができる。
7-0-86-6   



 平面Pの初期位置を与えているため、(2)式のパラメータから平面Pの3次元空間中の運動を求めることができる。 (2)式のパラメータは最小自乗法により推定する。

livedoor 天気
livedoor ピクス
本ブログパーツの提供を終了しました
最新コメント
訪問者数
  • 今日:
  • 昨日:
  • 累計:

最新トラックバック