分散システムにおける暗号の利用

分散システム

                                       電子・情報工学系
                                       新城 靖
                                       <yas@is.tsukuba.ac.jp>

このページは、次の URL にあります。
http://www.hlla.is.tsukuba.ac.jp/~yas/coins/dsys-2000/2000-02-13
あるいは、次のページから手繰っていくこともできます。
http://www.hlla.is.tsukuba.ac.jp/~yas/coins/
http://www.hlla.is.tsukuba.ac.jp/~yas/index-j.html

■復習

◆分散システムと暗号

構成要素間の通信の機密を暗号を使って守る。

認証に使う。分散システムでは物理的な位置が使えない。

■暗号

暗号が使われてきたグループ4つ

暗号技術を甘く見たグループ

◆暗号に関する基本用語と安全性

暗号とは、情報の意味が当事者以外にはわからないように情報を変 換することである。

図? 暗号の考え方

図? 暗号の考え方

平文
元の情報
暗号文
変換された情報
平文、暗号文といっても、文字だけでなく、画像や音声などコンピュータが扱 えるあらゆるデータが想定されている。

暗号化
平文を暗号文に変換すること。暗号化鍵が必要。
復号化
暗号文を平文にもどすこと。復号化鍵が必要。
暗号化や複合化に必要な(短い)データ。
解読 当事者以外の第三者が、暗号文を元にもどすこと、あるいは、復号化鍵を得る こと。
暗号化や複合化の方法(アルゴリズム)は、何種類もある。

◆鍵の重要性

なぜ鍵を使うのか。

暗号化の方法が秘密になっていると、一見、より強そうにみえる。しかし、そ の暗号が、強いのか弱いのか調べる方法がない

暗号の安全性は、鍵の安全性によっている。 鍵の管理が非常に重要となる。

暗号化のプログラムを作成した人でも、鍵を知らなければ平文を得ることがで きない。

◆暗号の経済学

暗号の安全は、解読にかかるコストを大きくすることで、解読され た平文から得られる利益を相対的に小さくすることに依存している。

鍵を長くするだけで、安全性が指数関数的に高くなる。 鍵を1ビット長くすると、解読時間が2倍になる。

図? 指数関数

図? 指数関数

図? 指数関数

図? 指数関数

パスワードは、コンピュータの中では、暗号化の鍵として使われる。 長いパスワードは、破られにくい。1文字(大文字小文字数字記号)増やすと、 総当たりで解読に要する時間が、50倍から100倍近くかかるようになる。

暗号の安全にとって、最近のコンピュータの高速化と低下価格下は、 1つの脅威となっている。

SETI (the Search for Extraterrestrial Intelligence)

◆分類

暗号アルゴリズム

◆共通鍵暗号系と公開鍵暗号系

暗号の方法は、大きく2つに分類される

共通鍵暗号系(対称暗号系)
暗号化鍵と復号化鍵が同じ(または片方から片方が簡単に計算できる)。
公開鍵暗号系(非対称暗号系) 暗号化鍵から復号化鍵を容易に類推できない。

◆Caesar暗号

Caesar暗号は、置換暗号(substitution cipher)の1つ。置換暗号では、各 文字あるいは文字群が、それぞれ別の文字あるいは文字群に置換される。

Caesar暗号は、知れている最後の暗号である。 平文アルファベットをN文字ずらした暗号文アルファベットに変える。

N=2 の時の対応表

abcdefghijklmnopqrstuvwxyz
CDEFGHIJKLMNOPQRSTUVWXYZAB
暗号の説明では、平文を小文字で、暗号文を大文字で書く習慣がある。 カルタゴ人以来騙された人はいない。

N=13 で、大文字小文字を保存する方法を、rot13 暗号という。rot13 は、電 子メールやネットワーク・ニュースで「ネタばらし」の部分を書く時に使われ る。

◆コード化

暗号の文脈でコード化とは、可変長の言語単位(単語)などを符号化すること を意味する。普通の暗号では、文字単位など固定長を符号化する。

◆スーパー暗号化

コード化されたメッセージを暗号化する。 うまくつかえば、解読が難しくなる。

第2次世界大戦中、アメリカの日本大使館と本国の間の通信では、ローマ字で かかれた日本語が使われていた。それは、すべてアメリカ側に解読されてた。

解読されたという事実がシカゴの新聞に出たのに、日本政府はそれを信用せず、 終戦までそのコードを使い続けた。

◆排他的論理和

排他的論理和(exclusive or)は、暗号でよくつかわれる演算。 記号は、+に○。

真理値表

------------------------
入力1	入力2	出力
------------------------
0	0	0
1	0	1
0	1	1
1	1	0
------------------------

AND、OR、NOTで表わすと次の通り

OR(AND(入力1,NOT(入力2)),AND(NOT(入力1),入力2))

次のような性質がある。

◆乱数(random numbers)

数の集合から、無作為抽出で抜き出された数。

真性乱数。ビット列にすると、0と1の発生確率がそれぞれ1/2で、各ビッ トは他の部分と独立(iid(independent and identically distributed)) である。

物理乱数。量子力学の効果を増幅してディジタル化したもの。 平滑化して0,1のバランスをとれば、真性乱数になる。

疑似乱数(pseudo random number)。種(seed)と呼ばれる入力ビットパタンを基 に計算された、種よりも長いランダムに見えるビット・パタン。種が決まれば 出力乱数は一意に決まる。

◆乱数を使った暗号

Caesar暗号では、定数だけずらしていた。定数ではなく、文字の長さの乱数の 列を使い、文字ごとに乱数の数だけだけずらす。

例:

乱数表: 0 18 19 22 22  7  9  4 14  3
 平文: h  e  l  l  o  w  o  r  l  d
        8  5 12 12 15 23 15 18 12  4
暗号文: H  W  E  H  K  D  X  V  Z  G
   : 8 23  5  8 11  4 24 22 26  7
乱数表そのものや、大きな乱数表の中でどこから使い始めるかを鍵にすること ができる。

一度しか乱数列を使わないので、One-time Padとも呼ばれる。

真性乱数を使うと、解読する方法は数学的に存在しないことが証明されている。

しかし、使うのが大変。送信側と受信側で同じ真性乱数を作るのが大変。

乱数表を記憶する変わりに、疑似乱数を使う方法がある。 疑似乱数を使ったものは、他の暗号法と同じく解読される。 使う疑似乱数の性質が悪いと簡単に解読される。

実際には、文字をずらすのではなく、足し算、引き算や、排他的論理和と呼ば れる計算が使われることが多い。

◆転置暗号

Caesar暗号やバーナム暗号では、平文の文字の順序を変えずに、文字を置き換 える。これを置換暗号という。これにたいして、転置暗号(transposition cipher)では、平文の文字の順序を入れ替えるが、文字の置き換えは行わない。 (下の例では、大文字小文字が変わっているが、これは暗号化の説明のために 変えて書いているだけである。)

次は、転置暗号の1つ、コラム転置の例である。キーは、同じ文字を含まない 1個の単語や熟語である。このキーでコラムに番号付けをする。たとえばコラ ム1は、アルファベットで先頭に近い文字の下のコラムとなる。

MEGABUCK
--------
74512836
--------
pleasetr
ansferon
emillion
dollarst
omyswiss
bankacco
untsixtw
otwoabcd
 平文: pleasetransferonemilliondollarstomyswissbankaccountsixtwotwo
暗号文: AFLLSKSOSELAWAIATOOSSCTCLNMOMANTESILYNTWRNNTSOWDPAEDOBUOERIRICXB

◆DES

DES(Data Encryption Standard)は、アメリカ商務省標準局 (NBS, National Bureau of Standard, 現在のNIST, National Institute of Standrds and Technology)が1977年に定めた暗 号標準である。IBM社による提案が元になっている。DESは、 アメリカ政府内で、コンピュータ・データのうち、非機密だが取扱 い注意(unclassified but sensitive)のデータを暗号化するため の標準である。DESを一般の商用にも使うことを推奨している。 たとえば、UNIXのパスワード・ファイルは、DESにより暗号 化されている。

DESは、対称暗号系(慣用暗号系)の1つであり、暗号化と復号 化に同一の鍵(56ビット)を用いる。DESは、転時暗号の一種 である。転時暗号では、平文の文字の順序(コンピュータでは、ビッ ト)を入れ替えるものである。DESでは、64ビットの平文につ いて、鍵をもとにビットの入れ替えを16段繰り返す。

アメリカでは、DESを取り扱うチップ(IC)が多く利用されて いる。アメリカは、暗号に関する製品がソフトウェアも含めて輸出 禁止になっており、DESチップもその制約を受けている。DES 暗号化を行うソフトウェアについては、アメリカ以外で開発された ものが広くインターネット上で配布されている。

DESが作られる時、コンピュータ科学者は、56ビットのキーの長さでは短 すぎると主張した。IBMの提案は、128ビットだった。安全保証局の要求 で、56ビットに減らされた。1988年にアメリカ連邦政府は、1988年 にDESの効果を保証しないと決定した。

2000年に次世代の標準、AES(Advanced Encryption Standard)が選定された。

Rijndael

ブロックサイズ:128ビット

キー・サイズ:128, 192, 256ビット。

http://csrc.nist.gov/encryption/aes/

■一方向関数

引数から結果を求めるのは簡単だが、結果から引数を求めることは難しい。

y = f(x)

暗号で使われるのは、Collision Proof 性が求められる。

暗号を使えば、一方向関数が作れる。

one_way_function( x )
{
	return x をキーとして 0 を暗号化したもの ;
}
Unix の /etc/passwd に保存されているものは、DES を25回繰り返して使って 作った一方向関数の結果。パスワードそのものは、保存されてない。

◆メッセージ・ダイジェスト

元データからデータの指紋と呼ぶべきような特徴的な数(普通は元データの長 さによらず固定長)を抽出するもの。

チェックサムや CRC (Cyclic Redundancy Check) にも似ているが、一方向関 数としての Collision Proof 性が求められる。

元データが壊れていないか(誰かに改ざんされていないか)を調べる時には、 メッセージ・ダイジェストを計算して比較する。

◆MD2、MD4、MD5

RSA社の B.Kaliski や R.Rivest らによって提案されたメッセージ・ダイジェ ストのアルゴリズム。任意の長さのデータから128ビットのメッセージ・ダイ ジェストを生成する。

◆公開鍵暗号系

公開鍵暗号系(非対称暗号系)では2つの異なる鍵を用いる。 便宜上、この2つを公開鍵と秘密鍵と呼ぶ。

これらの鍵は、互いに相手の逆関数になっている。

公開鍵暗号を使った暗号通信の手順

図? 公開鍵暗号を使った暗号通信の手順

図? 公開鍵暗号を使った暗号通信の手順

  1. 受手は、公開鍵と秘密鍵の組を作り、公開鍵を誰でも読めるようにする。
  2. 送手は、受手の公開鍵を暗号化鍵として用いて暗号文を作り、送る。
  3. 送手は、受け取った暗号文を、自分の秘密鍵を復号化鍵として用いて復号化し、 元の平文を得る。

ここで、公開鍵から秘密鍵を計算することは難しい。ある平文を公開鍵で暗号 化してみたところで、秘密鍵を得ることは難しい。

公開鍵暗号の利点は、鍵を管理する手間が掛らないこと。

共通鍵暗号
情報を交換する間で鍵を安全に共有しなければならない。しかも、通信 相手ごとに鍵を変える必要がある。
公開鍵暗号
受手ごとに、1つの暗号化鍵を公開するだけでよい。今までに通信をしたこと がない人からでも、暗号化されたメッセージを受け取ることが可能である。
公開鍵暗号系は、暗号通信だけでなくディジタル署名や利用者認証、電子現金 にも応用される。

o

◆RSA

RSA暗号は、Rivest, Shamir, Adleman の3人によって開発され た公開鍵暗号系。

RSA暗号の安全性は、大きな数を素因数分解することの難しさに基づく。 北米でのRSAの特許は、2000年で切れた。

RSAの技術は、Netscape社の SSL でも利用されている。

■RSAの仕組み

次のようにして、P、Q、N、E、D を決める。
    大きな素数 P、Q を求める。P、Q は、普通は、512 ビット以上(10進数で150 桁)以上が使われる。
  1. N = P*Q とする。
  2. N のオイラー関数Φ(N)==(P-1)(Q-1) に関して互いに素である 任意の数 E を選ぶ。
  3. Φ(N) の modulo の基での E 逆関数、つまり
    ED = 1 mod Φ(N)
    となる D を求める。
これから秘密鍵と公開鍵は、次のようにして決められる。
秘密鍵
(P,Q,D) あるいは (D, N) あるいは (D)
公開鍵
(E,N)
メッセージ文を M、暗号文を C とすると、暗号化と復号化は次のようになる。
暗号化
C = M E mod N
復号化
M = C D mod N

◆認証

認証とは、情報の正当性や完全性を確保する技術である。

利用者認証
アクセスしてきた人が正当か否かを判定する。 しばしばパスワードや暗唱番号が用いられる。
ディジタル署名(メッセージ認証、電子署名)
通常の署名とおなじく、送られてきたメッセージが送信者本人のもので あることを識別、確認すること。

◆キャッシュカードによる現金引出しにおける認証

カードを持っているかどうか&暗証番号

◆公開鍵による認証

乱数を送って、秘密鍵で暗号化してもらう。

公開鍵で復号化して、元の乱数が得られたら Ok。

毎回違う数を使えば、傍受されていても平気。

  1. 口座を開く時に、顧客は、公開鍵と秘密鍵を生成し、公開鍵を銀行に届 け、秘密鍵を自分で保持する。
  2. 顧客が通信回線を通じて銀行にアクセスしてきた時、銀行は乱数を1つ 生成し、顧客の公開鍵でそれを暗号化し、顧客に送り返す。
  3. 顧客は、送られてきた暗号化された乱数を、保持している秘密鍵で復号 化し、銀行に送り返す。
  4. 銀行は、顧客から返された乱数が正しければ、正当な顧客であると判定 する。
次回の呼び出しでは、別の乱数を用いることで、通信を記録している傍受者に も対応することができる。

◆ディジタル署名(電子署名)

ディジタル署名では、次のようなシステムが必要である。

公開鍵暗号系を使ってディジタル署名を行うことができる。

図? 公開鍵暗号を使ったディジタル署名の手順

図? 公開鍵暗号を使ったディジタル署名の手順

  1. (受手ではなく)送手は、公開鍵と秘密鍵の組を作り、公開鍵を誰でも 読めるようにする。
  2. 送手は、自分の秘密鍵を暗号化鍵として用いて暗号文を作り、送る。
  3. 送手は、受け取った暗号文を、送手の秘密鍵を復号化鍵として用いて復 号化し、元の平文を得る。この時、きちんと平文が得られた場合、その平文は、 その公開鍵の持ち主から送られてきたことがわかる。

メッセージ全体を暗号化する代わりに、メッセージを平文で送り、それにメッ セージを一方向関数(ハッシュ関数)と呼ばれる方法で計算した結果だけを、 秘密鍵で暗号化したものを送る方法もある。一方向関数では、計算結果から元 の値(メッセージ)を計算することが難しい。

ディジタル署名や利用者認証は、公開鍵暗号系ではなく、共通鍵暗号系を用い ても可能である。ただし、この場合、鍵を管理する信用できる管理センターが 必要となる。

◆公開鍵が正しいか

その公開鍵が正しいかどうかを、どうやって確かめるか。

■PGP(Pretty Good Privacy)

PGP は、もともと Phil Zimmermannによって書かれた、公開鍵暗号方式による 暗号ソフトウェア。

もともとRSAのみ。後に、DH/DSS (Diffie-Hellman/Digital Signature Standard)に対応。

データの暗号化は、対称暗号系(DES, 3DES, IDEA, SHA)で行う。その対称暗号 系の鍵の管理に公開鍵を使う。

いいろろなOSで使える。

主な利用方法。

最近では、ディスク全体の暗号化、VPN (Virtual Private Network)の実現に も使われる。

アメリカ政府による暗号技術独占に対抗する形で開発が始まった。

アメリカ政府による輸出規制は、1999年に緩和された。

それ以前は、次のような分類があった。

系列

5.0系列は、本に印刷したものを正規手続きで輸出した。 後でスキャナで取り込んだ。

PGP Users Manual for Windows by daasan@anet.ne.jp'

(仮)日本の公式 PGP ホームページ(IIJ研究所)

◆GnuPG (GNU Privacy Guard)

GNU による PGP 互換のソフトウェア。

PGP の機能のうち、特許に触れるもの(IDEAアルゴリズム)を使わない。

http://hp.vector.co.jp/authors/VA019487/
The GNU Privacy Guard講座

http://www.gnupg.org/rfc2440.html
RFC 2440 (html)

http://hp.vector.co.jp/authors/VA019487/openpgp.html
RFC 2440 日本語訳 (html)

■電子現金

電子現金(electronic cash、電子マネー)とは、現金が持っている有用な性 質をディジタル情報を使って実現しようとするもの。

■通信路の暗号化

■SSH(Secure Shell)

Unix r系コマンドの置き換え。

◆r系コマンドの弱点

IP spoofing (なりすまし).

rsh のセッションで行われるであろうパケットを偽造する。

IP アドレスでホストを認証すると危ない。

DNS spoofing.

偽のDNSのサーバを立てる。

source routing。

◆SSHでの解決

ホストの認証を、IP アドレスではなく、公開鍵で行う。

サーバは、2つの鍵と64ビットの乱数を送る。 クライアントは、乱数を送り返す。 乱数が一致したら、IP spoofing されていない。

クライアントは、セッション鍵(対称暗号系の鍵)をサーバの2つの公開鍵で 暗号化して送る。

対象暗号の鍵(セッション鍵)を生成し、公開鍵で送る。

これ以降の通信は、セッション鍵で暗号化される。

◆SSHでのユーザの認証

暗号化された通信絽が確立された後は、パスワードを流しても安全。

個人ごとに RSA 公開鍵での認証機能を利用したほうがよい。

◆SSH 1.5 のパケット

+------------+------------------+------+----------------+----------------+
| パケット長 | 乱数のパディング | 種類 |     データ     | チェックバイト |
+------------+------------------+------+----------------+----------------+
パケット長以外が暗号化される。データの圧縮も行われる。

◆トンネリング(port forwarding)

SSH で暗号化された通信路の中に一般のアプリケーションの通信を通す。

よくつかわれるもの。

使い方:

ssh -L 10110:remote:110 remote

ローカルのポート番号 10110 に来た要求を、remote の 110 に転送する。

ftp は、使いにくい。

■SSL(Security Session Layer)

Netscape 社によって開発された。 主に、HTTP の暗号化に使われている(他にも使える)。

フリーの実現がある。

3種類認証モデル

良く使われるのは、2番目。

クライアントは、サーバから証明書を取り寄せる。 その証明書を、予め持っている認証局に問い合わて確認する。

セッション鍵と乱数の交換

セッションの再会機能がある。サーバ、または、クライアントのどちらかが危 ないと思えば、最初からハンドシェークをやりなおす。

セッション鍵と乱数から一方向関数(ハッシュ)で、接続ごとに変わるデータ 暗号化鍵とMACシークレット(乱数)を生成する。

データは、MAC (Message Authentication Code)で保護される。

接続ごとの暗号化鍵が破られただけでは、MACシークレットによりメッセージ の改ざんはできない。

少し前まで、輸出用 WWW ブラウザは、鍵の長さが40ビットに制限されてい た。今は、128ビットまで使える。

サーバの証明書の値段が、使える鍵の長さで違う。安い40ビットを使っても 意味はない。

■cookie

cookieは、コンピュータ・サイエンスの専門用語。

協調して動作しているプログラムの間で、ある一連の作業を識別するための数 を意味する。

RPC、HTTP(WWW)で使われる。

◆NFS/RPC での cookieの利用

ディレクトリの読み込み手続き nfsproc_readdir() で、ディレクトリのどの 位置まで読み込んだかを示すために使われている。

NFS が利用している SunRPC では、UDP/IP実装の制限から最大のメッセージの 長さが決まっている。上限を越えるディレクトリを読み込む場合、1回のRPC で終らない。

nfsproc_readdir() の1回目と2回目の RPC の間にディレクトリの内容が更 新された場合、どのような結果になるのか予想できない。

◆WWWでのcookie

WWW(World Wide Web)では、1回のデータ転送ごとに通信路が切断される ので、通常はWWWのブラウザ(クライアント)とWWWサーバの間では、途 中経過を保持することができない。

途中経過を保存したい時:

WWWで途中経過を保存するためには、cookie が使われる。

サーバは、その情報を利用して、適切なページ(たとえば前回最後に訪れたペー ジ)を表示させるようにすることができる。

◆WWW cookieとプライバシ

現在の Cookie の実現では、利用者のプライバシーを犯す危険性が高いという 問題が指摘されている。

普通のWWWサーバでは、要求を送ってきたコンピュータのIPアドレスを記 録しているので、コンピュータ単位でのアクセス状況を記録することはできる が、個人を特定することはできない。

クッキーを利用することにより、コンピュータではなくどの個人がアクセスし てきたかを記録することができる。

クッキーから電子メールのアドレスや氏名まで調べることはできない。 しかし、インターネットをサーフしている間にどこかでそれを打ち込んだが最 後、クッキーと電子メール・アドレスや氏名との対応が記録されてしまう危険 性がある。

参考 Netscape社によるWWWにおけるクッキー実現の案
http://www.netscape.com/newsref/std/cookie_spec.html


↑[もどる] ・[2月6日] →[2月13日]
Last updated: 2001/02/13 01:25:22
Yasushi Shinjo / <yas@is.tsukuba.ac.jp>