音声、静止画像、動画像の符号化

					2010年04月27日
情報科学類 コンピュータリテラシ

                                       筑波大学 システム情報工学研究科 
                                       コンピュータサイエンス専攻, 電子・情報工学系
                                       新城 靖
                                       <yas@is.tsukuba.ac.jp>

このページは、次の URL にあります。
http://www.coins.tsukuba.ac.jp/~yas/coins/literacy-2010/2010-04-27
あるいは、次のページから手繰っていくこともできます。
http://www.coins.tsukuba.ac.jp/~yas/
http://www.cs.tsukuba.ac.jp/~yas/

■連絡事項

■補足

Firefox がどのページを見ても文字化けすることがある。原因は不明。対処方 法として、Firefox を一度「終了」して、もう一時実行すると直ることがある。

Firefox を「終了」するには、一番上のメニューバーにある「Firefox」メニュー の「Firefoxを終了」を選ぶ。単にウィンドウを閉じただけでは終了したことに ならない。

プログラムが動いているか終了しているかどうかの判定方法

TA は、一部の形式的なメールに怒っていた。 課題4 電子メール、Emacs(2)にも書いたように、 TA は人間であり、単に宿題を受け付けるための箱ではない。

Emacs

引数とは、コマンドや関数に与えるデータのうち、実行開始前に与えるもの。 データは、実行開始後にファイルやネットワークから得ることもある。

例:「cat コマンドに引数として ~/.bashrc を与える。」

bash でも、Emacs 風のキーが使える。

クリップボード。MacOSX 用のアプリケーション間でコピー&ペーストを行う時 に利用するメモリ。単純なテキストだけでなく、形式付きテキストや画像も保 持できる。

■音声の符号化

音をコンピュータで扱うには、次のような手順になる。

  1. 音を電気信号に変える(マイクロホン)
  2. 電気信号をビット列(整数)に変える(A/Dコンバータ(analog-to-digital converter))
  3. コンピュータで計算/通信/蓄積する
  4. ビット列(整数)を電気信号に変える(D/Aコンバータ(digital-to-analog converter))
  5. 電気信号を音に変える(スピーカ)
ディジタルになった音データの品質は、次の数で決まる。
標本化レート(サンプリング・レート、空間量子化レート)
電気信号を数に変える頻度。1秒辺り回数(Hz (ヘルツ))で表す。
量子化数(サンプリング・サイズ、時間量子化)
数に変える時に何ビットで表わすか。ビットで表す。
チャネル数(チャンネル数(channel))
ステレオなら2。(単位なし)

アナログ信号のディジタル化、棒グラフとアナログ信号

アナログ信号のディジタル化

◆CD品質の音(Compact Disc)

◆CDに含まれているデータ量

44100 [回/秒] *16 [ビット] * 2 ==1,411,200 [ビット/秒]
1,411,200 [ビット/秒] * 60 [秒/分] *70 [分/枚] == 5,927,040,000 [ビット/枚]
5,927,040,000 [ビット/枚] / 8 [ビット/バイト] == 740,880,000 [バイト/枚]
〜740 M [バイト/枚]
「*」は、コンピュータで掛け算を表す。割り算は、「/」。

◆電話品質

◆電話のデータ量

電話1秒当たりのデータ量
8000 [回/秒] * 8 [ビット] * 1 == 64000 (64k) [bit]
電話1時間当たりのデータ量
64k [bit/秒] * 60 [秒/分] * 60 [分/時間] == 230,400 k [ビット]== 230,400,000 [ビット]
電話も、CD より音質は悪いが長電話すると、相当なデータ量になる。

◆データ圧縮、圧縮

データ圧縮(data compression)、あるいは、圧縮(compression)とは、 なんらかの形式で表現された大きなデータを、計算により、少ないデータ量で 表現する。音声、静止画像、動画像は、データ量が多くなるので、圧縮が求め られる。

分類

音声の符号化の方法(圧縮方法)

MP3の他にも、H.264 など、動画像(音声含む)の形式の音声部分だけを使うこともある。

◆音声データの形式とコンテナ形式

音声をファイルに保存する時には、2つを区別する。 音声データをプログラムで扱う時には、そのプログラムがどのよな音声の形式 やコンテナの形式を扱えるかを考える必要がある。

音声データ右、左、低品質

コンテナと音声データ

音声データ形式の例は、 音声の符号化の方法(圧縮方法) で示したもの。

よく使われる音声用のコンテナ形式としては、次のようなもがある。

音声でも、動画像用のコンテナを利用することもある。

◆CD (digital)は、音がいいか

アナログのレコードより、ディジタルの CD の方が音がよいか。

CD では、ディジタルで記録された情報は、ディジタルの範囲では正確に再現 できる。

音がよいかは、ディジタル以外の部分に大きく依存する。

■静止画像の符号化

画像は、細かい細かい点(画素、ピクセル、pixel)の集合として扱える。

画像の品質は、次の2つの数で決まる。

◆ビットマップ

1つの画素を、1ビット(白か黒)で表す。

フォークとナイフの絵のビットマップによる表現(小さいもの) フォークとナイフの絵のビットマップによる表現(拡大)

◆色と階調

色と階調には、次のような種類がある。

カラーでも、1ピクセルに使うビット数で、いろいろな種類がある。

色の名前の付け方には、いろいろある。

◆画素数の感覚

◆解像度

単位面積あたりの画素数を、解像度という。

横(水平方向)、縦(巣直方向)ごとに、単位「長さ」当りのピクセル数で図る ことが多い。よく使われる単位は、dpi (dot per inch)。

画面
72 dpi
よく使われるコンピュータのプリンタ
300-6000 dpi

◆画像のデータ量の計算

画素数 ×1画素あたりのビット数
縦のドット数 ×横のドット数 ×1画素あたりのビット数
コンピュータ1画面の

1000 ドット x 1000 ドット x 24 ビット == 24,000,000 ビット。

◆圧縮

画像は、大きいので、「圧縮」したい。つまり、同じ画像をより小さなデータ 量で表現したい。

◆JPEGと劣化式圧縮

JPEG は、写真のディジタル・イメージ(カラー静止画像)を圧縮 する方法の1つであり、現在 WWW でも広く利用されている。ディ ジタル・カメラでは、写真を保存するために JPEG 形式を使ってい るものがある。

JPEG は、ITU (International Telecommunications Union, 旧 CCITT) と ISO の共同作業グループ(Joint Photographic Experts Group) により作成された規格である。正式には、JFIF (JPEG File Interchange Format) という。

JPEG は、劣化式圧縮の1つである。JPEG では、人間の目で見た時 にあまり気が付かない部分のデータを取り除く。その結果、写真の 見た目の質を落とすことなく、高い圧縮率を実現している。JPEG で圧縮時に捨てられたデータは、展開時に回復させることはできな い。

このような性質から、JPEG は、写真のようなイメージを圧縮する ために向いている。逆に、図形やイラストなどの保存には、適さな い。このようなものは、劣化式ではない圧縮アルゴリズムを使って いる PNG 形式の方が適している。

JPEG では、写真を保存する時に、品質を指定することができる。 高い品質を指定すれば、劣化が少なくなるが、データ量は多くなる。 低い品質を指定すれば、逆になる。

◆画像の形式

画像の表現形式にも、何種類もある。自分が使えるコンピュータで全ての種類 の画像が扱えるわけではない。操作する時には、自分が扱えるかどうかを調べ る必要がある。場合によっては、形式の「変換」をする必要がある。

よく使えれている画像の形式には、次のようなものがある。

BMP,GIF,JPEG-2000,JPEG,PDF,Photoshop,PICT,PNG,SGI,TGA,TIFF

図? MacOSX 「プレビュー.app (Preview.app)」で保存可能な対応している画像の形式。(クリックで拡大)

◆文字の符号化の意義(再掲)

文字を符号化することには、いくつかの意義がある。 比較できることは、検索の時に便利。画像では検索しにくい。

逆に文字を符号化してしまうと、個人の性質を出したい時には、問題がある。 たとえば、署名やラブレター。

文字を画像として送ることもできるが、特別に符号化することが一般的である。

漢字の「漢」のビットマップによる表現

◆ベクトル形式の画像

ベクトル、ベクタ、vector

画像をピクセルマップ(ビットマップ)ではなく、輪郭データで表す。 拡大しても、ギザギザににならない。表示の大きさによらずデータ量が一定になる。

ベクトル形式の図形(グラフィックス)場合、image とは呼ばないこともある。

円のビットマップとベクトル

◆PostScript

PostScript は、Adobe 社により開発されたプリンタを制御するための スクリプト言語(プログラミング言語)。 coins のプリンタに印刷する時には、PostScrip 言語のプログラムを 作成して、プリンタに送っている。

EPS (Encapsulated PostScript) 形式は、PostScript に描画領域などの 情報を付加したもの。

スクリプト言語、プログラミング言語については、後述。

PostSctip 形式のファイルは、テキストなので、テキスト・エディタで表示で きる。人間が手で書くこともできる。

◆PDF (Portable Document Format)

元々紙に印刷することを想定して作られた文書を、印刷しないで保存したり配 布したりすることを目的として、Adobe 社により開発された形式。

内部にイメージを JPEG 等の形式で圧縮して保持したり、グラフィックスを図 形の形で持つこともできる。 PDF は、PostScript を元に設計されている。 フォントを埋め込む機能を引き継いでいる。 複雑な制御構造は取り払われている。

画面に表示するには、Adobe Reader (Adobe Acrobat Reader)、MacOSX Preview.app, xpdf, GhostScript 等のプログラムを用いる。

MacOSX では、印刷する時に PDF 形式で保存することで作成できる。一般的に は、Adobe Acrobat (readerがつかない) や、dvipdf*, GhostScript, その他 のフリーのプログラムが使える。

◆Scalable Vector Graphics

SVG は、画像を表現するための形式である。

現在、World Wide Web で広く用いられている画像の形式としては、GIF, JPEG, PNG などがあるが、いずれもビットマップ、または、それを圧縮した形 式である。この場合、拡大すると画像が荒くなるという問題がある。これに対 して、SVG は、ベクトル形式、すなわち、画像の輪郭線を表現したものである。 よって、画像を拡大しても荒くなることがない。また、画像の大きさとデータ 量は無関係であり、大きな画像であってもデータ量が増えない。

◆フォント

文字を画面に表示するために文字の形のデータをある文字集合について一式そ ろえたもの。デザインが統一されている。

ビットマップ・フォントとベクトル・フォントがある。

ベクトル・フォントだと拡大しても(解像度が高いプリンタや画面で表示しても) 文字がギザギザにならない。

文字の大きさに合わせて別のデータを使うことがある。 携帯電話などの小さい画面には、特別にデザインされたビットマップ・ フォントが見やすい。

◆アンチエイリアス(滑らかな文字)

文字がギザギザを目立たせないようにするために、 中間色を使う。

■動画像の符号化

コンピュータで動画像を扱うには、基本的には、テレビ、映画、アニメーショ ンと同じで、静止画像を次々と切り替えることをする。 次の3つの数で決まる。 これらを全て掛け合わせたものが、ビットレート(bit rate)。1秒当たりのデー タ量(ビット数)。(ビットレートの場合、圧縮された後で考えることもある。)

◆アナログテレビの品質

ディジタルではにないので、精密には言えないがこのくらい。 1秒あたりのデータ量: 235*240*16*30 == 27,072,000 ビット。

◆日本の地上ディジタルテレビの品質

ただし、縦方向は、飛び越し走査(interlace scan) なので、1回には、半分(奇 数番目か偶数番目)しか送っていない。1080i と表記される。

1秒あたりのデータ量: 1440*1080*24*30/2 == 559,872,000 ビット。

DVD (片面2単層)には、約4.7Gバイト(37.6Gビット)の データを保存することができる。圧縮しないで動画像だけを保存した場合、

37.6 [G bit] / 497,664,000 [bit/s] == 約 67 [s]。

とにかく圧縮したい。

◆動画像データの形式とコンテナ形式

動画像データをファイルに保存する時にも、次の2つを区別する。

動画像、音声データ右、左、日英、字幕、

コンテナと動画像データ

動画像データ形式の例:

コンテナ形式の例:

◆動画圧縮の考え方

◆DVDの品質

DVD は、画質がよいか。

CD (圧縮されていない)と同じように、A/D変換、D/A変換の問題がある。

さらに、MPEG-2 で圧縮する時に、品質を調整できる。 品質を落とせば、長時間録音・録画できる。

平均的な DVD で想定されているデータ量

画像
3.5 M [ビット/秒] (1秒間に 3,500,000,000ビット)
音声
384 K [ビット/秒] (1秒間に 384,000ビット) × 3 言語
字幕
10 K [ビット/秒] (1秒間に 10,000ビット) × 4 言語

音質は、PCM (Linear PCM) なら、CD よりもよくできる。サンプリング・レー トやサンプリング・サイズが高くすることで。

Dolby Digital, MPEG Audio (MP3), DTS (Digian Theater Systems) では、CD よりも悪いこともある。ただし、サラウンド(チャネル数が2以上)は、 CD には規格がなく、DVD を選択するしかない。

◆MPEG Moving Picture Experts Group

MPEG (エムペグ) は、動画像と音声を圧縮するための規格の一つで ある。MPEG という名前は、ISOに設置された専門委員会の名前に由 来する。類似の専門委員会には、静止画像の圧縮圧縮方式を定めた JPEG (Joint Photographic Experts Group) がある。

MPEG-1
ビデオテープ程度の画質で、352ドットx240ドットの画像を毎秒30フレー ムで演奏することができる。Video CD 等で使われている。
MPEG-2
ハイビジョン程度の画質のもので、720ドット×480ドット、または、1280× 720ドットで、毎秒60フレームの演奏が可能である。MPEG-2 は、DVD に使われ ており、2時間のビデオを数Gバイトに圧縮することができる。
MPEG-4
インターネットでの配信にも利用することを目的に開発。 低いビットレートでも使える。
  MPEG-3 という規格はない。

◆MPEGコンテナフォーマット

MPEG は、コンテナ・フォーマットを定めている。

■ファイルとディレクトリ(2)

◆ホーム・ディレクトリ(home directory)(再掲)

個人所有のファイルを保存する時に起点となるディレクトリ。

多くのシェル(csh,tcsh,bash,zsh) やEmacsなどでは、 ホームディレクトリ「~」(ASCII 7e(16進数))で指定できる

は、ASCIIの形。 JIS では、となることがある。

他人のホーム・ディレクトリは、「~ユーザ名」で指定できるプログラムがある。 (指定できないもプログラムもある。)

「~xxx」と「~/xxx」のように 「~」直後に「/」の有無で意味が違う。

/ がなく、アルファベットで始まる(~xxx)
他のユーザのホーム・ディレクトリ。 xxx はユーザ名として解釈される。
/ がある ~/xxx
自分のホーム・ディレクトリ以下のファイル(またはディレクトリ)。 xxx はファイル名、または、ディレクトリ名として解釈される。

◆ファイル名の末尾の「〜」

名前の末尾に「~」がつくファイルが勝手に作られることがある。 多くの場合は、Emacs が編集前のファイルを保存したもの。 これは、ホーム・ディレクトリとは関係がない。

例。

literacy-assignment-3.txt
編集したファイル
literacy-assignment-3.txt~
編集前のファイル(古いファイル、バックアップ)
拡張子を保存するために、「~」を「.」の前に置くプログラムもある。 MacOSX TextEdit.app など。 ファイル名の例: literacy-assignment-3~.txt

◆ファイル名の拡張子(extension)

ファイルの内容を分かりやすく示すために、ファイル名の末尾(「.」の右側)に 短い記号(文字列)を付加する習慣がある。これをファイル名の拡張子という。

.txt, .text
ファイルの内容は、テキスト。
.jpg, .jpeg
ファイルの内容は、JPEG 画像
.pdf
ファイルの内容は、PDF形式の文書(テキストと画像)
.html
ファイルの内容は、テキストで、かつ、HTML という言語 の文法に従っている。
.c, .h
ファイルの内容は、テキストで、かつ、C という言語 の文法に従っている。
.app (MacOSX)
ディレクトリの内容は、 MacOSX のアプリケーション・プログラム。
.com, .exe (Windows)
ファイルの内容は、CPU で実行可能なプログラム(executable, command)。
Windows では、拡張子を見てプログラムを選択して実行する機能がある。 MacOSX では、拡張子に頼ることなく、別の属性で実行すべきプログラムを保 存している。Unix (コマンドライン) では、拡張子と実行するプログラムを関 係づける機能はない。シェルが行の先頭をプログラムの名前と解釈する。

注意:ファイルの名前を変更しても、ファイルの内容は変更されない。

% mv file1.png file1.pdf [←]
このようにファイル名の拡張子を変更しても、ファイルの内容(画像形式)は 変更されない。今日の課題では、これでは不可。

■実習

実習時間中には、以下の課題をできるだけ多く行いなさい。全部を行う必要はない。

★練習問題(501) Emacsの復習

Emacs で、ファイルを作成する方法を復習しなさい。

方法1: 引数にファイル名を与える方法。

方法2: 実行後にファイル名を与える方法

★練習問題(502) lsとFinderの比較

次のディレクトリを、ls コマンドと Finder で表示して、比較しなさい。 (Command は、Command キー、 Shift は、Shift キーを意味する。) Finder で表示するには、 いくつかのディレクトリについては、メニューから選択することもできる。

MacOSX Finder Go Application

図? MacOSX の Finder の「移動」メニュー。(クリックで拡大)

Finder で表示するには、端末でシェルから open コマンドを使う方法もある。 次のように、ディレクトリ名を open コマンドの引数として与える。

% open / [←]
% open ~ [←]
% open . [←]
% open ~/Documents [←]
ディレクトリ名を与える時には、 bash の補完機能も使える。

★練習問題(503) Finderの表示方法

Finder の表示方法には、次の3種類がある。 Finder のウインドウ丈夫のボタン(左右の三角(戻る/進む)の右側)を使って、これらを切り替えなさい。

リスト形式の表示で、ファイルを次の順番で表示しなさい。

リストの一番上にあるタイトルをクリックするたびに、順番が逆になる。

リスト形式の表示で、子供のディレクトリを表示しなさい。

★練習問題(504) Finderにおける拡張子の表示

Finder は、いくつかの種類のファイルについては、拡張子を表示しない。この 機能を使わずに、全ての拡張子を表示させてみなさい。 このように、「すべてのファイル拡張子を表示」とする利点について考えなさい。

★練習問題(505) ホームディレクトリの下のディレクトリの観察

ホームディレクトリの下にある次ようなディレクトリの内容をls, ls -l, ls -ld で調べなさい。 たとえば、書類ならば、次のようにして調べる。
$ ls     ~/Documents     単純なファイル名の一覧 [←]
$ ls -l  ~/Documents     大きさ等の属性を含むファイル名の一覧 [←]
$ ls -ld ~/Documents     ディレクトリ自身の属性の表示 [←]

★練習問題(506) GetFileInfo

GetFileInfo というプログラムを使って、MacOSX 独自のファイルの属性(type や creator)を調べなさい。

$ GetFileInfo filename [←]
詳しくは、man GetFileInfo を参照しなさい。

★練習問題(507) MulleSight.appによるカメラからの静止画像の取り込み

iMac には、iSight という動画像のカメラがついている。 /Applications/coins にある MulleSight.app というプログラムを用い て、動画像カメラを使って静止画像を取り込むことができる。 この結果、「クリップボード」というコピー&ペーストで用いる場所に保存さ れている。

クリップボードにある画像を、「プレビュー.app」で保存する。

★練習問題(508) プレビュー.app(Preview.app)による形式や画素数等の表示

「プレビュー.app(Preview.app)」には、画像の形式(タイプ)や画素数等の情 報を表示する機能がある。

★練習問題(509) プレビュー.app (Preview.app)による画像形式の変換

「プレビュー.app (Preview.app)」で表示している画像を、 「ファイル」メニューから「別名 で保存」を選ぶことで、別の名前で、ファイルを作成て静止画像データを保存 することができる。この時、形式を変更することもできる。 この機能を確認しなさい。

★練習問題(510) プレビュー.app (Preview.app)によるピクセル数の変更

主に画像のサイズを小さくする時に、縦横のピクセル数を変更する方法がある。 「プレビュー.app」には、この機能がある。これを試してみなさい。

「ツール」メニューから「サイズを調整」を選ぶ。

★練習問題(511) プレビュー.app (Preview.app)によるクリッピング

画像の一部だけを切り出すことをクリッピングという。 「プレビュー.app」に は、クリッピングの機能がある。これを利用してみなさい。

カーソルが「+」になっている時に、対角線をドラックする。 点線が表示されたら、丸い部分をドラッグして動かす。

★練習問題(512) isightcaptureによる静止画像ファイルの作成

isightcapture は、コマンドラインから実行できる iSight カメラの画像を 取り込むプログラムである。 次のようにして、実行することで、引数で指定されたファイルに指定された形 式で接続された動画像のカメラ(iSight)から静止画像を取り込み、ファイルに 保存することができる。
% isightcapture mypicture.jpg [←]
% isightcapture -w 320 -h 240 -t png mypicture.png [←]
くわしくは、http://www.intergalactic.de/pages/iSight.html

★練習問題(513) ToyViewer.appによる画像と変換

/Applications/coins/ToyViewer.app で画像を表示さなさい。また、形式を変 更して保存しなさい。
% open /Applications/coins/ToyViewer.app  [←]

★練習問題(514) ImageMagic convert コマンドによる静止画像の形式の変換

convert コマンドを使って静止画像の形式を変換しなさい。たとえば、以下の 例では、ファイルfile1.jpg に含まれているJPEG形式のファイルの内容をPNG形 式へ変換して、新しいファイル file1.png に保存している。
$ ls -l file1.jpg file1.png [←]
ls: file1.png: No such file or directory
-rw-r--r--  1 yas  prof  37780  4 26 11:48 file1.jpg
$ convert file1.jpg  file1.png  [←]
$ ls -l file1.jpg file1.png [←]
-rw-r--r--  1 yas  prof   37780  4 26 11:48 file1.jpg
-rw-r--r--  1 yas  prof  132672  4 26 18:51 file1.png
$ []
変更後、ファイルの内容を表示しなさい。また、 プレビュー.app(Preview.app)のインスペクタ を使って、ファイルの形式や画素数がどのように変化したかを調べなさい。

類似の操作を cp コマンド(ファイルのコピー)や mv コマンド(ファイル名の変 更) でも行ってみなさい。この時には、ls -l によるファイルの大きさが変化しないこと、また、 ファイルの形式や画素数が変化しないことを確認しなさい。

★練習問題(515) Gimp

/Applications/ にある Gimp.app というプログラムを 実行してみなさい。
% open /Applications/Gimp.app [←]
画像の作成、画像形式の変換、簡単な図形や文字の追加などを行いなさい。

★練習問題(516) システム環境設定/ディスプレイ

システム環境設定(Dock、または、open "/Applications/System Preferences.app") の中の「ディスプレイ」の項目を開きなさい。画面の画素 数や色数がどうなっているかを調べなさい。

画素数や色数を変更するとどうなるか調べなさい。 観察が終わったら元の状態に戻しなさい。

★練習問題(517) Grab.app

「グラブ.app(Grab.app)」を使って、画面に表示されている内容の一部を取り 込みなさい。このプログラムは、次の場所にある。 取り込む単位としては、次のようなものがある。 単純に保存すると TIFF 形式になる。PNG 等にするには、クリッフポードにコ ピーして、「プレビユー.app」で開き、保存する。

★練習問題(518) netbpm,xv,ImageMagic display,その他

静止画像の形式を変換するには、次のようなプログラムを利用することもでき る。 The Unix Super Text 下巻 54章 画像処理 参照

★練習問題(519) システム環境設定/サウンド

システム環境設定を実行しなさい(Dock、または、open "/Applications/System Preferences.app") 。その中の「サウンド」の項目を 開きなさい。次のことを行いなさい。

★練習問題(520) 音量調整と消音

音量調整と消音を次の方法でも行ってみなさい。

★練習問題(521) 学類紹介ビデオ

次のページにある学類紹介ビデオの形式を調べなさい。画素数、 1秒当たりのフレーム数、 ファイルの大きさ、ビットレートを調べなさい。

http://www.coins.tsukuba.ac.jp/06_pamphlet.html

次の3つのアプリケーションが利用できる。

"/Applications/QuickTime Player.app/"
MP4 (H.264) を生成てきる。 「ウインドウ」メニューの「ムービー情報(Command+I)」を選ぶ
/Applications/coins/VLC.app
MP4 と WMA 形式の両方を再生できる。
open /Applications/coins/vlc-0.9.9a/VLC.appdnl
"/Applications/coins/Windows Media Player.app"
WMA (Windows Media Player) 形式を再生できる。 「ファイル」メニューの「情報を見る(Command+I)」を選ぶ。
Web ブラウザで URL を調べ、クリップボードにコピーし、アプリケーションで その URL を開く。環境により、Firefox の中で直接表示できるものもある。

★練習問題(522) sayコマンドで音声合成

say は、与えられた英文テキストから音声を合成するコマンドである。標準で は、そのままコンピュータのスピーカに出力する。
$ say "hello,world"       一行分ならそのまま引数に渡す [←]
$ []
$ say [←]
hello,
world
^D             複数行なら、引数なしで実行し最後に Control-D
$ []
次のように -o オプションを指定すると、スピーカではなくファイルに出力す る。
$ say "hello,world" -o hello.aiff [←]
$ []
この機能を利用して、音声データを含むファイルを作成しなさい。

★練習問題(523) saykanaコマンドで音声合成

saykana コマンドは、かな表記の日本語から音声を合成できる say コマンドである。 このコマンドを使って、音声データを含むファイルを作成しなさい。 ただし、文字コードとして、iTerm 標準のEUC ではなく、UTF-8 を用いる。 従って、coins の環境で利用するには、次のように nkf と組み合わせて使う。
$ emacs で平仮名の含むファイルを作る。 [←]
$ nkf -w filename.txt | saykana  [←]
$ nkf -w filename.txt | saykana -o file.aiff [←]
くわしくは、 Webページ を参照しなさい。

★練習問題(524) Audacity.appによるエンコーディング形式の変換

/Applications/coins/Audacity.app を使って、音声データの形式、サンプリン グレート、サンプリング・サイズを観察しなさい。またそれらを変更してみな さい。

★練習問題(525) Switch.appによるエンコーディング形式の変換

/Applications/coins/Switch.app を使って、音声データの形式を変更しなさい。

★練習問題(526) QuickTime Player.appでの録音

アプリケーション(/Applications)にある「"QuickTime Player.app"」 Player.appを使うと、iMac に内蔵されているマイクを使って音声データを取り 込み、それをファイルへ保存することができる。

★練習問題(527) QuickTime Player.appでの録画

アプリケーション(/Applications)にあるPlayer.appを使うと、iMac に内蔵さ れている動画像カメラ(iSight)とマイクを使って動画像(音声ふくむ)データを 取り込み、それをファイルへ保存することができる。

方法は、音声データの録音方法とよく似ている。プログラムを実行した後に、 「ファイル」メニューから「新規オーディオ録音」ではなく「新規ムービー録 画」を選ぶ。

★練習問題(528) VLC media player

VLC media player を使ってみなさい。
% open /Applications/coins/vlc-0.9.9a/VLC.app [←]
付属のドキュメントを読みなさい。
% open "/Applications/coins/vlc-0.9.9a/Read Me.rtf" [←]
演奏できるコーデックとコンテナ・フォーマットを調べなさい。

VLC media player は、保持しているデータを他のコンピュータで実行している VLC media player に配信する機能がある。このことを確認しなさい。

★練習問題(529) soxコマンドとsoxi

sox は、音声データの形式を変更するコマンドである。音量を調整したり、エ コーをかけることもできる。このコマンドを用いてファイルに含まれている音 声データの形式を変更してみなさい。 詳しくは、man sox を見なさい。

soxi コマンドは、音声データが含まれているファイルの中のチャネル数やサン プリングレートを表示するコマンドである。このコマンドを利用してみなさい。 詳しくは、man soxi を見なさい。

★練習問題(530) ffmpeg

ffmpeg は、ビデオの形式を変換したりビットレートを変換するコマンドである。 このコマンドを利用してみなさい。 詳しくは、man ffmpeg を見なさい。

★練習問題(531) Font Book.app

アプリケーション(/Applications)にある 「Font Book.app」を利用すると、 どのようなフォントがいるか調べることができる。 この機能を確認しなさい。

■課題5 音声、静止画像、動画像の符号化

次の内容を含む「テキスト」ファイルを作成し、 レポート提出ページから提出しなさい。 今日の課題では、実習時間中に TA に結果を示し、確認番号を受け取りなさい。 レポートには、その確認番号、TA氏名、確認日時を記述しなさい。

(1) 静止画像について次の操作を行いなさい。 次のいずれかの方法で、静止画像を含むファイルを作成しなさい。

TAにファイルを示し、確認番号を受け取りなさい。 レポートには、どのような方法で作成したかを、書きなさい。

(2) (1) で作成した画像について、次のことを調べなさい。

レポートには、調べた方法も含めて記述しなさい。

(3) (1) で作成した画像の形式を以下で示された形式(元の形式を除く)に変 換しなさい。レポートには、変換方法を記述しなさい。(注意:ファイル名の 拡張子を変えるのではなく、形式変換機能をもつプログラムでファイルの内容 を変更する。)

これらの画像ファイルを ls -l で表示しなさい。その結果(バイト数) を、端 末プログラムのコピー&ペースト機能を使って以下に張りなさい。

(4) 漢字140文字からなる文書を考える。漢字1文字を2バイト(16ビット)で符号 化すると、何バイト必要か。同じ文書を、1文字を16x16ドットのビットマップ・ フォントを使い画像に変換すると、何バイト必要になるか。(テキスト中の改 行などの制御コード、エスケープ・シーケンス、および、画像の行間などは無 視して考える。)

(5) The Unix Super Text の次の部分を読みなさい。

そして、項目についてついて調べて、簡単に説明しなさい。

(6) [加点] 音声について次の操作を行いなさい。

次のいずれかの方法で音声データを作成し、ホーム・ディレクトリ、または、 その子供のディレクトリにファイルに保存(書き出し)しなさい。その方法をレ ポートに記述しなさい。

拡張子、ファイルの大きさ、音声データの標本化レート、量子化数、チャネル 数を調べなさい。形式、音声データの標本化レート、量子化数、チャネル数を 変化させ書き出した時に、ファイルの大きさや拡張子がどうなるか調べなさい。

(7) [加点] 動画像について次の操作を行いなさい。

次のいずれかの方法で動画像データを作成し、ホーム・ディレクトリ、または、 その子供のディレクトリにファイルに保存(書き出し)しなさい。その方法をレ ポートに記述しなさい。

拡張子、ファイルの大きさ、データレートを調べなさい。形式、画像の大きさ (横、縦のピクセル数)、音声のパラメタなどを変化させ書き出した時に、時 に、ファイルの大きさや拡張子がどうなるか調べなさい。


Last updated: 2010/05/18 15:23:40
Yasushi Shinjo / <yas@is.tsukuba.ac.jp>