デバイスドライバと割り込み処理、inb()とoutb()

					2021年01月20日
情報科学類 オペレーティングシステム II

                                       筑波大学 システム情報系 
                                       新城 靖
                                       <yas@cs.tsukuba.ac.jp>

このページは、次の URL にあります。
http://www.coins.tsukuba.ac.jp/~yas/coins/os2-2020/2021-01-20
あるいは、次のページから手繰っていくこともできます。
http://www.coins.tsukuba.ac.jp/~yas/
http://www.cs.tsukuba.ac.jp/~yas/

■今日の大事な話

■デバイス・ドライバ

デバイス・ドライバとは、 オペレーティング・システム・カーネル内で動作するモジュールで、ディスク やキーボード等のデバイス(周辺装置)を管理し、入出力を制御する。 「オブジェクト指向」よりも、デバイスドライバの考え方が古い。

◆Unix系OSのデバイス・ドライバの種類

◆メジャー番号とマイナー番号

ブロック型と文字型のデバイス・ドライバは、メジャー番号とマイナー番号の 2つの番号で区別される。利用者プログラムからそれらをアクセスする時には、 /dev 以下のファイルをアクセスする。
$ df / [←]
Filesystem           1K-blocks      Used Available Use% Mounted on
/dev/sda2            232431456  13088380 207345736   6% /
$ ls -l /dev/sda2 [←]
brw-r----- 1 root disk 8, 2 Jan 24 12:00 /dev/sda2
$ []
ls -l で見ると、ブロック型は、b、文字型は、c で始まる。メ ジャー番号は、デバイスの種類、マイナー番号は、同じ種類で、細かい違い (上の例では、パーティション)等を意味する。

メジャー番号は、静的に決めうちにすることもあるが、 alloc_chrdev_region() を呼び、動的に割り当てられることもできる。 使われているメジャー番号は、/proc/devices に現れる。 /dev/ の下にあるブロック型と文字型のファイルは、mknod コマンド (make node) で作ることができる。

# mknod b /dev/ファイル名 メジャー番号 マイナー番号 [←]
# mknod c /dev/ファイル名 メジャー番号 マイナー番号 [←]
最近の Linux では、起動時に自動的に mknod が行われるので、手で mknod コマンド を打つ必要性はあまりない。

文字型デバイスの登録

まず、struct file_operations 構造体とその内部の関数群を定義する。その構 造体を、struct cdev に設定する。最後に、struct cdev を、cdev_add() で登 録する。
struct file_operations my_fops = { .... };
struct cdev *my_cdevp = cdev_alloc();
my_cdev->ops = &my_fops; 
my_cdev->owner = &my_fops; 
struct file_operations my_fops = { .... };
struct cdev my_cdev ;
cdev_init(&my_cdev,&my_fops);
cdev_add(&my_cdev,num, count)
register_chrdev() という関数で登録することもできる。以前はこの方法が主。
int register_chrdev(unsigned int major, const char *name,
    struct file_operations *fops);
cdev_device_add() でも良い。
linux-5.10.3/fs/char_dev.c
 537:	int cdev_device_add(struct cdev *cdev, struct device *dev)
 538:	{
...
 544:	                rc = cdev_add(cdev, dev->devt, 1);
...
 549:	        rc = device_add(dev);
...
 553:	        return rc;
 554:	}

◆file_operations構造体

file_operations構造体は、文字型でバイスのデバイス・ドライバのインタフェー スを定めている構造体。インタフェースは、関数の集合として定義されている。
linux-5.10.3/include/linux/fs.h
1822:	struct file_operations {
1823:	        struct module *owner;
1824:	        loff_t (*llseek) (struct file *, loff_t, int);
1825:	        ssize_t (*read) (struct file *, char __user *, size_t, loff_t *);
1826:	        ssize_t (*write) (struct file *, const char __user *, size_t, loff_t *);
1827:	        ssize_t (*read_iter) (struct kiocb *, struct iov_iter *);
1828:	        ssize_t (*write_iter) (struct kiocb *, struct iov_iter *);
1829:	        int (*iopoll)(struct kiocb *kiocb, bool spin);
1830:	        int (*iterate) (struct file *, struct dir_context *);
1831:	        int (*iterate_shared) (struct file *, struct dir_context *);
1832:	        __poll_t (*poll) (struct file *, struct poll_table_struct *);
1833:	        long (*unlocked_ioctl) (struct file *, unsigned int, unsigned long);
1834:	        long (*compat_ioctl) (struct file *, unsigned int, unsigned long);
1835:	        int (*mmap) (struct file *, struct vm_area_struct *);
1836:	        unsigned long mmap_supported_flags;
1837:	        int (*open) (struct inode *, struct file *);
1838:	        int (*flush) (struct file *, fl_owner_t id);
1839:	        int (*release) (struct inode *, struct file *);
1840:	        int (*fsync) (struct file *, loff_t, loff_t, int datasync);
1841:	        int (*fasync) (int, struct file *, int);
1842:	        int (*lock) (struct file *, int, struct file_lock *);
1843:	        ssize_t (*sendpage) (struct file *, struct page *, int, size_t, loff_t *, int);
1844:	        unsigned long (*get_unmapped_area)(struct file *, unsigned long, unsigned long, unsigned long, unsigned long);
1845:	        int (*check_flags)(int);
1846:	        int (*flock) (struct file *, int, struct file_lock *);
1847:	        ssize_t (*splice_write)(struct pipe_inode_info *, struct file *, loff_t *, size_t, unsigned int);
1848:	        ssize_t (*splice_read)(struct file *, loff_t *, struct pipe_inode_info *, size_t, unsigned int);
1849:	        int (*setlease)(struct file *, long, struct file_lock **, void **);
1850:	        long (*fallocate)(struct file *file, int mode, loff_t offset,
1851:	                          loff_t len);
1852:	        void (*show_fdinfo)(struct seq_file *m, struct file *f);
1853:	#ifndef CONFIG_MMU
1854:	        unsigned (*mmap_capabilities)(struct file *);
1855:	#endif
1856:	        ssize_t (*copy_file_range)(struct file *, loff_t, struct file *,
1857:	                        loff_t, size_t, unsigned int);
1858:	        loff_t (*remap_file_range)(struct file *file_in, loff_t pos_in,
1859:	                                   struct file *file_out, loff_t pos_out,
1860:	                                   loff_t len, unsigned int remap_flags);
1861:	        int (*fadvise)(struct file *, loff_t, loff_t, int);
1862:	} __randomize_layout;
主な手続きの意味

◆inode 構造体

Linux カーネル内で、1つのファイルを表現する構造体。

デバイス・ファイルでは、open() 等で自分のメジャー番号とマイナー番号を取 り出すために使われることがある。

◆file構造体

開いたファイルを表現するために使われる。
    int fd1 = open("file1");
    int fd2 = open("file1");
ファイル名 "file1" で表現されるファイルの inode 構造体は、1 個でも、 file 構造体は、2 個割り当てられる。

◆ioctl()システム・コール

デバイスには、それぞれ特殊な操作方法がある。read(), write() には合わな いものがある。

このような特殊な操作は、システム・コールを増やすのではなく、全部 ioctl() システム・コールという特殊なシステム・コールを用いる。
int ioctl(int d, int request, ...);
コマンドは、デバイス・ドライバごとにことなる。第3引数は、コマンドにより 使われないことともある。

◆alloc_chrdev_region()

デバイスドライバで動的にメジャー番号とマイナー番号を割り割り当てるには、 alloc_chrdev_region() が使える。

◆device_create()

デバイスドライバで、mknod コマンドをを使わず/dev/ の下にデバイス・ファ イルを作成するには、device_create() が使える。(/dev の他に、/sys 以下に もディレクトリが作られる。)

■x86 CMOS Real-Time Clock

CMOS RTC (Real-Time Clock) とは、バッテリ・バックアップされた時計。 CMOS や Real Time という名前が紛らわしいので、固有名詞と思うと良い。 次の2つの機能がある。
TOD (time of day) clock
時刻を、year/month/day hour:minute:second という形式で持つ。 秒以下は読めない。 PCの主電源を切っていても、この時計はマザーボード上のバッテリで進み続け る。 設定された日時に割り込みを起こす機能がある(alarm)。
定期的な割込み用
2Hz から 8192Hz の範囲で、2 の冪乗の周期で定期的な割込み(periodic interrupt)を起こせる。
Linux は、起動時に TOD clock を読んで、自身が管理する時計を初期化する。 以後、普段はこのハードウェアを読むことはしない。 Linuxが管理する時計は、ソフトウェア的に変更できる(date コマンド、 settimeofday() システム・コール)。 Linux では、1秒間に1回、内部的な時刻をこのハードウェアに保存している。

ハードウェアの内容は、hwclock コマンドで参照できる。
# hwclock --show [←]
Thu Jan 14 20:57:57 2021  -0.880805 seconds
# date [←]
Thu Jan 14 20:57:58 JST 2021
# []

◆rtc-read-time.c

/dev/rtc は、CMOS RTC に対応した文字型デバイスのファイルである。これを 開いて ioctl() でアクセスすると、CMOS RTC の内容が読める。
   1:	
   2:	/*
   3:	        ~yas/syspro/time/rtc-read-time.c -- Read CMOS Realtime Clock in Linux
   4:	        Created on: 2011/01/28 17:12:36
   5:	*/
   6:	
   7:	
   8:	#include <sys/types.h>  /* open() */
   9:	#include <sys/stat.h>   /* open() */
  10:	#include <fcntl.h>      /* open() */
  11:	#include <sys/ioctl.h>  /* ioctl() */
  12:	#include <unistd.h>     /* close() */
  13:	#include <stdio.h>      /* printf() */
  14:	#include <stdlib.h>     /* exit() */
  15:	#include <linux/rtc.h>  /*  RTC_RD_TIME */
  16:	
  17:	#define RTC_DEVICE_FILE "/dev/rtc"
  18:	
  19:	main()
  20:	{
  21:	    int fd;
  22:	    struct rtc_time t1 ;
  23:	        if( (fd = open( RTC_DEVICE_FILE, O_RDONLY ))< 0 )
  24:	        {
  25:	            perror("open");
  26:	            exit( 1 );
  27:	        }
  28:	        if( ioctl( fd, RTC_RD_TIME, &t1 ) < 0 )
  29:	        {
  30:	            perror("ioctl(RTC_RD_TIME)");
  31:	            exit( 2 );
  32:	        }
  33:	        printf("%04d-%02d-%02d %02d:%02d:%02d\n",
  34:	                t1.tm_year+1900, t1.tm_mon+1, t1.tm_mday,
  35:	                t1.tm_hour, t1.tm_min, t1.tm_sec );
  36:	        close( fd );
  37:	}
実行例
$ make rtc-read-time [←]
cc     rtc-read-time.c   -o rtc-read-time
$ su [←]
Password: 
# ./rtc-read-time [←]
2021-01-14 12:00:13
# ./rtc-read-time ; hwclock --show; date [←]
2021-01-14 12:00:23
Thu Jan 14 21:00:24 2021  -0.454311 seconds
Thu Jan 14 21:00:24 JST 2021
# ./rtc-read-time ; hwclock --show; date [←]
2021-01-14 12:00:26
Thu Jan 14 21:00:27 2021  -0.094931 seconds
Thu Jan 14 21:00:27 JST 2021
# []
RTC_RD_TIME を含めて、/dev/rtc に対する ioctl() では、次のようなコマン ドが使える。詳しくは、man rtc を参照。
/dev/rtc に対する ioctl() のコマンド
コマンド 説明
RTC_RD_TIME RTCのTODを読む(read)
RTC_SET_TIME RTCのTODに値をセットする
RTC_ALM_READ,RTC_ALM_SET RTCのalarmを読む/セットする
RTC_IRQP_READ alarmによる定期的な割り込みの(periodic interrupt)の周波数を読む/セットする
RTC_AIE_ON, RTC_AIE_OFF alarmの割り込みを許可する/禁止する
RTC_UIE_ON, RTC_UIE_OFF clockの更新後との割り込みを許可する/禁止する
RTC_PIE_ON, RTC_PIE_OFF 定期的な割り込みを許可する/禁止する
RTC_EPOCH_READ, RTC_EPOCH_SET RTCのepoch (起点となる年月日) を読む/書く

◆drivers/rtc/{class.c,dev.c}

CMOS RTC のデバイスドライバは、drivers/rtc/{class.c,dev.c} 等にある。
linux-5.10.3/drivers/rtc/dev.c
  19:	static dev_t rtc_devt;
...
 496:	void __init rtc_dev_init(void)
 497:	{
 498:	        int err;
 499:	
 500:	        err = alloc_chrdev_region(&rtc_devt, 0, RTC_DEV_MAX, "rtc");
 501:	        if (err < 0)
 502:	                pr_err("failed to allocate char dev region\n");
 503:	}

linux-5.10.3/drivers/rtc/dev.c
 459:	static const struct file_operations rtc_dev_fops = {
 460:	        .owner          = THIS_MODULE,
 461:	        .llseek         = no_llseek,
 462:	        .read           = rtc_dev_read,
 463:	        .poll           = rtc_dev_poll,
 464:	        .unlocked_ioctl = rtc_dev_ioctl,
 465:	#ifdef CONFIG_COMPAT
 466:	        .compat_ioctl   = rtc_dev_compat_ioctl,
 467:	#endif
 468:	        .open           = rtc_dev_open,
 469:	        .release        = rtc_dev_release,
 470:	        .fasync         = rtc_dev_fasync,
 471:	};

linux-5.10.3/drivers/rtc/class.c
 388:	int __rtc_register_device(struct module *owner, struct rtc_device *rtc)
...
 406:	        rtc_dev_prepare(rtc);
 407:	
 408:	        err = cdev_device_add(&rtc->char_dev, &rtc->dev);
...
 428:	}

 475:	void rtc_dev_prepare(struct rtc_device *rtc)
 476:	{
...
 492:	        cdev_init(&rtc->char_dev, &rtc_dev_fops);
 493:	        rtc->char_dev.owner = rtc->owner;
 494:	}

◆rtc_dev_open()

linux-5.10.3/drivers/rtc/dev.c
  23:	static int rtc_dev_open(struct inode *inode, struct file *file)
  24:	{
  25:	        struct rtc_device *rtc = container_of(inode->i_cdev,
  26:	                                        struct rtc_device, char_dev);
  27:	
  28:	        if (test_and_set_bit_lock(RTC_DEV_BUSY, &rtc->flags))
  29:	                return -EBUSY;
  30:	
  31:	        file->private_data = rtc;
...
  37:	        return 0;
  38:	}

◆rtc_dev_release()

linux-5.10.3/drivers/rtc/dev.c
 437:	static int rtc_dev_release(struct inode *inode, struct file *file)
 438:	{
 439:	        struct rtc_device *rtc = file->private_data;
...
 455:	        clear_bit_unlock(RTC_DEV_BUSY, &rtc->flags);
 456:	        return 0;
 457:	}
rtc_dev_open() でセットした変数 &rtc->flagsの RTC_DEV_BUSY ビットは、close() システム・コールで呼ばれる rtc_dev_release() ( struct file_operations rtc_fops の.release) で、ク リアされる。

◆rtc_dev_ioctl()

linux-5.10.3/drivers/rtc/dev.c
 203:	static long rtc_dev_ioctl(struct file *file,
 204:	                          unsigned int cmd, unsigned long arg)
 205:	{
 206:	        int err = 0;
 207:	        struct rtc_device *rtc = file->private_data;
 208:	        const struct rtc_class_ops *ops = rtc->ops;
 209:	        struct rtc_time tm;
...
 254:	        switch (cmd) {
...
 255:	        case RTC_ALM_READ:
...
 266:	        case RTC_ALM_SET:
...
 318:	        case RTC_RD_TIME:
...
 321:	                err = rtc_read_time(rtc, &tm);
 322:	                if (err < 0)
 323:	                        return err;
 324:	
 325:	                if (copy_to_user(uarg, &tm, sizeof(tm)))
 326:	                        err = -EFAULT;
 327:	                return err;
 328:	
 329:	        case RTC_SET_TIME:
...
 332:	                if (copy_from_user(&tm, uarg, sizeof(tm)))
 333:	                        return -EFAULT;
 334:	
 335:	                return rtc_set_time(rtc, &tm);
 336:	
 395:	        }
...
 400:	}

◆copy_from_user()とcopy_to_user()

デバイス・ドライバが動作するカーネル空間とユーザ空間では、「基本的に」 異なるアドレス空間を持っている。たとえば、同じ 1000 番地でも、別の内容 が含まれていることがある。

カーネル空間とユーザ空間でデータをコピーする時には、次のような特殊な関 数を使う必要がある。

unsigned long
copy_to_user(void __user *to, const void *from, unsigned long n)
unsigned long
copy_from_user(void *to, const void __user *from, unsigned long n)

これらの関数は、コピーの途中でページフォールトが発生した時にもうまくコ ピーできる(ページインの処理でプロセスがスリープすることがある)。また、 引数の番地が有効かどうかをチェックする。

Linux x86 アーキテクチャでは、カーネル空間とユーザ空間が一部重なってい ることがある。この場合、カーネルでmemcpy() を使ったり、直接ポインタを操 作してもユーザ空間がアクセスできてしまうが、それは誤りである。

◆rtc_read_time()

linux-5.10.3/drivers/rtc/interface.c
 110:	int rtc_read_time(struct rtc_device *rtc, struct rtc_time *tm)
 111:	{
...
 118:	        err = __rtc_read_time(rtc, tm);
...
 123:	}

  84:	static int __rtc_read_time(struct rtc_device *rtc, struct rtc_time *tm)
  85:	{
  86:	        int err;
...
  93:	                memset(tm, 0, sizeof(struct rtc_time));
  94:	                err = rtc->ops->read_time(rtc->dev.parent, tm);
...
 101:	                rtc_add_offset(rtc, tm);
...
 103:	                err = rtc_valid_tm(tm);
 107:	        return err;
 108:	}

linux-5.10.3/drivers/rtc/rtc-cmos.c
 568:	static const struct rtc_class_ops cmos_rtc_ops = {
 569:	        .read_time              = cmos_read_time,
 570:	        .set_time               = cmos_set_time,
 571:	        .read_alarm             = cmos_read_alarm,
 572:	        .set_alarm              = cmos_set_alarm,
 573:	        .proc                   = cmos_procfs,
 574:	        .alarm_irq_enable       = cmos_alarm_irq_enable,
 575:	};

 223:	static int cmos_read_time(struct device *dev, struct rtc_time *t)
 224:	{
...
 236:	        mc146818_get_time(t);
 237:	        return 0;
 238:	}

linux-5.10.3/drivers/rtc/rtc-mc146818-lib.c
  25:	unsigned int mc146818_get_time(struct rtc_time *time)
  26:	{
...
  53:	        spin_lock_irqsave(&rtc_lock, flags);
  54:	        time->tm_sec = CMOS_READ(RTC_SECONDS);
  55:	        time->tm_min = CMOS_READ(RTC_MINUTES);
  56:	        time->tm_hour = CMOS_READ(RTC_HOURS);
  57:	        time->tm_mday = CMOS_READ(RTC_DAY_OF_MONTH);
  58:	        time->tm_mon = CMOS_READ(RTC_MONTH);
  59:	        time->tm_year = CMOS_READ(RTC_YEAR);
...
  93:	        if (time->tm_year <= 69)
  94:	                time->tm_year += 100;
...
  96:	        time->tm_mon--;
...
  99:	}

◆入出力の方法

x86 CMOS RTC は、前者。

◆outb()とinb()

Linux における入出力命令を使った入出力は、inb() と outb() で行われる。
void outb(unsigned char value, unsigned short port)
  ポート番号 port に 1 バイトの value を出力する

unsigned char inb(unsigned short port)
  ポート番号 port から 1 バイトの value を入力してその値を返す
1 バイト 8 ビットではなくて 2 バイト 16 ビット 単位のもの (inw(), outw()) や4 バイト 32 ビット単位のもの( inl(), outl() ) もある。

◆CMOS RTCの入出力ポート

x86 CMOS RTC は、ポート番号 0x70 と 0x71 の入出力ポートを使う。
0x70
インデックス用ポート。out のみ
0x71
データ用ポート。in と out
データを読む方法
  1. インデックス用ポートに読みたい日付やデータのインデックス (RTC_SECONDS, RTC_MINUTES, RTC_HOURS, RTC_DAY_OF_MONTH, RTC_MONTH, RTC_YEAR)を out する。
  2. 直後にデータ用ポートらか in する
データを書く方法
  1. インデックス用ポートに読みたい日付やデータのインデックス を out する。
  2. 直後にデータ用ポートにデータを out する

◆rtc_cmos_read()

linux-5.10.3/arch/x86/include/asm/mc146818rtc.h
  11:	#ifndef RTC_PORT
  12:	#define RTC_PORT(x)     (0x70 + (x))
...
  93:	#define CMOS_READ(addr) rtc_cmos_read(addr)
  94:	#define CMOS_WRITE(val, addr) rtc_cmos_write(val, addr)

linux-5.10.3/arch/x86/kernel/rtc.c
 126:	unsigned char rtc_cmos_read(unsigned char addr)
 127:	{
 128:	        unsigned char val;
 129:	
 130:	        lock_cmos_prefix(addr);
 131:	        outb(addr, RTC_PORT(0));
 132:	        val = inb(RTC_PORT(1));
 133:	        lock_cmos_suffix(addr);
 134:	
 135:	        return val;
 136:	}
...
 139:	void rtc_cmos_write(unsigned char val, unsigned char addr)
 140:	{
 141:	        lock_cmos_prefix(addr);
 142:	        outb(addr, RTC_PORT(0));
 143:	        outb(val, RTC_PORT(1));
 144:	        lock_cmos_suffix(addr);
 145:	}

linux-5.10.3/include/linux/mc146818rtc.h
  50:	#define RTC_SECONDS             0
  51:	#define RTC_SECONDS_ALARM       1
  52:	#define RTC_MINUTES             2
  53:	#define RTC_MINUTES_ALARM       3
  54:	#define RTC_HOURS               4
  55:	#define RTC_HOURS_ALARM         5
...
  59:	#define RTC_DAY_OF_WEEK         6
  60:	#define RTC_DAY_OF_MONTH        7
  61:	#define RTC_MONTH               8
  62:	#define RTC_YEAR                9

◆outb()とinb()の実装(インライン関数)

次のファイルにある定義は、読みやすい。
linux-5.10.3/arch/x86/boot/boot.h
  39:	static inline void outb(u8 v, u16 port)
  40:	{
  41:	        asm volatile("outb %0,%1" : : "a" (v), "dN" (port));
  42:	}
  43:	static inline u8 inb(u16 port)
  44:	{
  45:	        u8 v;
  46:	        asm volatile("inb %1,%0" : "=a" (v) : "dN" (port));
  47:	        return v;
  48:	}

◆asm()文

C言語のプログラムの中にアセンブリ言語のプログラムを混ぜて書く方法。
asm ( "アセンブラの命令列"
 : 出力オペランド(省略可)
 : 入力オペランド(省略可)
 : 破壊するレジスタ(省略可) )

◆outb()とinb()の実装(マクロ)

次の定義を使うこともある。C言語のプリプロセッサで次のように組み立てられ るinline 関数として定義されている。
linux-5.10.3/arch/x86/include/asm/io.h
 274:	#define BUILDIO(bwl, bw, type)                                          \
 275:	static inline void out##bwl(unsigned type value, int port)              \
 276:	{                                                                       \
 277:	        asm volatile("out" #bwl " %" #bw "0, %w1"                       \
 278:	                     : : "a"(value), "Nd"(port));                       \
 279:	}                                                                       \
 280:	                                                                        \
 281:	static inline unsigned type in##bwl(int port)                           \
 282:	{                                                                       \
 283:	        unsigned type value;                                            \
 284:	        asm volatile("in" #bwl " %w1, %" #bw "0"                        \
 285:	                     : "=a"(value) : "Nd"(port));                       \
 286:	        return value;                                                   \
 287:	}                                                                       \
...
 334:	BUILDIO(b, b, char)
 335:	BUILDIO(w, w, short)
 336:	BUILDIO(l, , int)
Cプリプロセッサを通し、文字列の結合を行うと、次のようになる。
static inline unsigned char inb(int port) {
    unsigned char value;
    asm volatile("inb %w1, %b0" : "=a"(value) : "Nd"(port));
    return value;
}

static inline void outb(unsigned char value, int port) {
    asm volatile("outb %b0, %w1" : : "a"(value), "Nd"(port));
}

◆/proc/ioports

/proc/ioports を見ると、使われている入出力ポートがわかる。
$ cat /proc/ioports [←]
0000-0cf7 : PCI Bus 0000:00
  0000-001f : dma1
  0020-0021 : PNP0001:00
    0020-0021 : pic1
  0040-0043 : timer0
  0050-0053 : timer1
  0060-0060 : keyboard
  0061-0061 : PNP0800:00
  0064-0064 : keyboard
  0070-0073 : rtc0
  0080-008f : dma page reg
...
0d00-feff : PCI Bus 0000:00
...
  e000-efff : PCI Bus 0000:19
$ []

■割り込み

◆割り込みの必要性

◆割り込みとは

システム・コールやページフォールトは、入出力デバイスではなく CPU 内部か ら発生する。これを、例外(exception)という。例外は、割り込みの一種として 扱われることが多い。

◆x86の割り込みコントローラ

◆Intel 8259 PIC

8259、8259、CPU
図? x86 の Intel 8259

◆APIC

Local APIC、Core、I/O APIC
図? x86 の APIC

APIC は、次のような割り込み信号を受け取る。

◆例外

例外(exceptions) とは、ハードウェア・デバイスとは無関係に、 CPU の命令実行の途中で生じる。

例:

多くの CPU アーキテクチャでは、例外を割り込みと同じように扱う。 x86 では、システム・コールの処理も、割り込みと同じように扱う。

◆割り込みハンドラ

割り込みハンドラ(interrupt handlers)とは、割り込みが生じた時にそれに応 答するために実行される関数。割り込みサービスルーチン(interrupt service routine, ISR)とも呼ばれる。

例:

Linux では、割り込みハンドラは、C言語の関数。普通の関数との違い。

◆割り込み記述子テーブル

割り込みハンドラは、割り込み記述子テーブル(interrupt descriptor tables)や 割り込みベクタテーブル(interrupt vector table)と呼ばれる表に登録されて いる。(CPUの違い、同じCPU x86でもモードの違いで、テーブルの名前が異なる。)

割り込み番号、割り込み記述子テーブル、割り込みハンドラ
図? 割り込み記述子テーブルと割り込みハンドラ

◆割り込みの前半部分と後半部分

次の2つを両立させたい Linux では、これを両立するために、割り込みの処理を2つに分ける。 例: ネットワークカードによるメッセージの受信

◆割り込み番号の共有

割り込み信号線が足りない時に、1つの割り込み番号を、複数のデバイスで共有 することがある。

デバイス5個、OR回路、PIC、CPU
図? PICの線が不足した時の対応

■Linuxにおける割り込みハンドラの登録

Linux で、割り込みの前半部を登録するには、request_irq() を使う。 登録を解除するには、free_irq() を使う。

◆request_irq()

CPUアーキテクチャに独立した形で割り込みハンドラを登録するには、 request_irq() を用いる。
include/linux/interrupt.h

typedef irqreturn_t (*irq_handler_t)(int, void *);

request_irq(unsigned int irq, irq_handler_t handler, unsigned long flags,
            const char *name, void *dev)
主なフラグ
IRQF_DISABLED
割り込みハンドラの実行中、「全ての」割り込みを禁止する。 このフラグがセットされていなければ、自分自身だけ禁止され、 他の割り込みは許可された状態で動作する。
IRQF_SAMPLE_RANDOM
乱数生成器のために割り込みを利用してもよい。
IRQF_TIMER
システム・タイマのために利用する。
IRQF_SHARED
複数のデバイスで同じ割り込み番号を共有できる。

◆free_irq()

割り込みハンドラが不要になった時には、free_irq() で取り除く。
void free_irq(unsigned int, void *dev)

◆irq_handler_t handler

割り込みハンドラは、次のような関数である。
irqreturn_t handler(int irq, void *dev)
IRQ_NONE
割り込みは、自分自身のものではなかった。
IRQ_HANDLED
割り込みをきちんと処理した。
全割り込みハンドラが IRQ_NONE を返せば、なんらかのトラブルを意味する。 複数の割り込みハンドラが IRQ_HANDLED を返すことは正常。

◆/proc/interrupts

/proc/interrupts は、割り込みの回数を保持している。
$ cat /proc/interrupts  [←]
           CPU0       CPU1       
  0:    4208761      38584    IO-APIC-edge  timer
  1:          0          3    IO-APIC-edge  i8042
  7:          0          0    IO-APIC-edge  parport0
  8:          1          2    IO-APIC-edge  rtc
  9:          0          0   IO-APIC-level  acpi
 12:          3          1    IO-APIC-edge  i8042
 50:       5380      86508         PCI-MSI  ahci
 74:        346          0         PCI-MSI  HDA Intel
 98:        294      28232         PCI-MSI  eth1
169:        130      57006   IO-APIC-level  uhci_hcd:usb3
177:          0          0   IO-APIC-level  uhci_hcd:usb4, uhci_hcd:usb7
217:        358     149530   IO-APIC-level  ehci_hcd:usb1, uhci_hcd:usb5
225:          0          0   IO-APIC-level  ehci_hcd:usb2, uhci_hcd:usb6
233:          0          0   IO-APIC-level  uhci_hcd:usb8
NMI:          0          0 
LOC:    4246864    4246863 
ERR:          0
MIS:          0
$ []

◆x86 CMOS Real-Time Clock rtc_interrupt()

x86 CMOS Real-Time Clock での割り込みハンドラの例。
linux-5.10.3/arch/x86/include/asm/mc146818rtc.h
 101:	#define RTC_IRQ 8

linux-5.10.3/drivers/rtc/rtc-cmos.c
  73:	struct cmos_rtc {
  74:	        struct rtc_device       *rtc;
  75:	        struct device           *dev;
  76:	        int                     irq;
....
  92:	};

 648:	static struct cmos_rtc  cmos_rtc;

 706:	static int INITSECTION
 707:	cmos_do_probe(struct device *dev, struct resource *ports, int rtc_irq)
 708:	{
...
 798:	        cmos_rtc.rtc = devm_rtc_allocate_device(dev);
...
 851:	                        rtc_cmos_int_handler = cmos_interrupt;
...
 853:	                retval = request_irq(rtc_irq, rtc_cmos_int_handler,
 854:	                                0, dev_name(&cmos_rtc.rtc->dev),
 855:	                                cmos_rtc.rtc);
...
 861:	                cmos_rtc.rtc->ops = &cmos_rtc_ops;
...
 867:	        retval = rtc_register_device(cmos_rtc.rtc);
...
 898:	}

 650:	static irqreturn_t cmos_interrupt(int irq, void *p)
 651:	{
...
 653:	        u8              irqstat;
...
 665:	        irqstat = CMOS_READ(RTC_INTR_FLAGS);
...
 692:	        if (is_intr(irqstat)) {
 693:	                rtc_update_irq(p, 1, irqstat);
 694:	                return IRQ_HANDLED;
 695:	        } else
 696:	                return IRQ_NONE;
 697:	}

■Linuxにおける割り込みハンドラの実行

ハードウェア依存のコードからハードウェア独立のコードを呼び出す。

◆x86 Interrupt Descriptor Table (IDT)

x86 IDT は、ハードウェア・レベルの割り込みハンドラの一覧表を保持する。 その先頭番地は、IDTR レジスタに保存される。
linux-5.10.3/arch/x86/kernel/traps.c
1143:	void __init trap_init(void)
...
1151:	        idt_setup_traps();
...
1159:	}

linux-5.10.3/arch/x86/include/asm/irq_vectors.h
   7:	#define X86_TRAP_DE              0      /* Divide-by-zero */
   8:	#define X86_TRAP_DB              1      /* Debug */
   9:	#define X86_TRAP_NMI             2      /* Non-maskable Interrupt */
  10:	#define X86_TRAP_BP              3      /* Breakpoint */
  13:	#define X86_TRAP_UD              6      /* Invalid Opcode */
  14:	#define X86_TRAP_NM              7      /* Device Not Available */
...
  45:	#define IA32_SYSCALL_VECTOR             0x80
...
 109:	#define NR_VECTORS                       256

linux-5.10.3/arch/x86/kernel/idt.c
 151:	static gate_desc idt_table[IDT_ENTRIES] __page_aligned_bss;

  75:	static const __initconst struct idt_data def_idts[] = {
  76:	        INTG(X86_TRAP_DE,               asm_exc_divide_error),
  77:	        INTG(X86_TRAP_NMI,              asm_exc_nmi),
  78:	        INTG(X86_TRAP_BR,               asm_exc_bounds),
  79:	        INTG(X86_TRAP_UD,               asm_exc_invalid_op),
  80:	        INTG(X86_TRAP_NM,               asm_exc_device_not_available),
...
 106:	        SYSG(IA32_SYSCALL_VECTOR,       entry_INT80_32),
cc...
 108:	};

 210:	void __init idt_setup_traps(void)
 211:	{
 212:	        idt_setup_from_table(idt_table, def_idts, ARRAY_SIZE(def_idts), true);
 213:	}

linux-5.10.3/arch/x86/include/asm/idtentry.h
 442:	#define DECLARE_IDTENTRY(vector, func)                                  \
 443:	        idtentry vector asm_##func func has_error_code=0

 561:	DECLARE_IDTENTRY(X86_TRAP_DE,           exc_divide_error);
 582:	DECLARE_IDTENTRY_RAW(X86_TRAP_BP,               exc_int3);
 594:	DECLARE_IDTENTRY_NMI(X86_TRAP_NMI,      exc_nmi);
 622:	DECLARE_IDTENTRY_IRQ(X86_TRAP_OTHER,    common_interrupt);

linux-5.10.3/arch/x86/entry/entry_32.S
 706:	.macro idtentry vector asmsym cfunc has_error_code:req
 707:	SYM_CODE_START(\asmsym)
...
 716:	        pushl   $\cfunc
 719:	SYM_CODE_END(\asmsym)
 720:	.endm

linux-5.10.3/arch/x86/kernel/traps.c
 197:	DEFINE_IDTENTRY(exc_divide_error)
 198:	{
 199:	        do_error_trap(regs, 0, "divide error", X86_TRAP_DE, SIGFPE,
 200:	                      FPE_INTDIV, error_get_trap_addr(regs));
 201:	}

linux-5.10.3/arch/x86/entry/entry_32.S
1052:	SYM_FUNC_START(entry_INT80_32)
...
1059:	        call    do_int80_syscall_32
...

linux-5.10.3/arch/x86/entry/common.c
  84:	__visible noinstr void do_int80_syscall_32(struct pt_regs *regs)
  86:	        unsigned int nr = syscall_32_enter(regs);
...
  95:	        do_syscall_32_irqs_on(regs, nr);
  97:	}

  72:	static __always_inline void do_syscall_32_irqs_on(struct pt_regs *regs,
  73:	                                                  unsigned int nr)
  74:	{
  77:	                nr = array_index_nospec(nr, IA32_NR_syscalls);
  78:	                regs->ax = ia32_sys_call_table[nr](regs);
  81:	}

◆irq_entries_start()

◆__handle_irq_event_percp()

linux-5.10.3/kernel/irq/handle.c
 137:	irqreturn_t __handle_irq_event_percpu(struct irq_desc *desc, unsigned int *flags)
 138:	{
 139:	        irqreturn_t retval = IRQ_NONE;
 140:	        unsigned int irq = desc->irq_data.irq;
 141:	        struct irqaction *action;
...
 145:	        for_each_action_of_desc(desc, action) {
 146:	                irqreturn_t res;
...
 156:	                res = action->handler(irq, action->dev_id);
..
 163:	                switch (res) {
...
 177:	                case IRQ_HANDLED:
 178:	                        *flags |= action->flags;
 179:	                        break;
 180:	
 181:	                default:
 182:	                        break;
 183:	                }
 184:	
 185:	                retval |= res;
 186:	        }
 187:	
 188:	        return retval;
 189:	}

linux-5.10.3/kernel/irq/internals.h
 161:	#define for_each_action_of_desc(desc, act)                      \
 162:	        for (act = desc->action; act; act = act->next)

■割り込みハンドラのプログラミングの注意点

◆割り込みコンテキスト(アトミック・コンテキスト)

割り込みハンドラが実行されるのは、「割り込みコンテキスト(アトミック・コンテキスト)」。 普通のシステム・コールの処理が実行される「プロセス・コンテキスト」とは 異なる。

プロセス・コンテキストでできること。

割り込みコンテキストでは、このうようなことはできない。 速やかに終了すべきである。busy loop はできるが、あまり やらない方がよい。他の割り込みは、実行される可能性もある。

◆割り込みの許可・禁止

マクロをつかって割り込みを禁止したり、 許可したり(以前の状態に戻したり)する。
unsigned long flags;

local_irq_save(flags); /* 割り込み禁止。マクロ。 */
...
local_irq_restore(flags); /* 割り込み許可 (save の時の状態にもどる) */
単一CPUの x86 では、cli() と sti() で割り込みの禁止と許可を設定する方法 があった。それそれ同名の CPU の命令を実行して、全ての割り込みを禁止/許 可する。マルチプロセッサ(マルチコア含む)では、1つのCPU で割り込みを禁止 しても、他の CPU では許可されていることがあるので、cli()/sti() の方法は 使えない。

特定の割り込み番号の割り込みを禁止する方法もある。

void disable_irq(unsigned ing irq);
    // 全CPUの割り込みを禁止する

void disable_irq_nosync(unsigned ing irq);
    // 同上。ただし、割り込みハンドラの終了を待たない。

void enable_irq(unsigned ing irq);
    // 割り込みを許可する。

void synchronize_irq(unsigned ing irq);
    // 割り込みハンドラの終了を待つ。

■課題3 デバイスドライバと割り込み処理、inb()とoutb()

授業時間中に Manaba の小テストに回答しなさい。

なるべく授業時間中に次の問題を解き、Manaba の「レポート」で回答しなさい。

★問題(301) x86 CMOS RTCからの月日データの入力

次のプログラムは、x86 CMOS RTC ハードウェアから日(day)データを読み 出し変数 day に入れるプログラムの一部である。/*空欄(a)*/と/*空欄(b)*/を 埋めて完成させなさい。
    unsigned char day;
    outb( /*空欄(a)*/, 0x70 );
    day = inb( /*空欄(b)*/ );

★問題(302) 割り込みの利用

キーボード、マウス、ネットワーク・カード等のデバイスからの入力では割り 込みが多く使われている。割り込みを使う方法と割り込みを使わない方法を対 比して、割り込みを使う方法の利点を説明しなさい。
Last updated: 2021/01/18 13:09:31
Yasushi Shinjo / <yas@cs.tsukuba.ac.jp>