2013年01月15日 情報科学類 オペレーティングシステム II 筑波大学 システム情報工学研究科 コンピュータサイエンス専攻, 電子・情報工学系 新城 靖 <yas@cs.tsukuba.ac.jp>
このページは、次の URL にあります。
http://www.coins.tsukuba.ac.jp/~yas/coins/os2-2012/2013-01-15
あるいは、次のページから手繰っていくこともできます。
http://www.coins.tsukuba.ac.jp/~yas/
http://www.cs.tsukuba.ac.jp/~yas/
卒業予定の4年生に対する特別措置として、2月5日(火曜日)6時間目 (16:45-18:00)に試験をします。対象者は、授業終了後、前に集まって下さい。
図? プロセスのアドレス空間の構造
線形なアドレス空間は、メモリ・エリア(memory area)(または、memory region、memory interval)に分割される。
linux-3.6.8/include/linux/sched.h 1234: struct task_struct { ... 1299: struct mm_struct *mm, *active_mm; ... 1592: };tast_struct の mm フィールド
図? プロセス関連のメモリの構造体
linux-3.6.8/include/linux/mm_types.h 315: struct mm_struct { 316: struct vm_area_struct * mmap; /* list of VMAs */ 317: struct rb_root mm_rb; 318: struct vm_area_struct * mmap_cache; /* last find_vma result */ ... 329: pgd_t * pgd; 330: atomic_t mm_users; /* How many users with user space? */ 331: atomic_t mm_count; /* How many references to "struct mm_struct" (users count as 1) */ 332: int map_count; /* number of VMAs */ ... 337: struct list_head mmlist; /* List of maybe swapped mm's. These are globally strung 338: * together off init_mm.mmlist, and are protected 339: * by mmlist_lock 340: */ ... 355: unsigned long start_code, end_code, start_data, end_data; 356: unsigned long start_brk, brk, start_stack; 357: unsigned long arg_start, arg_end, env_start, env_end; ... 408: };
linux-3.6.8/include/linux/mm_types.h 227: struct vm_area_struct { 228: struct mm_struct * vm_mm; /* The address space we belong to. */ 229: unsigned long vm_start; /* Our start address within vm_mm. */ 230: unsigned long vm_end; /* The first byte after our end address 231: within vm_mm. */ 232: 233: /* linked list of VM areas per task, sorted by address */ 234: struct vm_area_struct *vm_next, *vm_prev; 235: 236: pgprot_t vm_page_prot; /* Access permissions of this VMA. */ 237: unsigned long vm_flags; /* Flags, see mm.h. */ 238: 239: struct rb_node vm_rb; ... 268: const struct vm_operations_struct *vm_ops; ... 273: struct file * vm_file; /* File we map to (can be NULL). */ ... 282: };
フラグ | 説明 |
---|---|
VM_READ | 読み込み可 |
VM_WRITE | 書き込み可 |
VM_EXEC | 実行可 |
VM_SHARED | 共有されている |
VM_GROWSDOWN | アドレスが小さい方に伸びる |
VM_GROWSUP | アドレスが大きい方に伸びる |
VM_DENYWRITE | 書き込み不可。 |
VM_EXECUTABLE | 実行可能。 |
VM_LOCKED | ロックされている。 |
VM_DONTCOPY | コピー不可 |
VM_DONTEXPAND | 拡張不可。 |
図? プロセスのアドレス空間の実現
/proc/PID/maps
というファイルを見ると、その様子が分かる。
$ echo $$
3981
$ ls /proc/$$
attr cpuset fd maps oom_adj smaps task
auxv cwd io mem oom_score stat wchan
cmdline environ limits mounts root statm
coredump_filter exe loginuid mountstats schedstat status
$ cat /proc/$$/maps
00110000-00114000 r-xp 00000000 08:02 490576 /lib/libnss_dns-2.5.so
00114000-00115000 r--p 00003000 08:02 490576 /lib/libnss_dns-2.5.so
00115000-00116000 rw-p 00004000 08:02 490576 /lib/libnss_dns-2.5.so
...
08047000-080f5000 r-xp 00000000 08:02 481554 /bin/bash
080f5000-080fa000 rw-p 000ae000 08:02 481554 /bin/bash
080fa000-080ff000 rw-p 080fa000 00:00 0
09d66000-09e25000 rw-p 09d66000 00:00 0 [heap]
...
bffdd000-bfff2000 rw-p bffe9000 00:00 0 [stack]
$ wc /proc/$$/maps
45 263 2920 /proc/3981/maps
$
/proc/PID/maps
のフィールドの意味
/proc/PID/maps
では、人間にとって
分かりやすいようにわざわざ表示している。
ブロック・デバイスのメジャー番号とマイナー番号は、ls -l でわかる。
$ ls -l /dev/sda2
brw-r----- 1 root disk 8, 2 Jan 24 12:00 /dev/sda2
$
ファイルの inode 番号は、ls -i でわかる。
$ ls -li /bin/bash
481554 -rwxr-xr-x 1 root root 735004 Jan 22 2009 /bin/bash
$ ls -li /lib/libnss_dns-2.5.so
490576 -rwxr-xr-x 1 root root 21948 Oct 26 08:16 /lib/libnss_dns-2.5.so
$
図? MMUによる仮想アドレスから物理アドレスへの変換
図? 1段のページテーブル
ページテーブルは、次のような配列になる。unsigned int page_table[0x100000];この配列の要素は、ページ・フレームの先頭番地(物理アドレス)。
MMU(ハードウェア) は、このページテーブルを使って、次のようにして仮想ア ドレスから物理アドレスを求める。以下は、MMU の動きを C 言語で説明したも の。
unsigned long int physical_address( unsigned long int virtual v ) { unsigned long int p, page, offset; p = v >> 12; // 32中、上位20ビット(32-12==20)の取り出し offset = v & 0xfff; // 下位 12 ビットの取り出し page = page_table[p] return( page + offset ); }
図? 1段のページテーブル
注意: 白い部分は、0 が入っている。0 の部分は、ページ・フレームが割り当 てられていないことを意味する。0 を保持するためにも、メモリが必要である。page_table[] は、0x100000 個 == 1024 * 1024 個 == 1M 個の要素からなる。 1要素が 4 バイト(32ビット) なら、4MB のメモリが必要になる。
仮想アドレスの構成の 例。 1ページが4KB、仮想アドレスが32ビットの時の分割の例(他の分割方法も考えら れる)
図? 仮想アドレスの4つの部分への分割例
図? 4段のページテーブル
unsigned int pgd[0x20]; unsigned long int physical_address( unsigned long int virtual v ) { unsigned int *pud, *pmd, *pte, p, q, r, s, page, offset; p = v >> (32-5) ; q = (v >> (32-10)) & 0x1f; r = (v >> (32-15)) & 0x1f; s = (v >> (32-20)) & 0x1f; offset = v & 0xfff; pud = pgd[p]; pmd = pud[q]; pte = pmd[r]; page = pte[s] return( page + offset ); }
図? 仮想アドレスの3つの部分への分割例
図? x86の2段のページテーブル
linux-3.6.8/arch/x86/mm/fault.c 1003: dotraplinkage void __kprobes 1004: do_page_fault(struct pt_regs *regs, unsigned long error_code) 1005: { 1006: struct vm_area_struct *vma; 1007: struct task_struct *tsk; 1008: unsigned long address; 1009: struct mm_struct *mm; 1010: int fault; 1011: int write = error_code & PF_WRITE; 1012: unsigned int flags = FAULT_FLAG_ALLOW_RETRY | FAULT_FLAG_KILLABLE | 1013: (write ? FAULT_FLAG_WRITE : 0); 1014: 1015: tsk = current; 1016: mm = tsk->mm; 1017: 1018: /* Get the faulting address: */ 1019: address = read_cr2(); ... 1135: vma = find_vma(mm, address); 1136: if (unlikely(!vma)) { 1137: bad_area(regs, error_code, address); 1138: return; 1139: } 1140: if (likely(vma->vm_start <= address)) 1141: goto good_area; 1142: if (unlikely(!(vma->vm_flags & VM_GROWSDOWN))) { 1143: bad_area(regs, error_code, address); 1144: return; 1145: } ... 1158: if (unlikely(expand_stack(vma, address))) { 1159: bad_area(regs, error_code, address); 1160: return; 1161: } ... 1158: if (unlikely(expand_stack(vma, address))) { 1159: bad_area(regs, error_code, address); 1160: return; 1161: } ... 1178: fault = handle_mm_fault(mm, vma, address, flags); ... 1211: }
linux-3.6.8/mm/memory.c 3490: int handle_mm_fault(struct mm_struct *mm, struct vm_area_struct *vma, 3491: unsigned long address, unsigned int flags) 3492: { 3493: pgd_t *pgd; 3494: pud_t *pud; 3495: pmd_t *pmd; 3496: pte_t *pte; ... 3510: pgd = pgd_offset(mm, address); 3511: pud = pud_alloc(mm, pgd, address); 3512: if (!pud) 3513: return VM_FAULT_OOM; 3514: pmd = pmd_alloc(mm, pud, address); 3515: if (!pmd) 3516: return VM_FAULT_OOM; ... 3561: pte = pte_offset_map(pmd, address); 3562: 3563: return handle_pte_fault(mm, vma, address, pte, pmd, flags); 3564: }
linux-3.6.8/mm/memory.c 3434: int handle_pte_fault(struct mm_struct *mm, 3435: struct vm_area_struct *vma, unsigned long address, 3436: pte_t *pte, pmd_t *pmd, unsigned int flags) 3437: { 3438: pte_t entry; 3440: 3441: entry = *pte; ... 3443: if (pte_none(entry)) { 3444: if (vma->vm_ops) { 3445: if (likely(vma->vm_ops->fault)) 3446: return do_linear_fault(mm, vma, address, 3447: pte, pmd, flags, entry); 3448: } 3449: return do_anonymous_page(mm, vma, address, 3450: pte, pmd, flags); 3451: } 3452: if (pte_file(entry)) 3453: return do_nonlinear_fault(mm, vma, address, 3454: pte, pmd, flags, entry); 3455: return do_swap_page(mm, vma, address, 3456: pte, pmd, flags, entry); ... 3485: }
vma->vm_ops->fault
という関数があれば、
do_linear_fault() で処理する。
0x00000000 から 0x00000fff まで
0x00001000 から 0x00001fff まで
0xfffff000 から 0xffffffff まで