2025年01月16日 情報科学類 オペレーティングシステム II 筑波大学 システム情報系 新城 靖 <yas@cs.tsukuba.ac.jp>
このページは、次の URL にあります。
https://www.coins.tsukuba.ac.jp/~yas/coins/os2-2024/2025-01-16
あるいは、次のページから手繰っていくこともできます。
https://www.coins.tsukuba.ac.jp/~yas/
https://www.cs.tsukuba.ac.jp/~yas/
図? struct page page[]による物理メモリの管理
linux-6.12.7/include/linux/mm_types.h 72: struct page { 73: unsigned long flags; /* Atomic flags, some possibly 74: * updated asynchronously */ ... 89: struct list_head lru; ... 104: struct address_space *mapping; ... 126: atomic_long_t pp_ref_count; ... 200: void *virtual; /* Kernel virtual address (NULL if 201: not kmapped, ie. highmem) */ ... 219: } _struct_page_alignment;
PG_locked | ページがピン留めされている。ページアウトされない。入出力の処理中に設定され、完了後に解除される。 |
PG_referenced | ディスク入出力のために参照されている。 |
PG_uptodate | ページの内容が有効である。入力処理が完了した。 |
PG_dirty | ページの内容が変更された。 |
PG_lru | ページングのための LRU リストにある。 |
PG_active | ページがアクティブである。 |
PG_arch_1 | アーキテクチャ固有のページ状態 |
PG_reserved | ページアウト禁止、または、ブード時のメモリ・アロケータで割り当てられた |
PG_writeback | 書き戻し中 |
PG_reclaim | 開放すべきページ |
PG_swapbacked | バックエンドはスワップ領域かRAM |
PG_mlocked | vma でロック(ページアウトされいようにセット)されている |
linux-6.12.7/arch/x86/include/asm/page_types.h 10: #define PAGE_SHIFT 12 11: #define PAGE_SIZE (_AC(1,UL) << PAGE_SHIFT) 12: #define PAGE_MASK (~(PAGE_SIZE-1)) linux-6.12.7/include/uapi/linux/const.h 20: #define __AC(X,Y) (X##Y) 21: #define _AC(X,Y) __AC(X,Y)
よく使われるゾーンの種類。
図? メモリのゾーンへの分割(x86-32)
図? メモリのゾーンへの分割(x86-64)
DMA は、ハードディスクやネットワークデバイス等で使われているの入出力方 法の1つ。通常、メモリは、CPU が制御している。DMA では、周辺デバイスが CPU からメモリの制御を奪い、データの入出力を行う。
DMA の利点
次のような手続きで、メモリを開放する。
linux-6.12.7/include/linux/gfp.h 205: struct page *__alloc_pages_noprof(gfp_t gfp, unsigned int order, int preferred_nid, 206: nodemask_t *nodemask); 207: #define __alloc_pages(...) alloc_hooks(__alloc_pages_noprof(__VA_ARGS__)) ... 311: static inline struct page *alloc_pages_noprof(gfp_t gfp_mask, unsigned int order) 312: { 313: return alloc_pages_node_noprof(numa_node_id(), gfp_mask, order); 314: } ... 333: #define alloc_pages(...) alloc_hooks(alloc_pages_noprof(__VA_ARGS__)) ... 339: #define alloc_page(gfp_mask) alloc_pages(gfp_mask, 0) ... 350: extern unsigned long get_free_pages_noprof(gfp_t gfp_mask, unsigned int order); 351: #define __get_free_pages(...) alloc_hooks(get_free_pages_noprof(__VA_ARGS__)) 352: 353: extern unsigned long get_zeroed_page_noprof(gfp_t gfp_mask); 354: #define get_zeroed_page(...) alloc_hooks(get_zeroed_page_noprof(__VA_ARGS__))
__get_free_pages(), alloc_pages(), alloc_page() や、 後述する kmalloc() では、 gfp_t のフラグ(gfp_mask) として、次のものがよく使われる。特に GFP_KERNEL がよく使われる。gfp は、get free pages に由来する。
linux-6.12.7/include/linux/gfp_types.h
型 | 説明 |
---|---|
GFP_ATOMIC | 高優先度。スリープ不可。割込み処理の前半(割り込みハンドラ、top half)や後半(bottom half)で使う。 |
GFP_KERNEL | カーネル用メモリ通常の方法。スリープ可。ユーザ・プロセスのコンテキストで使う。 |
GFP_NOIO | スリープ可、入出力不可。 |
GFP_NOFS | スリープ化、入出力可、ファイル操作不可。ファイルシステムの実装で使う(他のファイルシステムの操作を開始しない)。 |
GFP_USER | ユーザ空間用のメモリの通常の方法。スリープ可。 |
GFP_HIGHUSER | HIGHMEMゾーンからの割当て。スリープ可。 |
GFP_DMA | DMAゾーンからの割当て。デバイス・ドライバ等が使う。 |
GFP_DMA32 | DMA32ゾーンからの割当て。デバイス・ドライバ等が使う。 |
buddy とは、仲間の意味。
0 | 1 |
2 | 3 |
4 | 5 |
6 | 7 |
0,1 | 2,3 |
4,5 | 6,7 |
0,1,2,3 | 4,5,6,7 |
Buddyシステムでのメモリ管理手法
図1(a) Buddyシステムによる空きページの管理(論理的な見方)
図1(b) Buddyシステムによる空きページの管理(線形な見方)
$ cat /proc/buddyinfo
Node 0, zone DMA 1 1 1 1 1 1 1 0 1 1 3
Node 0, zone DMA32 3544 7608 4945 3129 1783 840 337 121 33 0 0
Node 0, zone Normal 27583 9215 14233 4512 1288 208 127 20 3 1 0
$
この例では、DMA ゾーンの 2 0 (4KB) に、1 個、2 1 (8KB) に、1 個、・・・、2 10 に3個の空きがある。
外部フラグメンテーションが起きると、大きな塊が少なくなる。
x86 (32ビット)の例
% cat /proc/buddyinfo
Node 0, zone DMA 6 5 3 3 4 2 2 0 1 1 2
Node 0, zone Normal 476 2577 990 354 174 104 65 34 19 1 135
Node 0, zone HighMem 1416 2920 1718 1082 933 504 251 152 87 43 53
%
この例では、DMA ゾーンの 2 0 (4KB) に、6 個、
2 1 (8KB) に、5 個、・・・、2 10 に2個の空きがある。
外部フラグメンテーションが起きると、大きな塊が少なくなる。
void *kmalloc(size_t size, gfp_t flags)引数
状況 | フラグ |
プロセスのコンテキスト、スリープ可能 | GFP_KERNEL |
プロセスのコンテキスト、スリープ不可 | GFP_ATOMIC |
割込みハンドラ | GFP_ATOMIC |
割込みハンドラ後半(Softirq,Tasklet,後述) | GFP_ATOMIC |
DMA可能なメモリ、スリープ可能 | GFP_DMA|GFP_KERNEL |
DMA可能なメモリ、スリープ不可 | GFP_DMA|GFP_ATOMIC |
void kfree(const void *objp)C言語のユーザ空間で使えるライブラリ free() と似ている。 kmalloc() で割り当てたメモリを解放する。
図? フリーリストの例
図? フリーリストの例(ページを意識)
図? ページ・フレーム、スラブ、オブジェクトの関係
struct kmem_cache * kmem_cache_create (const char *name, size_t size, size_t align, unsigned long flags, void (*ctor)(void *))引数
KMEM_CACHE(__struct, __flags)引数
void kmem_cache_destroy(struct kmem_cache *c)kmem_cache_create() で割り当てた struct kmem_cache *を開放する。 shutdown (電源を切る操作)で呼ばれることがある。
void *kmem_cache_alloc(struct kmem_cache *cachep, gfp_t flags) void *kmem_cache_alloc_node(struct kmem_cache *cachep,gfp_t flags, int node) void kmem_cache_free(struct kmem_cache *cachep, void *b)生成した struct kmem_cache *を使ってオブジェクトのメモリを割り当てる。 割り当てたオブジェクトのメモリは、kmem_cache_free()で開放する。
kmem_cache_alloc_node() は、メモリ・アクセスが不均質なマルチプロセッサ 用。メモリを割り当てるという働きは、kmem_cache_alloc() と同じ。ただし、 node で指定されたプロセッサで高速にアクセスできるメモリに割り当てられる。
linux-6.12.7/include/linux/slab.h 421: #define KMEM_CACHE(__struct, __flags) \ 422: __kmem_cache_create_args(#__struct, sizeof(struct __struct), \ 423: &(struct kmem_cache_args) { \ 424: .align = __alignof__(struct __struct), \ 425: }, (__flags)) linux-6.12.7/kernel/cred.c 36: static struct kmem_cache *cred_jar; ... 606: void __init cred_init(void) 607: { 608: /* allocate a slab in which we can store credentials */ 609: cred_jar = KMEM_CACHE(cred, 610: SLAB_HWCACHE_ALIGN | SLAB_PANIC | SLAB_ACCOUNT); g 611: } 206: struct cred *prepare_creds(void) 207: { 208: struct task_struct *task = current; 209: const struct cred *old; 210: struct cred *new; 211: 212: new = kmem_cache_alloc(cred_jar, GFP_KERNEL); ... 218: old = task->cred; 219: memcpy(new, old, sizeof(struct cred)); ... 245: return new; ... 250: } 68: static void put_cred_rcu(struct rcu_head *rcu) 69: { 70: struct cred *cred = container_of(rcu, struct cred, rcu); ... 89: kmem_cache_free(cred_jar, cred); 90: }
# cat /proc/slabinfo
slabinfo - version: 2.1
# name <active_objs> <num_objs> <objsize> <objperslab> <pagesperslab> : tunables <limit> <batchcount> <sharedfactor> : slabdata <active_slabs> <num_slabs> <sharedavail>
nfs_direct_cache 0 0 352 23 2 : tunables 0 0 0 : slabdata 0 0 0
nfs_commit_data 92 92 704 23 4 : tunables 0 0 0 : slabdata 4 4 0
...
UDP 240 240 1088 30 8 : tunables 0 0 0 : slabdata 8 8 0
tw_sock_TCP 160 160 256 16 1 : tunables 0 0 0 : slabdata 10 10 0
TCP 155 240 1984 16 8 : tunables 0 0 0 : slabdata 15 15 0
...
task_struct 763 784 4224 7 8 : tunables 0 0 0 : slabdata 112 112 0
cred_jar 1588 2982 192 21 1 : tunables 0 0 0 : slabdata 142 142 0
anon_vma 18794 19584 80 51 1 : tunables 0 0 0 : slabdata 384 384 0
pid 1984 1984 128 32 1 : tunables 0 0 0 : slabdata 62 62 0
...
dma-kmalloc-8192 0 0 8192 4 8 : tunables 0 0 0 : slabdata 0 0 0
dma-kmalloc-4096 0 0 4096 8 8 : tunables 0 0 0 : slabdata 0 0 0
...
dma-kmalloc-16 0 0 16 256 1 : tunables 0 0 0 : slabdata 0 0 0
dma-kmalloc-8 0 0 8 512 1 : tunables 0 0 0 : slabdata 0 0 0
...
kmalloc-8192 74 88 8192 4 8 : tunables 0 0 0 : slabdata 22 22 0
kmalloc-4096 371 392 4096 8 8 : tunables 0 0 0 : slabdata 49 49 0
...
kmalloc-32 47009 48256 32 128 1 : tunables 0 0 0 : slabdata 377 377 0
kmalloc-16 115733 117760 16 256 1 : tunables 0 0 0 : slabdata 460 460 0
kmalloc-8 65406 68608 8 512 1 : tunables 0 0 0 : slabdata 134 134 0
kmem_cache_node 320 320 64 64 1 : tunables 0 0 0 : slabdata 5 5 0
kmem_cache 160 160 256 16 1 : tunables 0 0 0 : slabdata 10 10 0
#
スラブ・アロケータには、2種類ある。
size-番号
。
DMA が付いているものは、DMA 可能なメモリ。
図? プロセスのアドレス空間の構造(64ビット)
0x00000000-0xffffffff
のうち0xc0000000-0xffffffff
の間は、
オペレーティング・システム・カーネルが使うので、ユーザ空間では使えない。
ELF ファイルは、ヘッダとセクションの並びからなる。重要なセクションに は、.text, .rodata, .data がある。
$ file hello.c
hello.c: C source, ASCII text
$ cat hello.c
#include <stdio.h>
int main()
{
printf("hello, %s!\n","world");
}
$ cc -o hello hello.c
$ file hello
hello: ELF 64-bit LSB executable, x86-64, version 1 (SYSV), dynamically linked
(uses shared libs), for GNU/Linux 2.6.32, BuildID[sha1]=68c4fff13c07df8738b2e
0f20a27f9a03a20f5c1, not stripped
$ size hello
text data bss dec hex filename
1234 548 4 1786 6fa hello
$ readelf -S hello
There are 30 section headers, starting at offset 0x1928:
Section Headers:
[Nr] Name Type Address Offset
Size EntSize Flags Link Info Align
[ 0] NULL 0000000000000000 00000000
0000000000000000 0000000000000000 0 0 0
[ 1] .interp PROGBITS 0000000000400238 00000238
000000000000001c 0000000000000000 A 0 0 1
...
[13] .text PROGBITS 0000000000400440 00000440
0000000000000182 0000000000000000 AX 0 0 16
...
[15] .rodata PROGBITS 00000000004005d0 000005d0
0000000000000022 0000000000000000 A 0 0 8
...
[24] .data PROGBITS 0000000000601030 00001030
0000000000000004 0000000000000000 WA 0 0 1
[25] .bss NOBITS 0000000000601034 00001034
0000000000000004 0000000000000000 WA 0 0 1
...
[27] .symtab SYMTAB 0000000000000000 00001068
00000000000005e8 0000000000000018 28 46 8
...
$
int execve(const char *filename, char *const argv[], char *const envp[])
線形なアドレス空間は、メモリ・エリア(memory area)(または、memory region、memory interval)に分割される。
linux-6.12.7/include/linux/sched.h 785: struct task_struct { ... 928: struct mm_struct *mm; ... 1617: };tast_struct の mm フィールド
linux-6.12.7/include/linux/mm_types.h 790: struct mm_struct { ... 804: atomic_t mm_count; ... 807: struct maple_tree mm_mt; ... 817: pgd_t * pgd; ... 838: atomic_t mm_users; ... 859: int map_count; /* number of VMAs */ ... 878: struct list_head mmlist; ... 922: unsigned long start_code, end_code, start_data, end_data; 923: unsigned long start_brk, brk, start_stack; 924: unsigned long arg_start, arg_end, env_start, env_end; ... 1040: };
linux-6.12.7/include/linux/mm_types.h 667: struct vm_area_struct { ... 673: unsigned long vm_start; 674: unsigned long vm_end; ... 685: struct mm_struct *vm_mm; 686: pgprot_t vm_page_prot; /* Access permissions of this VMA. */ ... 693: const vm_flags_t vm_flags; ... 744: const struct vm_operations_struct *vm_ops; ... 749: struct file * vm_file; /* File we map to (can be NULL). */ ... 773: } __randomize_layout;
フラグ | 説明 |
---|---|
VM_READ | 読み込み可 |
VM_WRITE | 書き込み可 |
VM_EXEC | 実行可 |
VM_SHARED | 共有されている |
VM_GROWSDOWN | アドレスが小さい方に伸びる |
VM_GROWSUP | アドレスが大きい方に伸びる |
VM_LOCKED | ロックされている。 |
VM_DONTCOPY | fork() でコピーしない |
VM_DONTEXPAND | mremap()で拡張不可。 |
図? プロセスのアドレス空間の実現
/proc/PID/maps
というファイルを見ると、その様子が分かる。
$ echo $$
22696
$ ls /proc/$$
attr cwd map_files oom_adj schedstat task
autogroup environ maps oom_score sessionid timers
auxv exe mem oom_score_adj setgroups uid_map
cgroup fd mountinfo pagemap smaps wchan
clear_refs fdinfo mounts patch_state stack
cmdline gid_map mountstats personality stat
comm io net projid_map statm
coredump_filter limits ns root status
cpuset loginuid numa_maps sched syscall
$ cat /proc/$$/maps
00400000-004de000 r-xp 00000000 fd:00 403270428 /usr/bin/bash
006dd000-006de000 r--p 000dd000 fd:00 403270428 /usr/bin/bash
006de000-006e7000 rw-p 000de000 fd:00 403270428 /usr/bin/bash
006e7000-006ed000 rw-p 00000000 00:00 0
00b7a000-00bdc000 rw-p 00000000 00:00 0 [heap]
...
7fb437f5e000-7fb438122000 r-xp 00000000 fd:00 50035 /usr/lib64/libc-2.17.so
7fb438122000-7fb438321000 ---p 001c4000 fd:00 50035 /usr/lib64/libc-2.17.so
7fb438321000-7fb438325000 r--p 001c3000 fd:00 50035 /usr/lib64/libc-2.17.so
7fb438325000-7fb438327000 rw-p 001c7000 fd:00 50035 /usr/lib64/libc-2.17.so
7ffc24c64000-7ffc24c85000 rw-p 00000000 00:00 0 [stack]
7ffc24dce000-7ffc24dd0000 r-xp 00000000 00:00 0 [vdso]
ffffffffff600000-ffffffffff601000 r-xp 00000000 00:00 0 [vsyscall]
$ wc /proc/$$/maps
41 239 3630 /proc/22696/maps
$
/proc/PID/maps
のフィールドの意味
/proc/PID/maps
では、人間にとって
分かりやすいようにわざわざ表示している。
ブロック・デバイスのメジャー番号とマイナー番号は、ls -l でわかる。
$ ls -l /dev/dm-0
brw-rw---- 1 root disk 253, 0 Dec 25 10:26 /dev/dm-0
$
ファイルの inode 番号は、ls -i でわかる。
$ ls -li /bin/bash /usr/lib64/libc-2.17.so
403270428 -rwxr-xr-x 1 root root 964536 Oct 27 2021 /bin/bash
50035 -rwxr-xr-x 1 root root 2156592 Mar 23 2024 /usr/lib64/libc-2.17.so
$
図? MMUによる仮想アドレスから物理アドレスへの変換
図? 1段のページテーブル
unsigned long int page_table[0x100000];この配列の要素は、ページ・フレームの先頭番地(物理アドレス)。
MMU(ハードウェア) は、このページテーブルを使って、次のようにして仮想ア ドレスから物理アドレスを求める。以下は、MMU の動きを C 言語で説明したも の。
unsigned long int physical_address( unsigned long int virtual v ) { unsigned long int p, page, offset; p = v >> 12; // 32中、上位20ビット(32-12==20)の取り出し offset = v & 0xfff; // 下位 12 ビットの取り出し page = page_table[p]; return( page + offset ); }
図? 1段のページテーブル
page_table[] は、0x100000 個 == 1024 * 1024 個 == 1M 個の要素からなる。 1要素が 4 バイト(32ビット) なら、4MB のメモリが必要になる。
仮想アドレスの構成の 例。 1ページが4KB、仮想アドレスが32ビットの時の分割の例(他の分割方法も考えら れる)
図? 仮想アドレス上位20ビットの5つの部分への分割例
図? 5段のページテーブル
unsigned int pgd[0x10]; unsigned long int physical_address( unsigned long int virtual v ) { unsigned int *pud, *p4d, *pmd, *pte, p, q, r, s, t, page, offset; p = v >> (32-4) ; q = (v >> (32-8)) & 0xf; r = (v >> (32-12)) & 0xf; s = (v >> (32-16)) & 0xf; t = (v >> (32-20)) & 0xf; offset = v & 0xfff; p4d = pgd[p]; pud = p4d[q]; pmd = pud[r]; pte = pmd[s]; page = pte[t] return( page + offset ); }
図? 仮想アドレス位20ビットの2つの部分への分割例
図? x86の2段のページテーブル
linux-6.12.7/arch/x86/include/asm/idtentry.h 180: #define DEFINE_IDTENTRY_RAW_ERRORCODE(func) \ 181: __visible noinstr void func(struct pt_regs *regs, unsigned long error_code) linux-6.12.7/arch/x86/mm/fault.c 1493: DEFINE_IDTENTRY_RAW_ERRORCODE(exc_page_fault) 1494: { ... 1496: unsigned long address; 1497: 1498: address = cpu_feature_enabled(X86_FEATURE_FRED) ? fred_event_data(regs) : read_cr2(); ... 1539: handle_page_fault(regs, error_code, address); ... 1543: } 1468: static __always_inline void 1469: handle_page_fault(struct pt_regs *regs, unsigned long error_code, 1470: unsigned long address) 1471: { ... 1478: if (unlikely(fault_in_kernel_space(address))) { 1479: do_kern_addr_fault(regs, error_code, address); 1480: } else { 1481: do_user_addr_fault(regs, error_code, address); ... 1490: } 1491: } ... 1210: static inline 1211: void do_user_addr_fault(struct pt_regs *regs, 1212: unsigned long error_code, 1213: unsigned long address) 1214: { 1215: struct vm_area_struct *vma; 1216: struct task_struct *tsk; 1217: struct mm_struct *mm; 1218: vm_fault_t fault; 1219: unsigned int flags = FAULT_FLAG_DEFAULT; 1220: 1221: tsk = current; 1222: mm = tsk->mm; ... 1329: vma = lock_vma_under_rcu(mm, address); 1330: if (!vma) 1331: goto lock_mmap; ... 1338: fault = handle_mm_fault(vma, address, flags | FAULT_FLAG_VMA_LOCK, regs); ... 1371: if (unlikely(access_error(error_code, vma))) { 1372: bad_area_access_error(regs, error_code, address, mm, vma); 1373: return; 1374: } ... 1358: lock_mmap: ... 1361: vma = lock_mm_and_find_vma(mm, address, regs); ... 1389: fault = handle_mm_fault(vma, address, flags, regs); ... 1452: }
linux-6.12.7/include/linux/mm.h 547: struct vm_fault { ... 591: }; linux-6.12.7/mm/memory.c 6042: vm_fault_t handle_mm_fault(struct vm_area_struct *vma, unsigned long address, 6043: unsigned int flags, struct pt_regs *regs) 6044: { 6045: /* If the fault handler drops the mmap_lock, vma may be freed */ 6046: struct mm_struct *mm = vma->vm_mm; ... 6056: if (!arch_vma_access_permitted(vma, flags & FAULT_FLAG_WRITE, 6057: flags & FAULT_FLAG_INSTRUCTION, 6058: flags & FAULT_FLAG_REMOTE)) { 6059: ret = VM_FAULT_SIGSEGV; 6060: goto out; 6061: } ... 6077: ret = __handle_mm_fault(vma, address, flags); ... 6105: return ret; 6106: } 5816: static vm_fault_t __handle_mm_fault(struct vm_area_struct *vma, 5817: unsigned long address, unsigned int flags) 5818: { 5819: struct vm_fault vmf = { 5820: .vma = vma, 5821: .address = address & PAGE_MASK, 5822: .real_address = address, 5823: .flags = flags, 5824: .pgoff = linear_page_index(vma, address), 5825: .gfp_mask = __get_fault_gfp_mask(vma), 5826: }; 5827: struct mm_struct *mm = vma->vm_mm; 5828: unsigned long vm_flags = vma->vm_flags; 5829: pgd_t *pgd; 5830: p4d_t *p4d; 5831: vm_fault_t ret; 5832: 5833: pgd = pgd_offset(mm, address); 5834: p4d = p4d_alloc(mm, pgd, address); ... 5838: vmf.pud = pud_alloc(mm, p4d, address); ... 5869: vmf.pmd = pmd_alloc(mm, vmf.pud, address); ... 5909: return handle_pte_fault(&vmf); 5910: }
linux-6.12.7/mm/memory.c 5732: static vm_fault_t handle_pte_fault(struct vm_fault *vmf) 5733: { ... 5752: vmf->pte = pte_offset_map_nolock(vmf->vma->vm_mm, vmf->pmd, 5753: vmf->address, &vmf->ptl); ... 5756: vmf->orig_pte = ptep_get_lockless(vmf->pte); 5757: vmf->flags |= FAULT_FLAG_ORIG_PTE_VALID; ... 5765: if (!vmf->pte) 5766: return do_pte_missing(vmf); 5767: 5768: if (!pte_present(vmf->orig_pte)) 5769: return do_swap_page(vmf); ... 5808: } 3960: static vm_fault_t do_pte_missing(struct vm_fault *vmf) 3961: { 3962: if (vma_is_anonymous(vmf->vma)) 3963: return do_anonymous_page(vmf); 3964: else 3965: return do_fault(vmf); 3966: } 5401: static vm_fault_t do_fault(struct vm_fault *vmf) 5402: { 5403: struct vm_area_struct *vma = vmf->vma; 5404: struct mm_struct *vm_mm = vma->vm_mm; 5405: vm_fault_t ret; ... 5410: if (!vma->vm_ops->fault) { ... 5430: } else if (!(vmf->flags & FAULT_FLAG_WRITE)) 5431: ret = do_read_fault(vmf); 5432: else if (!(vma->vm_flags & VM_SHARED)) 5433: ret = do_cow_fault(vmf); 5434: else 5435: ret = do_shared_fault(vmf); ... 5442: return ret; 5443: } 5277: static vm_fault_t do_read_fault(struct vm_fault *vmf) 5278: { ... 5297: ret = __do_fault(vmf); ... 5306: return ret; 5307: } 4855: static vm_fault_t __do_fault(struct vm_fault *vmf) 4856: { 4857: struct vm_area_struct *vma = vmf->vma; ... 4859: vm_fault_t ret; ... 4882: ret = vma->vm_ops->fault(vmf); ... 4908: return ret; 4909: }
vma->vm_ops->fault(vma, &vmf)
で処理。
ELF 形式の実行形式や共有ライブラリから機械語命令やデータを読み出す。
linux-6.12.7/mm/memory.c 6169: struct vm_area_struct *lock_mm_and_find_vma(struct mm_struct *mm, 6170: unsigned long addr, struct pt_regs *regs) 6171: { 6172: struct vm_area_struct *vma; ... 6177: vma = find_vma(mm, addr); ... 6217: return vma; ... 6222: } linux-6.12.7/mm/mmap.c 964: struct vm_area_struct *find_vma(struct mm_struct *mm, unsigned long addr) 965: { 966: unsigned long index = addr; ... 969: return mt_find(&mm->mm_mt, &index, ULONG_MAX); 970: }
struct s1 { /* 省略 */ }; 利用 struct s1 *p; p = malloc( sizeof(struct s1) ); use( p ); free( p );このプログラムを、カーネル内で動かすことを想定してkmalloc() と kfree() を使って書き換えなさい。ただし、gfp のフラグとしては、GFP_KERNEL を使いなさい。
利用 struct s1 *p; /*回答*/ use( p ); /*回答*/
初期化 /*回答*/ 利用 struct s1 *p; /*回答*/ use( p ); /*回答*/
0x00000000 から 0x00000fff まで
0x00001000 から 0x00001fff まで
0xfffff000 から 0xffffffff まで