操做系統---在內核中從新加載GDT和堆棧

時間 2021-03-05

標籤 shell 數組函數 oop 操作系統指針 code 內存開發欄目 Unix 简体版

原文原文鏈接

摘要

用BIOS方式啓動計算機後，BIOS先讀取引導扇區，引導扇區再從外部存儲設備中讀取加載器，加載器讀取內核。進入內核後，把加載器中創建的GDT複製到內核中。shell

這篇文章的最大價值也許在末尾，對C語言指針的新理解。數組

是什麼

在BOOT（引導扇區）加載LOADER（加載器）。函數

在LOADER中初始化GDT、堆棧，把Knernel（內核）讀取到內存，而後開啓保護模式，最後進入Knernel並開始執行。操做系統正式開始運行了。oop

GDT是CPU在保護模式下內存尋址一定會使用的元素，在Kernel執行過程當中也須要用到。操作系統

在內核中從新加載GDT和堆棧，是指，把存儲於LOADER所使用的內存中的GDT數據和堆棧中的數據複製到Kernel所使用的內存中。關鍵點不是Kernel和LOADER所使用的內存，而是變量。換句話說，把存儲在LOADER中的變量中的GDT數據和堆棧中的數據複製到Kernel變量中的GDT和堆棧。指針

LOADER是用匯編寫的，「彙編中的變量」，不知道這種表述是否準確。code

爲何

理由很簡單。LOADER是用匯編語言寫的，Kernel主要用C語言開發。在Kernel中使用GDT，若使用LOADER中定義的那個GDT變量（或者叫標號），光想想就以爲很混亂。ip

用一句解釋：C語言中使用C語言中的變量更方便。內存

怎麼作

流程

在kernel中聲明變量unsigned short gdt_ptr，存儲GDT的內存地址。
使用sgdt指令把GDT的內地址複製到gdt_ptr中。
在kernel中建立結構體gdt，存儲GDT。
使用內存複製函數把GDT從LOADER中設置的內存位置複製到kernel中的變量gdt表示的內存中。

memcpy

它是內存複製函數。開發

這樣實現它：

原型是：memcpy(void *dst, void *src, int size)。
核心是，把數據從[ds:esi]移動到[es:edi]。
以字節爲單位來複制數據，複製size次。
用jmp實現循環，不用loop。
循環終止條件是：size = 0。

memcpy:
		push	ebp
		mov		ebp,	esp
		
		push	edi
		push	esi
		push	ecx
		push	eax
		push	ds
		push	es
		
		mov		es,		[ebp + 12] ;dst
		mov		ds,		[ebp + 8]	; src
		mov		size,	[ebp + 4]	; size
		
		mov		edi,	0
		mov		esi,	0
		mov		ecx,	size
		
.1:
		cmp		ecx,	0
		jz		.2
		mov		al,		[ds:esi]
		mov		[es:edi],		al
		inc		esi
		inc		edi
		dec		ecx
.2:	
		pop		es
		pop		ds
		pop		eax
		pop		ecx
		pop		esi
		pop		edi
		pop		ebp
		ret

gdt

typedef struct {
  	unsigned  short  limitLow;
  	unsigned  short  baseAddressLow;
  	unsigned	char	 baseAddressMid;
  	unsigned	char	 attribute1;
  	unsigned	char	 attribute_limit;
  	unsigned	char	 baseAddressHigh;
}Descriptor;

Descriptor gdt[128];

堆棧

[SECTION .bss]
StackSpace		resb			2 * 1024
StackTop:

mov		esp,	StackTop

不理解。

代碼

C語言

// 聲明一個char數組，存儲GDT的內存地址
unsigned	char	gdt_ptr[6];

nasm彙編

; 使用C語言中聲明的變量gdt_ptr
extern gdt_ptr
; 把寄存器gdtr中的數據複製到變量gdt_ptr中
sgdt	[gdt_ptr]

而後在C語言中把LOADER中的GDT複製到C語言中的gdt變量中。

memcpy(&gdt, 
       (void *)((*)(int *)(&gdt_ptr[2])), 
       (*)((int *)(&gdt_ptr[0]))
      );
short *gdt_limit = &gdt_ptr[0];
int	*gdt_base = &gdt_ptr[2];

*gdt_limit = 128 * sizeof(Descriptor) - 1;
*gdt_base = (int) &gdt;

難點解讀

memcpy的參數

上面的那段代碼，理解起來難度不小。

memcpy(&gdt, 
       (void *)((*)(int *)(&gdt_ptr[2])), 
       (*)((short *)(&gdt_ptr[0]))+1
      );

memcpy的第一個參數是目標內存地址，是一個指針類型變量，賦值應該是一個內存地址，因此用&取得變量gdt的內存地址。

理解(void *)((*)(int *)(&gdt_ptr[2]))：
1. 第二個參數是源數據的內存地址，是GDT的物理地址。
2. 它存儲在gdt_ptr的後6個字節中。
3. &gdt_ptr[2]獲取gdt_ptr的第3個元素gdt_ptr[2]的物理地址。
4. 前面的(int *)將這段物理地址強制類型轉換爲一個指針，這個指針的數據類型是int *。
5. 數據類型是int *有三層含義：
  1. 這個數據是一個指針。
  2. 這個數據的值是一個內存地址。
  3. 這個內存地址是一個4字節（int類型佔用4字節）內存區域的初始地址。
6. &gdt_ptr[2]是一個內存地址，用(int *)將它包裝成或強制轉換成指針類型。
7. 再用*運算符，是獲取這個內存地址指向的內存區域中的數據。
8. 這個數據是int類型，佔用4個字節。這4個字節的初始地址是&gdt_ptr[2]。這是最關鍵的一句。
9. 爲何最後還要用void *？
  1. 由於，這4個字節中存儲的那個int數據又是一個內存地址，所以，須要再次包裝成一個指針。
  2. 由於，memcpy對參數的數據類型要求是void *。
  3. 到底是哪一個緣由，我也不知道。
理解：(*)((short *)(&gdt_ptr[0]))+1
1. 爲何要加1？gdt_ptr的低2位保存的是GDT的字節偏移量的最大值，是GDT的長度減1。
2. &gdt_ptr[0])是gdt_ptr[0])的內存地址AD。
3. (short *)&gdt_ptr[0])用AD建立一個指針變量。
  1. 這個指針變量指向一塊內存。
  2. 這塊內存佔用2個字節。
  3. 這塊內存的初始地址是&gdt_ptr[0])，即gdt_ptr[0])的內存地址。
  4. (short *)&gdt_ptr[0])實質是指代&gdt_ptr[0]、&gdt_ptr[1]這兩小塊內存。
4. (*)((short *)(&gdt_ptr[0]))是&gdt_ptr[0]、&gdt_ptr[1]這兩小塊內存中的值，即gdt_ptr[0]、gdt_ptr[1]。
5. 爲何不須要像第二個參數同樣在前面再加上一個(void *)？
  1. 由於，第4步的結果是一個short類型的整型數（short能稱之爲整型嗎？），不是內存地址，不須要強制類型轉換。

其餘

short *gdt_limit = &gdt_ptr[0];
int	*gdt_base = &gdt_ptr[2];

*gdt_limit = 128 * sizeof(Descriptor) - 1;
*gdt_base = (int) &gdt;

short *gdt_limit = &gdt_ptr[0];
int	*gdt_base = &gdt_ptr[2];

這段代碼建立了兩個變量並賦值，獲取了GDT的界限和地址。但是緊接着又有下面兩句，是對GDT的界限從新賦值。

*gdt_limit = 128 * sizeof(Descriptor) - 1;
*gdt_base = (int) &gdt;

這兩段代碼的功能重複了嗎？

讓咱們先看另一段代碼。

#include <stdio.h>

int main(int argc, char **argv)
{
        int b = 8;
        printf("b = %d\n", b);
        int *a = &b;
        *a = 9;
        printf("b = %d\n", b);

        return 0;
}

執行結果是：

MacBook-Pro:my-note-book cg$ ./test
b = 8
b = 9

第8行*a = 9;修改*a的值，同時也修改了b的值，由於第7行int *a = &b;。

再回頭看

short *gdt_limit = &gdt_ptr[0];
int	*gdt_base = &gdt_ptr[2];

*gdt_limit = 128 * sizeof(Descriptor) - 1;
*gdt_base = (int) &gdt;

*gdt_base指向gdt_ptr[2]爲初始地址的4個字節的連續的內存空間AD，修改*gdt_base，實質是修改AD中的數據。int *gdt_base = &gdt_ptr[2];的做用是讓*gdt_base指向AD；*gdt_base = (int) &gdt;是修改AD中的數據，從業務邏輯的角度看，是把gdt的內存地址寫入AD中。爲何要這樣作？回憶一下咱們的目的是什麼？把存儲了GDT的C語言中變量的內存地址存儲到gdt_ptr中。