計算機系統基礎學習筆記(2)-數據的位運算操做

時間 2020-04-22

標籤計算機系統基礎學習筆記數據運算简体版

原文原文鏈接

C語言的位運算操做包括兩類，邏輯運算操做和邏輯移位操做。shell

邏輯運算操做

C語言提供了四種按位邏輯操做符，分別是按位取反，按位與，按位或，按位異或。在編譯時，編譯器會根據操做數的寬度分別轉換爲不一樣的指令。微信

操做	C語言操做符	彙編指令
按位取反	~	notb、notw、notl
按位與	&	andb、andw、andl
按位或	l	orb、orw、orl
按位異或	^	xorb、xorw、xorl

注意: C語言的邏輯與(&&)、邏輯或(||)、邏輯非(!)並無對應的機器指令，而是由多條指令聯合來實現這些功能，完成以變量爲單位的邏輯操做。函數

下面咱們以一個簡單的C語言程序test.c來了解邏輯運算操做過程。學習

#include <stdio.h>

void main() 
{
	int a=5;
	unsigned int b=3;
	short c=5;
	int d=0;
	
	a = ~a;
	b = ~b;
	c = ~c;
	d = a&b;
	d = a^b;
	d = a|b;
	
	return;
}

利用gcc命令將其進行編譯成可執行文件。3d

gcc -o0 -m32 -g test.c -o test

利用objdump命令進行反彙編並將其重定向到test.txt文件方便查看。code

objdump -S test>test.txt

main函數所對應的彙編指令以下所示。blog

000004ed <main>:
#include <stdio.h>

void main() 
{
 4ed:	55                   	push   %ebp
 4ee:	89 e5                	mov    %esp,%ebp
 4f0:	83 ec 10             	sub    $0x10,%esp
 4f3:	e8 48 00 00 00       	call   540 <__x86.get_pc_thunk.ax>
 4f8:	05 e4 1a 00 00       	add    $0x1ae4,%eax
	int a=5;
 4fd:	c7 45 f4 05 00 00 00 	movl   $0x5,-0xc(%ebp)
	unsigned int b=3;
 504:	c7 45 f8 03 00 00 00 	movl   $0x3,-0x8(%ebp)
	short c=5;
 50b:	66 c7 45 f2 05 00    	movw   $0x5,-0xe(%ebp)
	int d=0;
 511:	c7 45 fc 00 00 00 00 	movl   $0x0,-0x4(%ebp)
	
	a = ~a;
 518:	f7 55 f4             	notl   -0xc(%ebp)
	b = ~b;
 51b:	f7 55 f8             	notl   -0x8(%ebp)
	c = ~c;
 51e:	66 f7 55 f2          	notw   -0xe(%ebp)
	d = a&b;
 522:	8b 45 f4             	mov    -0xc(%ebp),%eax
 525:	23 45 f8             	and    -0x8(%ebp),%eax
 528:	89 45 fc             	mov    %eax,-0x4(%ebp)
	d = a^b;
 52b:	8b 45 f4             	mov    -0xc(%ebp),%eax
 52e:	33 45 f8             	xor    -0x8(%ebp),%eax
 531:	89 45 fc             	mov    %eax,-0x4(%ebp)
	d = a|b;
 534:	8b 45 f4             	mov    -0xc(%ebp),%eax
 537:	0b 45 f8             	or     -0x8(%ebp),%eax
 53a:	89 45 fc             	mov    %eax,-0x4(%ebp)
	
	return;
 53d:	90                   	nop
}
 53e:	c9                   	leave  
 53f:	c3                   	ret

由以上代碼能夠看出a,b,c取反的三個操做分別對應如下指令。get

a = ~a;
 518:	f7 55 f4             	notl   -0xc(%ebp)
	b = ~b;
 51b:	f7 55 f8             	notl   -0x8(%ebp)
	c = ~c;
 51e:	66 f7 55 f2          	notw   -0xe(%ebp)

其中變量a和變量b的取反指令都是notl,處理的是4字節的變量。而變量c的取反指令執行的是notw,執行的是2字節的變量。這也就說明了編譯器會根據操做數的寬度分別轉換爲不一樣的指令。編譯器

下表給出C語言基本數據和類型和IA-32操做數類型的對應關係博客

C語言聲明	彙編指令長度後綴	存儲長度
(unsigned) char	b	8
(unsigned) short	w	16
(unsigned) int	l	32
(unsigned) long int	l	32
(unsigned) long long int	-	2 $\times$ 32
char *	l	32
float	s	32
double	l	64
long double	t	80/96

仍然如下面這樣一個簡單的C語言程序來理解邏輯與(&&)、邏輯或(||)、邏輯非(!)和按位邏輯操做符的區別。

#include <stdio.h>

void main() 
{
	int a=5;
	unsigned int b=3;
	short c=5;
	int d=0;
	
	a = !a;
	b = !b;
	c = !c;
	d = a&&b;
	d = a||b;
	
	return;
}

利用gcc命令將其進行編譯，objdump命令進行反彙編以後，main函數所對應的彙編指令以下所示。

000004ed <main>:
#include <stdio.h>

void main() 
{
 4ed:	55                   	push   %ebp
 4ee:	89 e5                	mov    %esp,%ebp
 4f0:	83 ec 10             	sub    $0x10,%esp
 4f3:	e8 82 00 00 00       	call   57a <__x86.get_pc_thunk.ax>
 4f8:	05 e4 1a 00 00       	add    $0x1ae4,%eax
	int a=5;
 4fd:	c7 45 f4 05 00 00 00 	movl   $0x5,-0xc(%ebp)
	unsigned int b=3;
 504:	c7 45 f8 03 00 00 00 	movl   $0x3,-0x8(%ebp)
	short c=5;
 50b:	66 c7 45 f2 05 00    	movw   $0x5,-0xe(%ebp)
	int d=0;
 511:	c7 45 fc 00 00 00 00 	movl   $0x0,-0x4(%ebp)
	
	a = !a;
 518:	83 7d f4 00          	cmpl   $0x0,-0xc(%ebp)
 51c:	0f 94 c0             	sete   %al
 51f:	0f b6 c0             	movzbl %al,%eax
 522:	89 45 f4             	mov    %eax,-0xc(%ebp)
	b = !b;
 525:	83 7d f8 00          	cmpl   $0x0,-0x8(%ebp)
 529:	0f 94 c0             	sete   %al
 52c:	0f b6 c0             	movzbl %al,%eax
 52f:	89 45 f8             	mov    %eax,-0x8(%ebp)
	c = !c;
 532:	66 83 7d f2 00       	cmpw   $0x0,-0xe(%ebp)
 537:	0f 94 c0             	sete   %al
 53a:	0f b6 c0             	movzbl %al,%eax
 53d:	66 89 45 f2          	mov    %ax,-0xe(%ebp)
	d = a&&b;
 541:	83 7d f4 00          	cmpl   $0x0,-0xc(%ebp)
 545:	74 0d                	je     554 <main+0x67>
 547:	83 7d f8 00          	cmpl   $0x0,-0x8(%ebp)
 54b:	74 07                	je     554 <main+0x67>
 54d:	b8 01 00 00 00       	mov    $0x1,%eax
 552:	eb 05                	jmp    559 <main+0x6c>
 554:	b8 00 00 00 00       	mov    $0x0,%eax
 559:	89 45 fc             	mov    %eax,-0x4(%ebp)
	d = a||b;
 55c:	83 7d f4 00          	cmpl   $0x0,-0xc(%ebp)
 560:	75 06                	jne    568 <main+0x7b>
 562:	83 7d f8 00          	cmpl   $0x0,-0x8(%ebp)
 566:	74 07                	je     56f <main+0x82>
 568:	b8 01 00 00 00       	mov    $0x1,%eax
 56d:	eb 05                	jmp    574 <main+0x87>
 56f:	b8 00 00 00 00       	mov    $0x0,%eax
 574:	89 45 fc             	mov    %eax,-0x4(%ebp)
	
	return;

機器指令邏輯非(!)實現的操做解釋,以a = !a這個做爲例子：

a = !a;
 518:	83 7d f4 00          	cmpl   $0x0,-0xc(%ebp)
 51c:	0f 94 c0             	sete   %al
 51f:	0f b6 c0             	movzbl %al,%eax
 522:	89 45 f4             	mov    %eax,-0xc(%ebp)

首先將變量a與常數0進行比較，若是相等就置寄存器al爲1，不等則置爲0，而後再把寄存器al的值擴展0擴展送到eax寄存器中，再從寄存器eax中送回到變量a的地址當中。

機器指令邏輯與(&&)實現的操做解釋，以d = a&&b來解釋。

d = a&&b;
 541:	83 7d f4 00          	cmpl   $0x0,-0xc(%ebp)
 545:	74 0d                	je     554 <main+0x67>
 547:	83 7d f8 00          	cmpl   $0x0,-0x8(%ebp)
 54b:	74 07                	je     554 <main+0x67>
 54d:	b8 01 00 00 00       	mov    $0x1,%eax
 552:	eb 05                	jmp    559 <main+0x6c>
 554:	b8 00 00 00 00       	mov    $0x0,%eax
 559:	89 45 fc             	mov    %eax,-0x4(%ebp)

首先將變量a與0進行相比，若是變量a等於0，就跳到554這個位置，也就是執行指令mov $0x0,%eax，就是把0送到寄存器eax裏面，再送到變量d當中。若是變量a不等於0，就用變量b與0相比，若是b等於0，也是跳轉到554這個位置去將最終的結果設置爲0，若是變量b也不等於0，就把1送到寄存器eax當中，將最終的結果設置爲1。

機器指令邏輯或(||)實現的操做解釋，以d = a||b來解釋

d = a||b;
 55c:	83 7d f4 00          	cmpl   $0x0,-0xc(%ebp)
 560:	75 06                	jne    568 <main+0x7b>
 562:	83 7d f8 00          	cmpl   $0x0,-0x8(%ebp)
 566:	74 07                	je     56f <main+0x82>
 568:	b8 01 00 00 00       	mov    $0x1,%eax
 56d:	eb 05                	jmp    574 <main+0x87>
 56f:	b8 00 00 00 00       	mov    $0x0,%eax
 574:	89 45 fc             	mov    %eax,-0x4(%ebp)

首先將變量a與0進行相比，若是變量a不等於0，就跳轉到558這個位置，也就是執行指令mov $0x1,%eax，把1送到寄存器eax裏面，無條件轉到574這個位置，並將eax的值送到變量d當中。若是變量a等於0,就將變量b與0比較，若是b等於0，就跳轉到56f這個位置，去將最終的結果設置爲0。

邏輯移位操做

C語言的移位操做包括邏輯左移，算術左移，邏輯右移，算術右移等四種。

操做	C語言操做符	彙編指令
邏輯左移	<<	shlb、shlw、shll
算術左移	<<	salb、salw、sall
邏輯右移	>>	shrb、shrw、shrl
算術右移	>>	sarb、sarw、sarl

注意：IA-32中的其餘移位指令沒有對應的C語言操做，如想實現循環移位指令，須要編寫多條語句來實現。

邏輯移位和算術移位的C語言操做符相同，編譯器會根據操做數的不一樣來選擇不一樣的指令。無符號數採用邏輯移位指令，有符號數採用算術移位指令。邏輯和算術的區別在於友移時最高位補0仍是補符號位。算術右移補入符號位，邏輯右移補入0。

咱們仍然以一個簡單的C語言指令來爲你們介紹邏輯移位操做的彙編指令。

#include <stdio.h>

void main()
{
	int a = 0x80000000;
	unsigned int b = 0x80000000;
	
	short c = 0x8000;
	unsigned short d = 0x8000;
	
	a=a>>4;
	b=b>>4;
	
	a=c;
	a=d;
	b=c;
	b=d;
	
	return;
}

利用gcc命令將其進行編譯，objdump命令進行反彙編以後，main函數所對應的彙編指令以下所示

000004ed <main>:
#include <stdio.h>

void main()
{
 4ed:	55                   	push   %ebp
 4ee:	89 e5                	mov    %esp,%ebp
 4f0:	83 ec 10             	sub    $0x10,%esp
 4f3:	e8 46 00 00 00       	call   53e <__x86.get_pc_thunk.ax>
 4f8:	05 e4 1a 00 00       	add    $0x1ae4,%eax
	int a = 0x80000000;
 4fd:	c7 45 f8 00 00 00 80 	movl   $0x80000000,-0x8(%ebp)
	unsigned int b = 0x80000000;
 504:	c7 45 fc 00 00 00 80 	movl   $0x80000000,-0x4(%ebp)
	
	short c = 0x8000;
 50b:	66 c7 45 f4 00 80    	movw   $0x8000,-0xc(%ebp)
	unsigned short d = 0x8000;
 511:	66 c7 45 f6 00 80    	movw   $0x8000,-0xa(%ebp)
	
	a=a>>4;
 517:	c1 7d f8 04          	sarl   $0x4,-0x8(%ebp)
	b=b>>4;
 51b:	c1 6d fc 04          	shrl   $0x4,-0x4(%ebp)
	
	a=c;
 51f:	0f bf 45 f4          	movswl -0xc(%ebp),%eax
 523:	89 45 f8             	mov    %eax,-0x8(%ebp)
	a=d;
 526:	0f b7 45 f6          	movzwl -0xa(%ebp),%eax
 52a:	89 45 f8             	mov    %eax,-0x8(%ebp)
	b=c;
 52d:	0f bf 45 f4          	movswl -0xc(%ebp),%eax
 531:	89 45 fc             	mov    %eax,-0x4(%ebp)
	b=d;
 534:	0f b7 45 f6          	movzwl -0xa(%ebp),%eax
 538:	89 45 fc             	mov    %eax,-0x4(%ebp)
	
	return;

從sarl $0x4,-0x8(%ebp)這條指令能夠清楚的看到當執行a右移4位的操做時，由於a是有符號數，因此執行的就是算術右移，對應的彙編指令sarl。而執行b右移時，由於b是無符號數，因此執行的是邏輯右移指令，對應彙編指令shrl。

a=c;
 51f:	0f bf 45 f4          	movswl -0xc(%ebp),%eax
 523:	89 45 f8             	mov    %eax,-0x8(%ebp)
	a=d;
 526:	0f b7 45 f6          	movzwl -0xa(%ebp),%eax
 52a:	89 45 f8             	mov    %eax,-0x8(%ebp)
	b=c;
 52d:	0f bf 45 f4          	movswl -0xc(%ebp),%eax
 531:	89 45 fc             	mov    %eax,-0x4(%ebp)
	b=d;
 534:	0f b7 45 f6          	movzwl -0xa(%ebp),%eax
 538:	89 45 fc             	mov    %eax,-0x4(%ebp)

由這8條指令能夠看出，在執行a=c的時候，執行的是符號擴展指令，z=d時執行的是零擴展指令，b=c時執行的是符號擴展指令，b=d時執行的是零擴展指令。所以咱們能夠看出，執行符號擴展仍是零擴展是由等號右邊的變量類型決定的，與等號左邊的變量類型無關。

位運算的做用

可實現特定的功能：取特定位、保留特定位
週期短速度快：左移、右移可用於實現快速的整數乘、除法
可實現其餘功能：原位交換

PS：交換變量a和變量b的值

普通方法

c = a; a = b; b = c;

位操做交換法

a = a^b; b = b^a; a = a^b;

位操做法原理：

b = b^(a^b) = b^a^b = b^b^a = a
a = (a^b)^(b^(a^b)) = a^b^b^a^b = b

以上內容就是本次我給你們分享的計算機系統基礎學習的筆記-數據的位運算操做，小編也是初次入門，有什麼地方寫的不對的，還請多多指教。以爲還不錯的點個贊支持一下小編，你的確定就是小編前進的動力。另外若是想了解更多計算機專業的知識和技巧的，獻上個人我的博客北徯，另外須要各類資料的童鞋，能夠關注個人微信公衆號北徯，免費的PPT模板，各類資料等你來領。