AT&T匯編與Intel匯編的比較
文章作者:linuxkernel (newbie)
既然大家對(duì)匯編感興趣,不妨我也來(lái)湊湊熱鬧。廢話少說(shuō),言歸正傳。
Intel和AT&T語(yǔ)法的區(qū)別
Intel和AT&T匯編語(yǔ)言的語(yǔ)法表面上各不相同,這將導(dǎo)致剛剛學(xué)會(huì)INTEL匯編的人第一次見(jiàn)到AT&T匯編時(shí)
會(huì)感到困惑,或者反之。因此讓我們從基礎(chǔ)的東西開(kāi)始。
前綴
在Intel匯編中沒(méi)有寄存器前綴或者立即數(shù)前綴。而在AT&T匯編中寄存器有一個(gè)“%”前綴,立即數(shù)有
一個(gè)“$”前綴。Intel語(yǔ)句中十六進(jìn)制和二進(jìn)制數(shù)據(jù)分別帶有“h”和“b”后綴,并且如果十六進(jìn)制
數(shù)字的第一位是字母的話,那么數(shù)值的前面要加一個(gè)“0”前綴。
例如,
Intex Syntax
mov? ?eax,1
mov? ?ebx,0ffh
int? ?80h
AT&T Syntax
movl? ?$1,%eax
movl? ?$0xff,%ebx
int? ? $0x80
就像你看到的,AT&T非常難懂。[base+index*scale+disp] 看起來(lái)比disp(base,index,scale)更好理解。
操作數(shù)的用法
intel語(yǔ)句中操作數(shù)的用法和AT&T中的用法相反。在Intel語(yǔ)句中,第一個(gè)操作數(shù)表示目的,第二個(gè)
操作數(shù)表示源。然而在AT&T語(yǔ)句中第一個(gè)操作數(shù)表示源而第二個(gè)操作數(shù)表示目的。在這種情形下AT&T語(yǔ)法
的好處是顯而易見(jiàn)的。我們從左向右讀,也從左向右寫(xiě),這樣比較自然。
例如,
Intex Syntax
instr? ?dest,source
mov? ?eax,[ecx]
? ?
AT&T Syntax
instr? ? source,dest
movl? ?(%ecx),%eax
存儲(chǔ)器操作數(shù)
如同上面所看到的,存儲(chǔ)器操作數(shù)的用法也不相同。在Intel語(yǔ)句中基址寄存器用“[”和“]”括起來(lái)
而在AT&T語(yǔ)句中是用“(”和“)”括起來(lái)的。
例如,
Intex Syntax
mov? ?eax,[ebx]
mov? ?eax,[ebx+3]
AT&T Syntax
movl? ?(%ebx),%eax
movl? ?3(%ebx),%eax
AT&T語(yǔ)法中用來(lái)處理復(fù)雜的操作的指令的形式和Intel語(yǔ)法中的形式比較起來(lái)要難懂得多。在Intel語(yǔ)句
中這樣的形式是segreg:[base+index*scale+disp]。在AT&T語(yǔ)句中這樣的形式是
%segreg:disp(base,index,scale)。
Index/scale/disp/segreg 都是可選并且可以去掉的。Scale在本身沒(méi)有說(shuō)明而index已指定的情況下
缺省值為1。segreg的確定依賴(lài)于指令本身以及程序運(yùn)行在實(shí)模式還是pmode。在實(shí)模式下它依賴(lài)于
指令本身而pmode模式下它是不需要的。在AT&T語(yǔ)句中用作scale/disp的立即數(shù)不要加“$”前綴。
例如
Intel Syntax
instr? ? foo,segreg:[base+index*scale+disp]
mov? ?eax,[ebx+20h]
add? ?eax,[ebx+ecx*2h]
lea? ?eax,[ebx+ecx]
sub? ?eax,[ebx+ecx*4h-20h]? ?
AT&T Syntax
instr? ?%segreg:disp(base,index,scale),foo
movl? ?0x20(%ebx),%eax
addl? ?(%ebx,%ecx,0x2),%eax
leal? ?(%ebx,%ecx),%eax
subl? ?-0x20(%ebx,%ecx,0x4),%eax
后綴
就像你已經(jīng)注意到的,AT&T語(yǔ)法中有一個(gè)后綴,它的意義是表示操作數(shù)的大小。“l(fā)”代表long,
“w”代表word,“b”代表byte。Intel語(yǔ)法中在處理存儲(chǔ)器操作數(shù)時(shí)也有類(lèi)似的表示,
如byte ptr, word ptr, dword ptr。"dword" 顯然對(duì)應(yīng)于“l(fā)ong”。這有點(diǎn)類(lèi)似于C語(yǔ)言中定義的
類(lèi)型,但是既然使用的寄存器的大小對(duì)應(yīng)著假定的數(shù)據(jù)類(lèi)型,這樣就顯得不必要了。
例子:
Intel Syntax
mov? ?al,bl
mov? ?ax,bx
mov? ?eax,ebx
mov? ?eax, dword ptr [ebx]? ?
AT&T Syntax
movb? ?%bl,%al
movw? ?%bx,%ax
movl? ?%ebx,%eax
movl? ?(%ebx),%eax
注意:從此開(kāi)始所有的例子都使用AT&T語(yǔ)法
系統(tǒng)調(diào)用
本節(jié)將介紹linux中匯編語(yǔ)言系統(tǒng)調(diào)用的用法。系統(tǒng)調(diào)用包括位于/usr/man/man2的手冊(cè)里第二部分所有
的函數(shù)。這些函數(shù)也在/usr/include/sys/syscall.h中列出來(lái)了。一個(gè)重要的關(guān)于這些函數(shù)的列表是
在http://www.linuxassembly.org/syscall.html里。這些函數(shù)通過(guò)linux中斷服務(wù):int $0x80來(lái)被執(zhí)行
小于六個(gè)參數(shù)的系統(tǒng)調(diào)用
對(duì)于所有的系統(tǒng)調(diào)用,系統(tǒng)調(diào)用號(hào)在%eax中。對(duì)于小于六個(gè)參數(shù)的系統(tǒng)調(diào)用,參數(shù)依次存放
在%ebx,%ecx,%edx,%esi,%edi中,系統(tǒng)調(diào)用的返回值保存在%eax中。
系統(tǒng)調(diào)用號(hào)可以在/usr/include/sys/syscall.h中找到。宏被定義成SYS_的形式,
如SYS_exit, SYS_close等。
例子:(hello world 程序)
參照write(2)的幫助手冊(cè),寫(xiě)操作被聲明為ssize_t write(int fd, const void *buf, size_t count);
這樣,fd應(yīng)存放在%ebx中,buf放在 %ecx, count 放在 %edx , SYS_write 放在 %eax中,緊跟著是
int $0x80語(yǔ)句來(lái)執(zhí)行系統(tǒng)調(diào)用。系統(tǒng)調(diào)用的返回值保存在%eax中。
$ cat write.s
.include "defines.h"
.data
hello:
? ?.string "hello world/n"
.globl? ?main
main:
? ?movl? ?$SYS_write,%eax
? ?movl? ?$STDOUT,%ebx
? ?movl? ?$hello,%ecx
? ?movl? ?$12,%edx
? ?int? ?$0x80
? ?ret
$
少于5個(gè)參數(shù)的系統(tǒng)調(diào)用的處理也是這樣的。只是沒(méi)有用到的寄存器保持不變罷了。象open或者fcntl這樣
帶有一個(gè)可選的額外參數(shù)的系統(tǒng)調(diào)用也就知道怎么用了。
大于5個(gè)參數(shù)的系統(tǒng)調(diào)用
參數(shù)個(gè)數(shù)大于五個(gè)的系統(tǒng)調(diào)用仍然把系統(tǒng)調(diào)用號(hào)保存在%eax中,但是參數(shù)存放在內(nèi)存中,并且指向第一個(gè)
參數(shù)的指針保存在%ebx中。
如果你使用棧,參數(shù)必須被逆序壓進(jìn)棧里,即按最后一個(gè)參數(shù)到第一個(gè)參數(shù)的順序。然后將棧的指針拷貝
到%ebx中。或者將參數(shù)拷貝到一塊分配的內(nèi)存區(qū)域,然后把第一個(gè)參數(shù)的地址保存在%ebx中。
例子:(使用mmap作為系統(tǒng)調(diào)用的例子)。在C中使用mmap():
#include
#include
#include
#include
#include
#define STDOUT? ?1
void main(void) {
? ?char file[]="mmap.s";
? ?char *mappedptr;
? ?int fd,filelen;
? ?fd=fopen(file, O_RDONLY);
? ?filelen=lseek(fd,0,SEEK_END);
? ?mappedptr=mmap(NULL,filelen,PROT_READ,MAP_SHARED,fd,0);
? ?write(STDOUT, mappedptr, filelen);
? ?munmap(mappedptr, filelen);
? ?close(fd);
}
mmap()參數(shù)在內(nèi)存中的排列:
%esp? ?%esp+4? ?%esp+8? ?%esp+12? ?%esp+16? ?%esp+20
00000000? ?filelen? ?00000001? ?00000001? ?fd? ?00000000
等價(jià)的匯編程序:
$ cat mmap.s
.include "defines.h"
.data
file:
? ?.string "mmap.s"
fd:
? ?.long? ? 0
filelen:
? ?.long? ? 0
mappedptr:
? ?.long? ? 0
.globl main
main:
? ?push? ?%ebp
? ?movl? ?%esp,%ebp
? ?subl? ?$24,%esp
//? ?open($file, $O_RDONLY);
? ?movl? ?$fd,%ebx? ?// save fd
? ?movl? ?%eax,(%ebx)
//? ?lseek($fd,0,$SEEK_END);
? ?movl? ?$filelen,%ebx? ?// save file length
? ?movl? ?%eax,(%ebx)
? ?xorl? ?%edx,%edx
//? ?mmap(NULL,$filelen,PROT_READ,MAP_SHARED,$fd,0);
? ?movl? ?%edx,(%esp)
? ?movl? ?%eax,4(%esp)? ?// file length still in %eax
? ?movl? ?$PROT_READ,8(%esp)
? ?movl? ?$MAP_SHARED,12(%esp)
? ?movl? ?$fd,%ebx? ?// load file descriptor
? ?movl? ?(%ebx),%eax
? ?movl? ?%eax,16(%esp)
? ?movl? ?%edx,20(%esp)
? ?movl? ?$SYS_mmap,%eax
? ?movl? ?%esp,%ebx
? ?int? ?$0x80
? ?movl? ?$mappedptr,%ebx? ?// save ptr
? ?movl? ?%eax,(%ebx)
? ?? ?
//? ? write($stdout, $mappedptr, $filelen);
//? ?munmap($mappedptr, $filelen);
//? ?close($fd);
? ?
? ?movl? ?%ebp,%esp
? ?popl? ?%ebp
? ?ret
$
注意:上面所列出的源代碼和本文結(jié)束部分的例子的源代碼不同。上面列出的代碼中沒(méi)有說(shuō)明其它的
系統(tǒng)調(diào)用,因?yàn)檫@不是本節(jié)的重點(diǎn),上面列出的源代碼僅僅打開(kāi)mmap.s文件,而例子的源代碼要讀
命令行的參數(shù)。這個(gè)mmap的例子還用到lseek來(lái)獲取文件大小。
Socket系統(tǒng)調(diào)用
Socket系統(tǒng)調(diào)用使用唯一的系統(tǒng)調(diào)用號(hào):SYS_socketcall,它保存在%eax中。Socket函數(shù)是通過(guò)位于
/usr/include/linux/net.h的一個(gè)子函數(shù)號(hào)來(lái)確定的,并且它們被保存在%ebx中。指向系統(tǒng)調(diào)用參數(shù)
的一個(gè)指針存放在%ecx中。Socket系統(tǒng)調(diào)用也是通過(guò)int $0x80來(lái)執(zhí)行的。
$ cat socket.s
.include "defines.h"
.globl? ?_start
_start:
? ?pushl? ?%ebp
? ?movl? ?%esp,%ebp
? ?sub? ?$12,%esp
//? ?socket(AF_INET,SOCK_STREAM,IPPROTO_TCP);
? ?movl? ?$AF_INET,(%esp)
? ?movl? ?$SOCK_STREAM,4(%esp)
? ?movl? ?$IPPROTO_TCP,8(%esp)
? ?movl? ?$SYS_socketcall,%eax
? ?movl? ?$SYS_socketcall_socket,%ebx
? ?movl? ?%esp,%ecx
? ?int? ?$0x80
? ?movl? ? $SYS_exit,%eax
? ?xorl? ? %ebx,%ebx
? ?int? ? $0x80
? ?movl? ?%ebp,%esp
? ?popl? ?%ebp
? ?ret
$
命令行參數(shù)
在linux中執(zhí)行的時(shí)候命令行參數(shù)是放在棧上的。先是argc,跟著是一個(gè)由指向命令行中各字符串的
指針組成的數(shù)組(**argv)并以空指針結(jié)束。接下來(lái)是一個(gè)由指向環(huán)境變量的指針組成的
數(shù)組(**envp)。這些東西在asm中都可以很容易的獲得,并且在例子代碼(args.s)中有示范。
GCC內(nèi)聯(lián)匯編
本節(jié)中GCC內(nèi)聯(lián)匯編僅涉及x86的應(yīng)用程序。操作數(shù)約束會(huì)和其它處理器上的有所不同。關(guān)于這部分
的說(shuō)明放在本文的最后。
gcc中基本的內(nèi)聯(lián)匯編非常易懂,如
__asm__("movl? ?%esp,%eax");? ?// look familiar ?
或者是
__asm__("
? ?? ???movl? ?$1,%eax? ?? ?// SYS_exit
? ?? ???xor? ?%ebx,%ebx
? ?? ???int? ?$0x80
? ?");
如果指定了用作asm的輸入、輸出數(shù)據(jù)并指出哪一個(gè)寄存器會(huì)被修改,會(huì)使程序的執(zhí)行效率提高。
input/output/modify都不是必需的。格式如下:
__asm__("" : output : input : modify);
output和input中必須包含一個(gè)操作數(shù)約束字符串,并緊跟一個(gè)用圓括號(hào)括起來(lái)的C語(yǔ)言表達(dá)式。
輸出操作數(shù)約束的前面必須有一個(gè)“=”,表示這是一個(gè)輸出??赡軙?huì)有多個(gè)輸出,多個(gè)輸入和
多個(gè)修改過(guò)的寄存器。每個(gè)“入口”應(yīng)該用“,”分隔開(kāi),并且入口的總數(shù)不多有10個(gè)。
操作數(shù)約束字符串可以是包含整個(gè)寄存器的名稱(chēng)也可以是簡(jiǎn)寫(xiě)。
Abbrev Table
Abbrev? ?Register
a? ?%eax/%ax/%al
b? ?%ebx/%bx/%bl
c? ?%ecx/%cx/%cl
d? ?%edx/%dx/%dl
S? ?%esi/%si
D? ?%edi/%di
m? ?memory
例如:
? ?__asm__("test? ?%%eax,%%eax", : /* no output */ : "a"(foo));
或者是
? ?__asm__("test? ?%%eax,%%eax", : /* no output */ : "eax"(foo));
你可以在__asm__后使用關(guān)鍵字__volatile__:“你可以利用在__asm__后使用關(guān)鍵字__volatile__的
方法防止一條‘a(chǎn)sm’指令被刪除、移動(dòng)或者被重新組合。”(出自gcc的info文件中"Assembler
Instructions with C Expression Operands" 部分)
$ cat inline1.c
#include
int main(void) {
? ?int foo=10,bar=15;
? ?
? ?__asm__ __volatile__ ("addl? ? %%ebxx,%%eax"
? ?? ?: "=eax"(foo)? ?? ?// ouput
? ?? ?: "eax"(foo), "ebx"(bar)// input
? ?? ?: "eax"? ?? ???// modify
? ?);
? ?printf("foo+bar=%d/n", foo);
? ?return 0;
}
$
你可能已經(jīng)注意到現(xiàn)在寄存器使用“%%”前綴而不是“%”。這在使用output/input/modify域時(shí)是必要的,
這是因?yàn)榇藭r(shí)基于其它域的寄存器的別名的使用。我馬上來(lái)討論這個(gè)問(wèn)題。
你可以很簡(jiǎn)單的指定“a”而不是寫(xiě)“eax”或者強(qiáng)制使用一個(gè)特殊寄存器如"eax"、"ax"、"al",
這同樣適用于其它一般用途的寄存器(在Abbrev表中列出的)。當(dāng)你在當(dāng)前的代碼中使用特殊的寄存器
時(shí)這好像毫無(wú)用處,因此gcc提供了寄存器別名。最多有10個(gè)別名(%0—%9),這也是為什么只允許10個(gè)
輸入/輸出的原因。
$ cat inline2.c
int main(void) {
? ?long eax;
? ?short bx;
? ?char cl;
? ?__asm__("nop;nop;nop"); // to separate inline asm from the rest of
? ?? ?? ???// the code
? ?__volatile__ __asm__("
? ?? ?test? ?%0,%0
? ?? ?test? ?%1,%1
? ?? ?test? ?%2,%2"
? ?? ?: /* no outputs */
? ?? ?: "a"((long)eax), "b"((short)bx), "c"((char)cl)
? ?);
? ?__asm__("nop;nop;nop");
? ?return 0;
}
$ gcc -o inline2 inline2.c
$ gdb ./inline2
GNU gdb 4.18
Copyright 1998 Free Software Foundation, Inc.
GDB is free software, covered by the GNU General Public License, and you are
welcome to change it and/or distribute copies of it under certain conditions.
Type "show copying" to see the conditions.
There is absolutely no warranty for GDB.??Type "show warranty" for details.
This GDB was configured as "i686-pc-linux-gnulibc1"...
(no debugging symbols found)...
(gdb) disassemble main
Dump of assembler code for function main:
... start: inline asm ...
0x8048427 : nop
0x8048428 : nop
0x8048429 : nop
0x804842a : mov 0xfffffffc(%ebp),%eax
0x804842d : mov 0xfffffffa(%ebp),%bx
0x8048431 : mov 0xfffffff9(%ebp),%cl
0x8048434 : test %eax,%eax
0x8048436 : test %bx,%bx
0x8048439 : test %cl,%cl
0x804843b : nop
0x804843c : nop
0x804843d : nop
... end: inline asm ...
End of assembler dump.
$
就像你看到的,由內(nèi)聯(lián)匯編生成的代碼將變量的值放入它們?cè)趇nput域中指定的寄存器中,然后繼續(xù)
執(zhí)行當(dāng)前的代碼。編譯器自動(dòng)根據(jù)變量的大小來(lái)偵測(cè)操作數(shù)的大小,這樣相應(yīng)的寄存器就被
別名%0, %1 和 %2代替了(當(dāng)使用寄存器別名時(shí)在存儲(chǔ)器里指定操作數(shù)的大小回導(dǎo)致編譯時(shí)發(fā)生錯(cuò)誤)
在操作數(shù)約束里也可以使用別名。這不允許你在輸入/輸出域中指定多于10個(gè)的入口。我能想到的這樣
做的唯一用法是在你指定操作數(shù)約束為“q”以便讓編譯器在a,b,c,d寄存器之間進(jìn)行選擇的時(shí)候。
當(dāng)這個(gè)寄存器被修改時(shí),我們不會(huì)知道選中了那個(gè)寄存器,因而不能在modify域中指定它。
這種情況下你只需指定""。
例子:
$ cat inline3.c
#include
int main(void) {
? ?long eax=1,ebx=2;
? ?__asm__ __volatile__ ("add %0,%2"
? ?? ?: "=b"((long)ebx)
? ?? ?: "a"((long)eax), "q"(ebx)
? ?? ?: "2"
? ?);
? ?printf("ebx=%x/n", ebx);
? ?return 0;
}
$