嵌入式C語言自我修養(yǎng)09:鏈接過程中的強符號和弱符號-創(chuàng)新互聯

9.1 屬性聲明:weak

GNU C 通過 attribute 聲明weak屬性,可以將一個強符號轉換為弱符號。

創(chuàng)新互聯是一家集網站建設,信宜企業(yè)網站建設,信宜品牌網站建設,網站定制,信宜網站建設報價,網絡營銷,網絡優(yōu)化,信宜網站推廣為一體的創(chuàng)新建站企業(yè),幫助傳統企業(yè)提升企業(yè)形象加強企業(yè)競爭力??沙浞譂M足這一群體相比中小企業(yè)更為豐富、高端、多元的互聯網需求。同時我們時刻保持專業(yè)、時尚、前沿,時刻以成就客戶成長自我,堅持不斷學習、思考、沉淀、凈化自己,讓我們?yōu)楦嗟钠髽I(yè)打造出實用型網站。

使用方法如下。

void  __attribute__((weak))  func(void);
int  num  __attribte__((weak);

編譯器在編譯源程序時,無論你是變量名、函數名,在它眼里,都是一個符號而已,用來表征一個地址。編譯器會將這些符號集中,存放到一個叫符號表的 section 中。

在一個軟件工程項目中,可能有多個源文件,由不同工程師開發(fā)。有時候可能會遇到這種情況:A 工程師在他負責的 A.c 源文件中定義了一個全局變量 num,而 B 工程師也在他負責的 B.c 源文件中定義了一個同名全局變量 num。那么當我們在程序中打印變量 num 的值時,是該打印哪個值呢?

是時候表演真正的技術了。這時候,就需要用編譯鏈接的原理知識來分析這個問題了。編譯鏈接的基本過程其實很簡單,主要分為三個階段。

  • 編譯階段:編譯器以源文件為單位,將每一個源文件編譯為一個 .o 后綴的目標文件。每一個目標文件由代碼段、數據段、符號表等組成。
  • 鏈接階段:鏈接器將各個目標文件組裝成一個大目標文件。鏈接器將各個目標文件中的代碼段組裝在一起,組成一個大的代碼段;各個數據段組裝在一起,組成一個大的數據段;各個符號表也會集中在一起,組成一個大的符號表。最后再將合并后的代碼段、數據段、符號表等組合成一個大的目標文件。
  • 重定位:因為各個目標文件重新組裝,各個目標文件中的變量、函數的地址都發(fā)生了變化,所以要重新修正這些函數、變量的地址,這個過程稱為重定位。重定位結束后,就生成了可以在機器上運行的可執(zhí)行程序。

上面舉例的工程項目,在編譯過程中的鏈接階段,可能就會出現問題:A.c 和 B.c 文件中都定義了一個同名變量 num,那鏈接器到底該用哪一個呢?

這個時候,就需要引入強符號和弱符號的概念了。

9.2 強符號和弱符號

在一個程序中,無論是變量名,還是函數名,在編譯器的眼里,就是一個符號而已。符號可以分為強符號和弱符號。

  • 強符號:函數名、初始化的全局變量名;
  • 弱符號:未初始化的全局變量名。

在一個工程項目中,對于相同的全局變量名、函數名,我們一般可以歸結為下面三種場景。

  • 強符號+強符號
  • 強符號+弱符號
  • 弱符號+弱符號

強符號和弱符號在解決程序編譯鏈接過程中,出現的多個同名變量、函數的沖突問題非常有用。一般我們遵循下面三個規(guī)則。

  • 一山不容二虎
  • 強弱可以共處
  • 體積大者勝出

為了方便,這是我編的順口溜。主要意思就是:在一個項目中,不能同時存在兩個強符號,比如你在一個多文件的工程中定義兩個同名的函數,或初始化的全局變量,那么鏈接器在鏈接時就會報重定義的錯誤。但一個工程中允許強符號和弱符號同時存在。比如你可以同時定義一個初始化的全局變量和一個未初始化的全局變量,這種寫法在編譯時是可以編譯通過的。編譯器對于這種同名符號沖突,在作符號決議時,一般會選用強符號,丟掉弱符號。還有一種情況就是,一個工程中,同名的符號都是弱符號,那編譯器該選擇哪個呢?誰的體積大,即誰在內存中存儲空間大,就選誰。

我們接下來寫一個簡單的程序,來驗證上面的理論。定義兩個源文件:main.c 和 func.c。

//func.c
int a = 1;
int b;
void func(void)
{
    printf("func:a = %d\n", a);
    printf("func: b = %d\n", b);
}

//main.c
int a;
int b = 2;
void func(void);
int main(void)
{
    printf("main:a = %d\n", a);
    printf("main: b = %d\n", b);
    func();
    return 0;
}

編譯程序,可以看到程序運行結果。

$ gcc -o a.out main.c func.c
main: a = 1
main: b = 2
func: a = 1
func: b = 2

我們在 main.c 和 func.c 中分別定義了兩個同名全局變量 a 和 b,但是一個是強符號,一個是弱符號。鏈接器在鏈接過程中,看到沖突的同名符號,會選擇強符號,所以你會看到,無論是 main 函數,還是 func 函數,打印的都是強符號的值。

一般來講,不建議在一個工程中定義多個不同類型的弱符號,編譯的時候可能會出現各種各樣的問題,這里就不舉例了。在一個工程中,也不能同時定義兩個同名的強符號,即初始化的全局變量或函數,否則就會報重定義錯誤。但是我們可以使用 GNU C 擴展的 weak 屬性,將一個強符號轉換為弱符號。

//func.c
int a __attribute__((weak)) = 1;
void func(void)
{
    printf("func:a = %d\n", a);
}

//main.c
int a = 4;
void func(void);
int main(void)
{
    printf("main:a = %d\n", a);
    func();
    return 0;
}

編譯程序,可以看到程序運行結果。

$ gcc -o a.out main.c func.c
main: a = 4
func: a = 4

我們通過 weak 屬性聲明,將 func.c 中的全局變量 a,轉換為一個弱符號,然后在 main.c 里同樣定義一個全局變量 a,并初始化 a 為4。鏈接器在鏈接時會選擇 main.c 中的這個強符號,所以在兩個文件中,打印變量 a 的值都是4。

9.3 函數的強符號和弱符號

鏈接器對于同名變量沖突的處理遵循上面的強弱規(guī)則,對于函數同名沖突,同樣也遵循相同的規(guī)則。函數名本身就是一個強符號,在一個工程中定義兩個同名的函數,編譯時肯定會報重定義錯誤。但我們可以通過 weak 屬性聲明,將其中一個函數轉換為弱符號。

//func.c
int a __attribute__((weak)) = 1;
void __attribute__((weak)) func(void)
{
    printf("func:a = %d\n", a);
}

//main.c
int a = 4;
void func(void)
{
    printf("I am a strong symbol!\n");
}
int main(void)
{
    printf("main:a = %d\n", a);
    func();
    return 0;
}

編譯程序,可以看到程序運行結果。

$ gcc -o a.out main.c func.c
main: a = 4
func: I am a strong symbol!

在這個程序示例中,我們在 main.c 中重新定義了一個同名的 func 函數,然后將 func.c 文件中的 func() 函數,通過 weak 屬性聲明轉換為一個弱符號。鏈接器在鏈接時會選擇 main.c 中的強符號,所以我們在 main 函數中調用 func() 時,實際上調用的是 main.c 文件里的 func() 函數。

9.4 弱符號的用途

在一個源文件中引用一個變量或函數,當我們只聲明,而沒有定義時,一般編譯是可以通過的。這是因為編譯是以文件為單位的,編譯器會將一個個源文件首先編譯為 .o 目標文件。編譯器只要能看到函數或變量的聲明,會認為這個變量或函數的定義可能會在其它的文件中,所以不會報錯。甚至如果你沒有包含頭文件,連個聲明也沒有,編譯器也不會報錯,頂多就是給你一個警告信息。但鏈接階段是要報錯的,鏈接器在各個目標文件、庫中都找不到這個變量或函數的定義,一般就會報未定義錯誤。

當函數被聲明為一個弱符號時,會有一個奇特的地方:當鏈接器找不到這個函數的定義時,也不會報錯。編譯器會將這個函數名,即弱符號,設置為0或一個特殊的值。只有當程序運行時,調用到這個函數,跳轉到0地址或一個特殊的地址才會報錯。

//func.c
int a __attribute__((weak)) = 1;

//main.c
int a = 4;
void __attribute__((weak)) func(void);
int main(void)
{
    printf("main:a = %d\n", a);
    func();
    return 0;
}

編譯程序,可以看到程序運行結果。

$ gcc -o a.out main.c func.c
main: a = 4
Segmentation fault (core dumped)

在這個示例程序中,我們沒有定義 func() 函數,僅僅是在 main.c 里作了一個聲明,并將其聲明為一個弱符號。編譯這個工程,你會發(fā)現是可以編譯通過的,只是到了程序運行時才會出錯。

為了防止函數運行出錯,我們可以在運行這個函數之前,先做一個判斷,即看這個函數名的地址是不是0,然后再決定是否調用、運行。這樣就可以避免段錯誤了,示例代碼如下。

//func.c
int a __attribute__((weak)) = 1;

//main.c
int a = 4;
void __attribute__((weak)) func(void);
int main(void)
{
    printf("main:a = %d\n", a);
    if (func)
        func();
    return 0;
}

編譯程序,可以看到程序運行結果。

$ gcc -o a.out main.c func.c
main: a = 4

函數名的本質就是一個地址,在調用 func 之前,我們先判斷其是否為0,為0的話就不調用了,直接跳過。你會發(fā)現,通過這樣的設計,即使這個 func() 函數沒有定義,我們整個工程也能正常的編譯、鏈接和運行!

弱符號的這個特性,在庫函數中應用很廣泛。比如你在開發(fā)一個庫,基礎的功能已經實現,有些高級的功能還沒實現,那你可以將這些函數通過 weak 屬性聲明,轉換為一個弱符號。通過這樣設置,即使函數還沒有定義,我們在應用程序中只要做一個非0的判斷就可以了,并不影響我們程序的運行。等以后你發(fā)布新的庫版本,實現了這些高級功能,應用程序也不需要任何修改,直接運行就可以調用這些高級功能。

弱符號還有一個好處,如果我們對庫函數的實現不滿意,我們可以自定義與庫函數同名的函數,實現更好的功能。比如我們 C 標準庫中定義的 gets() 函數,就存在漏洞,常常成為***堆棧溢出***的靶子。

int main(void)
{
    char a[10];
    gets(a);
    puts(a);
    return 0;   
}

C 標準定義的庫函數 gets() 主要用于輸入字符串,它的一個 Bug 就是使用回車符來判斷用戶輸入結束標志。這樣的設計很容易造成堆棧溢出。比如上面的程序,我們定義一個長度為10的字符數組用來存儲用戶輸入的字符串,當我們輸入一個長度大于10的字符串時,就會發(fā)生內存錯誤。

接著我們定義一個跟 gets() 相同類型的同名函數,并在 main 函數中直接調用,代碼如下。

#include<stdio.h>

 char * gets (char * str)
 {
     printf("hello world!\n");
     return (char *)0;
 }

int main(void)
{
    char a[10];
    gets(a);
    return 0;   
}

程序運行結果如下。

hello world!

通過運行結果,我們可以看到,雖然我們定義了跟 C 標準庫函數同名的 gets() 函數,但編譯是可以通過的。程序運行時調用 gets() 函數時,就會跳轉到我們自定義的 gets() 函數中運行。

9.5 屬性聲明:alias

GNU C 擴展了一個 alias 屬性,這個屬性很簡單,主要用來給函數定義一個別名。

void __f(void)
{
    printf("__f\n");
}

void f() __attribute__((alias("__f")));
int main(void)
{
    f();
    return 0;   
}

程序運行結果如下。

__f

通過 alias 屬性聲明,我們就可以給 f() 函數定義一個別名 f(),以后我們想調用 f() 函數,可以直接通過 f() 調用即可。

在 Linux 內核中,你會發(fā)現 alias 有時會和 weak 屬性一起使用。比如有些函數隨著內核版本升級,函數接口發(fā)生了變化,我們可以通過 alias 屬性給這個舊接口名字做下封裝,起一個新接口的名字。

//f.c
void __f(void)
{
    printf("__f()\n");
}
void f() __attribute__((weak,alias("__f")));

//main.c
void __attribute__((weak)) f(void);
void f(void)
{
    printf("f()\n");
}

int main(void)
{
    f();
    return 0;
}

當我們在 main.c 中新定義了 f() 函數時,在 main 函數中調用 f() 函數,會直接調用 main.c 中新定義的函數;當 f() 函數沒有新定義時,就會調用 __f() 函數。

本教程根據 C語言嵌入式Linux高級編程視頻教程 第05期 改編,電子版書籍可加入QQ群:475504428 下載,更多嵌入式視頻教程,可關注:
微信公眾號:宅學部落(armlinuxfun)
51CTO學院-王利濤老師:http://edu.51cto.com/sd/d344f

另外有需要云服務器可以了解下創(chuàng)新互聯scvps.cn,海內外云服務器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務器、裸金屬服務器、高防服務器、香港服務器、美國服務器、虛擬主機、免備案服務器”等云主機租用服務以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應用場景需求。

文章名稱:嵌入式C語言自我修養(yǎng)09:鏈接過程中的強符號和弱符號-創(chuàng)新互聯
網頁網址:http://muchs.cn/article4/dcjdoe.html

成都網站建設公司_創(chuàng)新互聯,為您提供品牌網站制作、定制網站、App開發(fā)、小程序開發(fā)定制開發(fā)、虛擬主機

廣告

聲明:本網站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯

成都seo排名網站優(yōu)化