javalinux文件出現(xiàn)中文亂碼怎么辦

這篇文章給大家分享的是有關(guān)java linux文件出現(xiàn)中文亂碼怎么辦的內(nèi)容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。

創(chuàng)新互聯(lián)專注于納溪網(wǎng)站建設(shè)服務(wù)及定制,我們擁有豐富的企業(yè)做網(wǎng)站經(jīng)驗。 熱誠為您提供納溪營銷型網(wǎng)站建設(shè),納溪網(wǎng)站制作、納溪網(wǎng)頁設(shè)計、納溪網(wǎng)站官網(wǎng)定制、小程序制作服務(wù),打造納溪網(wǎng)絡(luò)公司原創(chuàng)品牌,更為您提供納溪網(wǎng)站排名全網(wǎng)營銷落地服務(wù)。

java linux文件中文亂碼的解決辦法:1、下載jdk1.8的sun源碼;2、將Font的創(chuàng)建從物理字體改為邏輯字體;3、重啟服務(wù)即可。

本文操作環(huán)境:linux5.9.8系統(tǒng),jdk1.8,Dell G3電腦。

Linux環(huán)境下Java中文亂碼解決方案

相信很多朋友遇到過Java的亂碼問題,最近我也在解決一個“使用文本生成圖片過程中中文以及特殊字符亂碼”的問題;花了我大量時間,Debug了sun.font、sun.awt下面的各種源碼,終于搞懂了其機制,解決了目前次問題;現(xiàn)在把問題解決過程給寫下來,做個記錄,以免以后再次遇到。

遇到的問題

下面是我想要執(zhí)行的代碼(經(jīng)過極度簡化,但是意思沒變):

public static void main(String[] args) throws IOException {
   File file = new File("test.png");
   Font font = new Font("宋體", Font.PLAIN, 10);
   BufferedImage bi = new BufferedImage(400, 200, BufferedImage.TYPE_INT_ARGB);
   Graphics2D g2 = (Graphics2D) bi.getGraphics();
   g2.setBackground(Color.WHITE);
   g2.clearRect(0, 0, 400, 200);
   g2.setFont(font);
   g2.setColor(Color.BLACK);
   g2.setRenderingHint(RenderingHints.KEY_TEXT_ANTIALIASING, RenderingHints.VALUE_TEXT_ANTIALIAS_ON);
   g2.drawString("為什么沒有(????)(????)這名字特殊不?@¥¥¥ 為什么沒有(????)(????)這名字特 ", 0, 10);
   g2.dispose();
   ImageIO.write(bi, PNG, file);
}

目標(biāo)當(dāng)然是想在打開test.png的時候看到如下場景:

java linux文件出現(xiàn)中文亂碼怎么辦

在本地調(diào)試沒問題之后,就放到了測試機(Linux)上面去執(zhí)行了,執(zhí)行結(jié)果簡直撲街:

java linux文件出現(xiàn)中文亂碼怎么辦

jdk1.8的sun源碼下載

奉行程序員一貫作風(fēng):既然有問題,那就Debug!
坑爹的是現(xiàn)在的源碼包已經(jīng)不包含sun包的代碼了!
幸好java官方確認(rèn)OpenJDK的代碼基本和JVM源碼一致,可以直接從OpenJDK8u進行下載:jdk8u

至于如何使用源碼debug,這個就不寫了··· 這都不會基本也就別看這文章了

定位問題

直接下載好源碼,遠(yuǎn)程斷點,服務(wù)器執(zhí)行,在debug中先發(fā)現(xiàn)了第一個產(chǎn)生本地和測試服務(wù)器不一致的代碼:
java linux文件出現(xiàn)中文亂碼怎么辦

原來JVM創(chuàng)建Font的時候會使用FontManagerFactory獲取FontManager,而不同的系統(tǒng)使用的FontManager是不同的!Mac用的是CFontManager,而Linux用的是X11FontManager!

那么這兩個FontManager的不同會導(dǎo)致什么不同呢?

CFontManager會創(chuàng)建CFont作為Font2D,這個CFont是JVM專門為mac創(chuàng)建的類,看類和方法的注釋可以知道在mac環(huán)境下有時候物理字體會被CFont包裝,而這是在native代碼中完成的:
java linux文件出現(xiàn)中文亂碼怎么辦

X11FontManager創(chuàng)建的Font2D是包含了邏輯字體和物理字體的集合。X11FontManager繼承了FcFontManager,F(xiàn)cFontManager繼承了SunFontManager;我們看一下X11FontManager的loadFonts()方法,直接使用了SunFontManager的loadFonts(),SunFontManager的loadFonts()方法加載了物理字體,SunFontManager實現(xiàn)了FontManager的preferLocaleFonts()方法,加載了邏輯字體:
java linux文件出現(xiàn)中文亂碼怎么辦

java linux文件出現(xiàn)中文亂碼怎么辦

java linux文件出現(xiàn)中文亂碼怎么辦

邏輯字體與物理字體

代碼debug到這邊基本已經(jīng)確認(rèn)了是不同環(huán)境的字體加載問題,那么在debug linux環(huán)境的時候發(fā)現(xiàn)的邏輯字體和物理字體是什么東西呢?

物理字體

物理字體是實際的字體庫,包含字形數(shù)據(jù)和表,這些數(shù)據(jù)和表使用字體技術(shù)(如 TrueType 或 PostScript Type 1)將字符序列映射到字形序列。Java Platform 的所有實現(xiàn)都支持 TrueType 字體;對其他字體技術(shù)的支持是與實現(xiàn)相關(guān)的。物理字體可以使用字體名稱,如 Helvetica、Palatino、HonMincho 或任意數(shù)量的其他字體名稱。通常,每種物理字體只支持有限的書寫系統(tǒng)集合,例如,只支持拉丁文字符,或者只支持日文和基本拉丁文??捎玫奈锢碜煮w集合隨配置的不同而有所不同。要求特定字體的應(yīng)用程序可以使用 createFont 方法來捆綁這些字體,并對其進行實例化。

邏輯字體

邏輯字體是由必須受所有 Java 運行時環(huán)境支持的 Java 平臺所定義的五種字體系列:Serif、SansSerif、Monospaced、Dialog 和 DialogInput。這些邏輯字體不是實際的字體庫。此外,由 Java 運行時環(huán)境將邏輯字體名稱映射到物理字體。映射關(guān)系與實現(xiàn)和通常語言環(huán)境相關(guān),因此它們提供的外觀和規(guī)格各不相同。通常,為了覆蓋龐大的字符范圍,每種邏輯字體名稱都映射到幾種物理字體。

問題解決

debug的源碼很多,但是此次問題的關(guān)鍵點就在這里了,其它debug內(nèi)容就不貼了。
既然已經(jīng)確認(rèn)了本地(mac環(huán)境)是native的代碼幫我們做了物理字體的封裝,轉(zhuǎn)換成了CFont進行渲染,而Linux環(huán)境的X11FontManager只是幫我們加載了物理字體和邏輯字體,但是卻需要我們自己進行選擇,那么解決問題的第一步就顯而易見了:將Font的創(chuàng)建從物理字體改為邏輯字體

1 //  Serif、SansSerif、Monospaced、Dialog 和 DialogInput 隨意選擇
2 Font font = new Font("Serif", Font.PLAIN, 10);

改完以后執(zhí)行代碼,仍然是亂碼!繼續(xù)Debug,發(fā)現(xiàn)是Linux上邏輯字體Serif映射的物理字體沒有中文字體和對應(yīng)的特殊符號字體,這就很簡單了,直接在Linux上安裝中文字體(simsun.ttf),再安裝特殊符號“????”可顯示的字體(mysi.ttf),將這兩個字體也放到了jdk的fonts目錄(JAVA_HOME/jre/lib/fonts)下。文章后面有Linux字體安裝方法。

完成上面的改動之后,重啟服務(wù),再次執(zhí)行成功顯示!熱烈慶祝~~~~

JVM邏輯字體映射配置

以上的改動已經(jīng)可以解決中文和特殊字符亂碼問題,但是我在Debug過程中發(fā)現(xiàn)在邏輯字體加載過程中,JVM會參考一個配置文件,代碼在sun.awt.FontConfiguration中,這個配置類完成了邏輯字體和物理字體的映射,也指導(dǎo)了SunFontManager創(chuàng)建邏輯字體,而這個FontConfiguration讀取的配置文件就是fontconfig.properties,這個配置文件目錄是JAVA_HOME/jre/lib

查閱了一下資料,JVM字體配置文件的加載順序如下:
JAVA_HOME/jre/lib/fontconfig.OS.Version.properties
JAVA_HOME/jre/lib/fontconfig.OS.Version.bfc
JAVA_HOME/jre/lib/fontconfig.OS.properties
JAVA_HOME/jre/lib/fontconfig.OS.bfc
JAVA_HOME/jre/lib/fontconfig.Version.properties
JAVA_HOME/jre/lib/fontconfig.Version.bfc
JAVA_HOME/jre/lib/fontconfig.properties
JAVA_HOME/jre/lib/fontconfig.bfc

OS是系統(tǒng),例如:Linux、CentOs、RedHat等;Version是版本號

在這個配置文件中可以修改邏輯字體與物理字體的對應(yīng)關(guān)系,也就是說可以手動的修改Serif、SansSerif、Monospaced、Dialog 和 DialogInput這五個邏輯字體在不同場景下所使用的真正物理字體。

舉個栗子,下面的配置將serif.plain邏輯字體的中文使用simsun.ttf,拉丁文使用java自帶字體:

# @(#)linux.fontconfig.SuSE.properties 1.2 03/10/17
#
# Copyright 2003 Sun Microsystems, Inc. All rights reserved.
#

# Version
version=1

# Component Font Mappings
serif.plain.chinese=-misc-simsun-medium-r-normal--*-%d-*-*-c-*-iso10646-1
serif.plain.latin-1=-b&h-lucidabright-medium-r-normal--*-%d-*-*-p-*-iso8859-1

# Search Sequences
sequence.allfonts=latin-1,chinese

# Exclusion Ranges

# Font File Names
filename.-misc-simsun-medium-r-normal--*-%d-*-*-c-*-iso10646-1=/usr/share/fonts/myfonts/simsun.ttf

Linux安裝字體

  • Linux字體目錄:/usr/share/fonts

  • 在fonts下面新建一個目錄,例如:mkdir myfonts

  • 將需要安裝的字體放到新建目錄下面,例如:cp ~/test/simsun.ttf /usr/share/fonts/myfonts

  • 進入到myfonts目錄:cd /usr/share/fonts/myfonts

  • 執(zhí)行如下命令:

    • mkfontscale

    • mkfontdir

    • fc-cache -fv

  • 查看是否已經(jīng)安裝對應(yīng)的字體:fc-list

  • fc-cache -fv 命令用來刷新linux的字體緩存,使其立刻生效

PS:以上所有操作基本都需要root權(quán)限

感謝各位的閱讀!關(guān)于“java linux文件出現(xiàn)中文亂碼怎么辦”這篇文章就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,讓大家可以學(xué)到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!

當(dāng)前標(biāo)題:javalinux文件出現(xiàn)中文亂碼怎么辦
瀏覽路徑:http://muchs.cn/article10/gheedo.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供商城網(wǎng)站虛擬主機、做網(wǎng)站外貿(mào)建站、App開發(fā)微信公眾號

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

網(wǎng)站托管運營