Java漢字轉(zhuǎn)拼音類庫Pinyin4j怎么用

小編給大家分享一下Java漢字轉(zhuǎn)拼音類庫Pinyin4j怎么用,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!

創(chuàng)新互聯(lián)建站是一家專業(yè)從事成都網(wǎng)站制作、成都網(wǎng)站設(shè)計、外貿(mào)營銷網(wǎng)站建設(shè)、網(wǎng)頁設(shè)計的品牌網(wǎng)絡(luò)公司。如今是成都地區(qū)具影響力的網(wǎng)站設(shè)計公司,作為專業(yè)的成都網(wǎng)站建設(shè)公司,創(chuàng)新互聯(lián)建站依托強大的技術(shù)實力、以及多年的網(wǎng)站運營經(jīng)驗,為您提供專業(yè)的成都網(wǎng)站建設(shè)、營銷型網(wǎng)站建設(shè)及網(wǎng)站設(shè)計開發(fā)服務(wù)!

漢字轉(zhuǎn)拼音類庫Pinyin4j一般用法

pinyin4j的使用很方便,一般轉(zhuǎn)換只需要使用PinyinHelper類的靜態(tài)工具方法即可:

String[] pinyin = PinyinHelper.toHanyuPinyinStringArray(‘劉');
//該類還有其他的拼音轉(zhuǎn)換形式,但是基本上用不到,就不介紹了

返回的數(shù)組即是該字符的拼音,如上例就是pinyin[0]=liu2,后面的數(shù)字代表聲調(diào),聲調(diào)為5表示輕讀,無聲調(diào)。之所謂返回數(shù)組,是因為被判定的漢字有可能有多個讀音。如果輸入的參數(shù)不是漢字,則返回null。

拼音格式化

如果對于拼音轉(zhuǎn)換后的結(jié)果有一些特定的格式要求目前pinyin4j支持:

聲調(diào)格式化。例如:“劉”字的格式化后為“l(fā)iu2”或“l(fā)iu”或“l(fā)iú”

對特殊拼音ü的的顯示格式。例如“u:”或“v”或“ü”

大小寫的轉(zhuǎn)換。例如:“l(fā)iu2”或“LIU2”

以上這些格式可以混合使用,下面就來介紹具體的使用方法,首先需要創(chuàng)建格式化對象HanyuPinyinOutputFormat,例如:

HanyuPinyinOutputFormat outputFormat = new HanyuPinyinOutputFormat();

然后分別調(diào)用outputFormat的set方法設(shè)置上述一些格式要求:

設(shè)置聲調(diào)格式:

outputFormat.setToneType(HanyuPinyinToneType);

方法參數(shù)HanyuPinyinToneType有以下常量對象:

HanyuPinyinToneType.WITH_TONE_NUMBER 用數(shù)字表示聲調(diào),例如:liu2

HanyuPinyinToneType.WITHOUT_TONE 無聲調(diào)表示,例如:liu

HanyuPinyinToneType.WITH_TONE_MARK 用聲調(diào)符號表示,例如:liú

設(shè)置特殊拼音ü的顯示格式:

outputFormat.setVCharType(HanyuPinyinVCharType);

方法參數(shù)HanyuPinyinVCharType有以下常量對象:

HanyuPinyinVCharType.WITH_U_AND_COLON 以U和一個冒號表示該拼音,例如:lu:

HanyuPinyinVCharType.WITH_V 以V表示該字符,例如:lv

HanyuPinyinVCharType.WITH_U_UNICODE 以ü表示

設(shè)置大小寫格式

outputFormat.setCaseType(HanyuPinyinCaseType);

HanyuPinyinCaseType.LOWERCASE 轉(zhuǎn)換后以全小寫方式輸出

HanyuPinyinCaseType.UPPERCASE 轉(zhuǎn)換后以全大寫方式輸出

設(shè)置好格式對象后還是利用上述的工具類方法進行拼音轉(zhuǎn)換,只不過需要將格式化對象當成方法參數(shù)傳入轉(zhuǎn)換方法,告知要轉(zhuǎn)換的格式要求:

String[] pinyin = PinyinHelper.toHanyuPinyinStringArray(‘劉', outputFormat);

但該方法會有異常拋出,注意處理。

示例

import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;
public class Test {
  public static void main(String[] args) {
import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;
public class Test {
  public static void main(String[] args) {
    HanyuPinyinOutputFormat outputFormat = new HanyuPinyinOutputFormat();
    outputFormat.setToneType(HanyuPinyinToneType.WITH_TONE_MARK);
    outputFormat.setVCharType(HanyuPinyinVCharType.WITH_U_UNICODE);
    outputFormat.setCaseType(HanyuPinyinCaseType.UPPERCASE);
    try {
      System.out.println(concatPinyinStringArray(PinyinHelper.toHanyuPinyinStringArray('劉',outputFormat)));
    } catch (BadHanyuPinyinOutputFormatCombination e) {
      // TODO Auto-generated catch block
      e.printStackTrace();
    }
  }
  
  private static String concatPinyinStringArray(String[] pinyinArray)
  {
    StringBuffer pinyinStrBuf = new StringBuffer();
    if ((null != pinyinArray) && (pinyinArray.length > 0))
    {
      for (int i = 0; i < pinyinArray.length; i++)
      {
        pinyinStrBuf.append(pinyinArray[i]);
        pinyinStrBuf.append(System.getProperty("line.separator"));
      }
    }
    String outputString = pinyinStrBuf.toString();
    return outputString;
  }
}

輸出結(jié)果為:LIú

其他

PinyinHelper還有其他的靜態(tài)方法,但示例和講解中使用的方法是常見的拼音格式,因此其他靜態(tài)方法我沒有調(diào)研其含義。

貌似支持生僻字,我試過很怪異的字,都可以將其讀音拼寫出來,因此這個工具包還是很強的。

拼音工具

package cn.itcast.bos.utils;

import java.util.Arrays;

import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;

public class PinYin4jUtils {
  /**
   * 將字符串轉(zhuǎn)換成拼音數(shù)組
   * 
   * @param src
   * @return
   */
  public static String[] stringToPinyin(String src) {
    return stringToPinyin(src, false, null);
  }

  /**
   * 將字符串轉(zhuǎn)換成拼音數(shù)組
   * 
   * @param src
   * @return
   */
  public static String[] stringToPinyin(String src, String separator) {

    return stringToPinyin(src, true, separator);
  }

  /**
   * 將字符串轉(zhuǎn)換成拼音數(shù)組
   * 
   * @param src
   * @param isPolyphone
   *      是否查出多音字的所有拼音
   * @param separator
   *      多音字拼音之間的分隔符
   * @return
   */
  public static String[] stringToPinyin(String src, boolean isPolyphone,
      String separator) {
    // 判斷字符串是否為空
    if ("".equals(src) || null == src) {
      return null;
    }
    char[] srcChar = src.toCharArray();
    int srcCount = srcChar.length;
    String[] srcStr = new String[srcCount];

    for (int i = 0; i < srcCount; i++) {
      srcStr[i] = charToPinyin(srcChar[i], isPolyphone, separator);
    }
    return srcStr;
  }

  /**
   * 將單個字符轉(zhuǎn)換成拼音
   * 
   * @param src
   * @return
   */
  public static String charToPinyin(char src, boolean isPolyphone,
      String separator) {
    // 創(chuàng)建漢語拼音處理類
    HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
    // 輸出設(shè)置,大小寫,音標方式
    defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
    defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);

    StringBuffer tempPinying = new StringBuffer();

    // 如果是中文
    if (src > 128) {
      try {
        // 轉(zhuǎn)換得出結(jié)果
        String[] strs = PinyinHelper.toHanyuPinyinStringArray(src,
            defaultFormat);

        // 是否查出多音字,默認是查出多音字的第一個字符
        if (isPolyphone && null != separator) {
          for (int i = 0; i < strs.length; i++) {
            tempPinying.append(strs[i]);
            if (strs.length != (i + 1)) {
              // 多音字之間用特殊符號間隔起來
              tempPinying.append(separator);
            }
          }
        } else {
          tempPinying.append(strs[0]);
        }

      } catch (BadHanyuPinyinOutputFormatCombination e) {
        e.printStackTrace();
      }
    } else {
      tempPinying.append(src);
    }

    return tempPinying.toString();

  }

  public static String hanziToPinyin(String hanzi) {
    return hanziToPinyin(hanzi, " ");
  }

  /**
   * 將漢字轉(zhuǎn)換成拼音
   * 
   * @param hanzi
   * @param separator
   * @return
   */
  public static String hanziToPinyin(String hanzi, String separator) {

    // 創(chuàng)建漢語拼音處理類
    HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
    // 輸出設(shè)置,大小寫,音標方式
    defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
    defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);

    String pinyingStr = "";
    try {
      pinyingStr = PinyinHelper.toHanyuPinyinString(hanzi, defaultFormat,
          separator);
    } catch (BadHanyuPinyinOutputFormatCombination e) {
      // TODO Auto-generated catch block
      e.printStackTrace();
    }
    return pinyingStr;
  }

  /**
   * 將字符串數(shù)組轉(zhuǎn)換成字符串
   * 
   * @param str
   * @param separator
   *      各個字符串之間的分隔符
   * @return
   */
  public static String stringArrayToString(String[] str, String separator) {
    StringBuffer sb = new StringBuffer();
    for (int i = 0; i < str.length; i++) {
      sb.append(str[i]);
      if (str.length != (i + 1)) {
        sb.append(separator);
      }
    }
    return sb.toString();
  }

  /**
   * 簡單的將各個字符數(shù)組之間連接起來
   * 
   * @param str
   * @return
   */
  public static String stringArrayToString(String[] str) {
    return stringArrayToString(str, "");
  }

  /**
   * 將字符數(shù)組轉(zhuǎn)換成字符串
   * 
   * @param str
   * @param separator
   *      各個字符串之間的分隔符
   * @return
   */
  public static String charArrayToString(char[] ch, String separator) {
    StringBuffer sb = new StringBuffer();
    for (int i = 0; i < ch.length; i++) {
      sb.append(ch[i]);
      if (ch.length != (i + 1)) {
        sb.append(separator);
      }
    }
    return sb.toString();
  }

  /**
   * 將字符數(shù)組轉(zhuǎn)換成字符串
   * 
   * @param str
   * @return
   */
  public static String charArrayToString(char[] ch) {
    return charArrayToString(ch, " ");
  }

  /**
   * 取漢字的首字母
   * 
   * @param src
   * @param isCapital
   *      是否是大寫
   * @return
   */
  public static char[] getHeadByChar(char src, boolean isCapital) {
    // 如果不是漢字直接返回
    if (src <= 128) {
      return new char[] { src };
    }
    // 獲取所有的拼音
    String[] pinyingStr = PinyinHelper.toHanyuPinyinStringArray(src);

    // 創(chuàng)建返回對象
    int polyphoneSize = pinyingStr.length;
    char[] headChars = new char[polyphoneSize];
    int i = 0;
    // 截取首字符
    for (String s : pinyingStr) {
      char headChar = s.charAt(0);
      // 首字母是否大寫,默認是小寫
      if (isCapital) {
        headChars[i] = Character.toUpperCase(headChar);
      } else {
        headChars[i] = headChar;
      }
      i++;
    }

    return headChars;
  }

  /**
   * 取漢字的首字母(默認是大寫)
   * 
   * @param src
   * @return
   */
  public static char[] getHeadByChar(char src) {
    return getHeadByChar(src, true);
  }

  /**
   * 查找字符串首字母
   * 
   * @param src
   * @return
   */
  public static String[] getHeadByString(String src) {
    return getHeadByString(src, true);
  }

  /**
   * 查找字符串首字母
   * 
   * @param src
   * @param isCapital
   *      是否大寫
   * @return
   */
  public static String[] getHeadByString(String src, boolean isCapital) {
    return getHeadByString(src, isCapital, null);
  }

  /**
   * 查找字符串首字母
   * 
   * @param src
   * @param isCapital
   *      是否大寫
   * @param separator
   *      分隔符
   * @return
   */
  public static String[] getHeadByString(String src, boolean isCapital,
      String separator) {
    char[] chars = src.toCharArray();
    String[] headString = new String[chars.length];
    int i = 0;
    for (char ch : chars) {

      char[] chs = getHeadByChar(ch, isCapital);
      StringBuffer sb = new StringBuffer();
      if (null != separator) {
        int j = 1;

        for (char ch2 : chs) {
          sb.append(ch2);
          if (j != chs.length) {
            sb.append(separator);
          }
          j++;
        }
      } else {
        sb.append(chs[0]);
      }
      headString[i] = sb.toString();
      i++;
    }
    return headString;
  }
  
  public static void main(String[] args) {
    // pin4j 簡碼 和 城市編碼 
    String s1 = "中華人民共和國"; 
    String[] headArray = getHeadByString(s1); // 獲得每個漢字拼音首字母
    System.out.println(Arrays.toString(headArray));
    
    String s2 ="長城" ; 
    System.out.println(Arrays.toString(stringToPinyin(s2,true,",")));
    
    String s3 ="長";
    System.out.println(Arrays.toString(stringToPinyin(s3,true,",")));
  }
}

以上是“Java漢字轉(zhuǎn)拼音類庫Pinyin4j怎么用”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對大家有所幫助,如果還想學(xué)習(xí)更多知識,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道!

分享文章:Java漢字轉(zhuǎn)拼音類庫Pinyin4j怎么用
URL分享:http://www.muchs.cn/article20/pdhhjo.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供電子商務(wù)、網(wǎng)頁設(shè)計公司外貿(mào)建站、品牌網(wǎng)站設(shè)計手機網(wǎng)站建設(shè)、做網(wǎng)站

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

成都定制網(wǎng)站網(wǎng)頁設(shè)計