汉字的首字母问题
目前网上公布的获取汉字首字母方法,一般情况下是没有问题的,但有些特殊的汉字无法获得首字母,比如说“戬”“浜”2字就很难取到首字母,不知道问题出在哪里。
我使用的类如下:
?
import java.io.UnsupportedEncodingException;/** *//** * 取得给定汉字串的首字母串,即声母串 * <p>Title: ChineseCharToEn</p> * <p>@author javer QQ:84831612</p> * * @version 1.0 * @date 2004-02-19 * 注:只支持GB2312字符集中的汉字 */public final class ChineseCharToEn { private final static int[] li_SecPosValue = { 1601, 1637, 1833, 2078, 2274, 2302, 2433, 2594, 2787, 3106, 3212, 3472, 3635, 3722, 3730, 3858, 4027, 4086, 4390, 4558, 4684, 4925, 5249, 5590 }; private final static String[] lc_FirstLetter = { "a", "b", "c", "d", "e", "f", "g", "h", "j", "k", "l", "m", "n", "o", "p", "q", "r", "s", "t", "w", "x", "y", "z" };/** */ /** * 取得给定汉字串的首字母串,即声母串 * * @param str 给定汉字串 * @return 声母串 */ public String getAllFirstLetter(String str) { if (str == null || str.trim().length() == 0) { return ""; } String _str = ""; for (int i = 0; i < str.length(); i++) { _str = _str + this.getFirstLetter(str.substring(i, i + 1)); } return _str; }/** */ /** * 取得给定汉字的首字母,即声母 * * @param chinese 给定的汉字 * @return 给定汉字的声母 */ public String getFirstLetter(String chinese) { if (chinese == null || chinese.trim().length() == 0) { return ""; } chinese = this.conversionStr(chinese, "GBK", "ISO8859-1"); if (chinese.length() > 1) //判断是不是汉字 { int li_SectorCode = (int) chinese.charAt(0); //汉字区码 int li_PositionCode = (int) chinese.charAt(1); //汉字位码 li_SectorCode = li_SectorCode - 160; li_PositionCode = li_PositionCode - 160; int li_SecPosCode = li_SectorCode * 100 + li_PositionCode; //汉字区位码 if (li_SecPosCode > 1600 && li_SecPosCode < 5590) { for (int i = 0; i < 23; i++) { if (li_SecPosCode >= li_SecPosValue[i] && li_SecPosCode < li_SecPosValue[i + 1]) { chinese = lc_FirstLetter[i]; break; } } } else //非汉字字符,如图形符号或ASCII码 { chinese = this.conversionStr(chinese, "ISO8859-1", "GBK"); chinese = chinese.substring(0, 1); } } return chinese; }/** */ /** * 字符串编码转换 * * @param str 要转换编码的字符串 * @param charsetName 原来的编码 * @param toCharsetName 转换后的编码 * @return 经过编码转换后的字符串 */ private String conversionStr(String str, String charsetName, String toCharsetName) { try { str = new String(str.getBytes(charsetName), toCharsetName); } catch (UnsupportedEncodingException ex) { System.out.println("字符串编码转换异常:" + ex.getMessage()); } return str; } public static void main(String[] args) { ChineseCharToEn cte = new ChineseCharToEn(); System.out.println("'夜未眠'的首个拼音字母是:" + cte.getFirstLetter("夜未眠")); System.out.println("'Javer夜未眠'的首个拼音字母是:" + cte.getFirstLetter("Javer夜未眠")); System.out.println("'戬浜供销社'的全部字母的拼音字母是:" + cte.getAllFirstLetter("戬浜供销社")); }}? 1 楼 freespace 2009-06-11 问题已经解决,采用了http://sourceforge.net/projects/pinyin4j上面的项目,很好的处理了生僻汉字的首字母问题。getAllFirstLetter函数改为: