首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 软件管理 > 软件架构设计 >

汉字的首字母有关问题

2012-10-29 
汉字的首字母问题目前网上公布的获取汉字首字母方法,一般情况下是没有问题的,但有些特殊的汉字无法获得首

汉字的首字母问题

目前网上公布的获取汉字首字母方法,一般情况下是没有问题的,但有些特殊的汉字无法获得首字母,比如说“戬”“浜”2字就很难取到首字母,不知道问题出在哪里。

我使用的类如下:

?

import java.io.UnsupportedEncodingException;/** *//** * 取得给定汉字串的首字母串,即声母串 * <p>Title: ChineseCharToEn</p> * <p>@author javer QQ:84831612</p> * * @version 1.0 * @date 2004-02-19 * 注:只支持GB2312字符集中的汉字 */public final class ChineseCharToEn {    private final static int[] li_SecPosValue =            {                    1601, 1637, 1833, 2078, 2274, 2302, 2433, 2594, 2787, 3106, 3212, 3472,                    3635, 3722, 3730, 3858, 4027, 4086, 4390, 4558, 4684, 4925, 5249, 5590            };    private final static String[] lc_FirstLetter =            {                    "a", "b", "c", "d", "e", "f", "g", "h", "j", "k", "l", "m", "n", "o", "p",                    "q", "r", "s", "t", "w", "x", "y", "z"            };/** */    /**     * 取得给定汉字串的首字母串,即声母串     *     * @param str 给定汉字串     * @return 声母串     */    public String getAllFirstLetter(String str) {        if (str == null || str.trim().length() == 0) {            return "";        }        String _str = "";        for (int i = 0; i < str.length(); i++) {            _str = _str + this.getFirstLetter(str.substring(i, i + 1));        }        return _str;    }/** */    /**     * 取得给定汉字的首字母,即声母     *     * @param chinese 给定的汉字     * @return 给定汉字的声母     */    public String getFirstLetter(String chinese) {        if (chinese == null || chinese.trim().length() == 0) {            return "";        }        chinese = this.conversionStr(chinese, "GBK", "ISO8859-1");        if (chinese.length() > 1) //判断是不是汉字        {            int li_SectorCode = (int) chinese.charAt(0); //汉字区码            int li_PositionCode = (int) chinese.charAt(1); //汉字位码            li_SectorCode = li_SectorCode - 160;            li_PositionCode = li_PositionCode - 160;            int li_SecPosCode = li_SectorCode * 100 + li_PositionCode; //汉字区位码            if (li_SecPosCode > 1600 && li_SecPosCode < 5590) {                for (int i = 0; i < 23; i++) {                    if (li_SecPosCode >= li_SecPosValue[i] &&                            li_SecPosCode < li_SecPosValue[i + 1]) {                        chinese = lc_FirstLetter[i];                        break;                    }                }            } else //非汉字字符,如图形符号或ASCII码            {                chinese = this.conversionStr(chinese, "ISO8859-1", "GBK");                chinese = chinese.substring(0, 1);            }        }        return chinese;    }/** */    /**     * 字符串编码转换     *     * @param str           要转换编码的字符串     * @param charsetName   原来的编码     * @param toCharsetName 转换后的编码     * @return 经过编码转换后的字符串     */    private String conversionStr(String str, String charsetName, String toCharsetName) {        try {            str = new String(str.getBytes(charsetName), toCharsetName);        }        catch (UnsupportedEncodingException ex) {            System.out.println("字符串编码转换异常:" + ex.getMessage());        }        return str;    }    public static void main(String[] args) {        ChineseCharToEn cte = new ChineseCharToEn();        System.out.println("'夜未眠'的首个拼音字母是:" + cte.getFirstLetter("夜未眠"));        System.out.println("'Javer夜未眠'的首个拼音字母是:" + cte.getFirstLetter("Javer夜未眠"));        System.out.println("'戬浜供销社'的全部字母的拼音字母是:" + cte.getAllFirstLetter("戬浜供销社"));    }}
? 1 楼 freespace 2009-06-11   问题已经解决,采用了http://sourceforge.net/projects/pinyin4j上面的项目,很好的处理了生僻汉字的首字母问题。getAllFirstLetter函数改为:

public String getAllFirstLetter(String str) {
        String convert = "";
        for (int j = 0; j < str.length(); j++) {
            char word = str.charAt(j);
            String[] pinyinArray = PinyinHelper.toHanyuPinyinStringArray(word);
            if (pinyinArray != null) {
                convert += pinyinArray[0].charAt(0);
            }else {
                convert += word;
            }
        }
        return convert;
    } 2 楼 chinahnzhou 2010-06-07   请问一下
String[] pinyinArray = PinyinHelper.toHanyuPinyinStringArray(word);
这个PingyinHelper能贴出来吗? 3 楼 lz12366 2010-06-07   2#给的地址下载不下来!!感觉lz的代码得好好研究下!! 4 楼 ddzero 2010-06-07   请把代码贴全了好吗 5 楼 freespace 2010-06-08   这是完整的一个类,怎么会不全呢。
后来加入的pinyin4j,需要在原来的类中导入需要的包。 6 楼 freespace 2010-06-08   pinyin4j还是可以下载的,没有被墙。 7 楼 ddzero 2010-06-10   sorry,没有看仔细了。我下了pyinyin4j,也进行测试了,真是不错,可以获取汉字的所有拼音,并且以处理一个字不到一毫秒的速度来说,应该是很快了。唯一遗憾的是不能根据词语辨别拼音(比如“暖和”是nuan3 huo5,而不是nuan3 he2),当然要做到这点确实很不容易。总之受教了,感谢分享。

热点排行