首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > JAVA > Java面试 >

求解统计一篇英文文档中包含几个不同的单词 每个单词出现的频率是什么?该怎么处理

2012-04-03 
求解统计一篇英文文档中包含几个不同的单词 每个单词出现的频率是什么?编程一段程序统计一篇英文文档中包

求解统计一篇英文文档中包含几个不同的单词 每个单词出现的频率是什么?
编程一段程序
统计一篇英文文档中包含几个不同的单词 每个单词出现的频率是什么?
谁能帮我看看

[解决办法]

Java code
    public static void main(String[] args) {        try {            BufferedReader br = new BufferedReader(new FileReader("d:/123.txt"));//举个例子,假设D盘有一个叫做123的txt格式的英文文件            StringBuffer sb = new StringBuffer();            Set<String> singleSet = new HashSet<String>();            String temp = br.readLine();            while (null != temp) {//这里循环以行为单位不断读数据,存储在一个StringBuffer里                sb.append(temp + " ");                temp = br.readLine();            }            String[] a = sb.toString().split("[^A-Za-z0-9]");//把StringBuffer分解成String数组,以非字母和数字的任何字符分割            for (String string : a) {//这里是个取巧的做法,要熟悉各种集合的区别,我用了HashSet,它是不允许加入重复数据的,我都加一遍,自然就剃重了。                singleSet.add(string);            }            for (String childString : singleSet) {//此处判断出现多少次                System.out.print(childString);                int count = 0;                for (String fatherString : a) {                    if (fatherString.equals(childString)) {                        count++;                    }                }                System.out.println("出现" + count + "次");            }        } catch (FileNotFoundException e) {            e.printStackTrace();        } catch (IOException e) {            e.printStackTrace();        }    } 

热点排行