求解统计一篇英文文档中包含几个不同的单词每个单词出现的频率是什么？该怎么处理

2012-04-03

求解统计一篇英文文档中包含几个不同的单词每个单词出现的频率是什么？编程一段程序统计一篇英文文档中包

求解统计一篇英文文档中包含几个不同的单词每个单词出现的频率是什么？
编程一段程序
统计一篇英文文档中包含几个不同的单词每个单词出现的频率是什么？
谁能帮我看看

[解决办法]

Java code

    public static void main(String[] args) {        try {            BufferedReader br = new BufferedReader(new FileReader("d:/123.txt"));//举个例子，假设D盘有一个叫做123的txt格式的英文文件            StringBuffer sb = new StringBuffer();            Set<String> singleSet = new HashSet<String>();            String temp = br.readLine();            while (null != temp) {//这里循环以行为单位不断读数据，存储在一个StringBuffer里                sb.append(temp + " ");                temp = br.readLine();            }            String[] a = sb.toString().split("[^A-Za-z0-9]");//把StringBuffer分解成String数组，以非字母和数字的任何字符分割            for (String string : a) {//这里是个取巧的做法，要熟悉各种集合的区别，我用了HashSet，它是不允许加入重复数据的，我都加一遍，自然就剃重了。                singleSet.add(string);            }            for (String childString : singleSet) {//此处判断出现多少次                System.out.print(childString);                int count = 0;                for (String fatherString : a) {                    if (fatherString.equals(childString)) {                        count++;                    }                }                System.out.println("出现" + count + "次");            }        } catch (FileNotFoundException e) {            e.printStackTrace();        } catch (IOException e) {            e.printStackTrace();        }    }

热点排行

Java面试

求解统计一篇英文文档中包含几个不同的单词 每个单词出现的频率是什么？该怎么处理

求解统计一篇英文文档中包含几个不同的单词每个单词出现的频率是什么？该怎么处理