java获取txt文件中的部分内容
需要的功能是从标准文献中,分别获取标题,摘要,作者给出的关键词,以及正文并分别进行分词。这里主要想问一下,怎么能够从txt文档中获取那四部分的文本呢?求各位指教。 Java 文档
[解决办法]
要从文档里直接获取文本内容,恐怕不是件容易的事,这个恐怕要标记一下才行,否则JAVA不会认识这些文本内容的
[解决办法]
你那应该读的是xml而不是txt
要不就是txt全读了然后正则提取出有用的内容、
[解决办法]
大哥,标准文献格式是固定的。
没固定格式计算机怎么知道什么是什么