bin/nutch solrindex报java.io.IOException: Job failed! 异常
bin/nutch solrindex报java.io.IOException: Job failed! 错误一段时间没有碰nutch和solr后,今天重新用nut
bin/nutch solrindex报java.io.IOException: Job failed! 错误
一段时间没有碰nutch和solr后,今天重新用nutch抓取了一些数据后,想用solr建立索引,我先java -jar start.jar开启了solr,可以访问http://localhost:8983/solr/。然后我先删除了solr的data文件夹中的所有文件,再对nutch爬取的信息做solrindex时,总是报错:
SolrIndexer: starting at 2012-06-15 21:10:02
Adding 372 documents
java.io.IOException: Job failed!
然后我查了nutch的logs/hadoop.log,看到:org.apache.solr.common.SolrException: no segments* file found in org.apache.lucene.store.NIOFSDirectory@/home/hadoop/program/apache-solr-3.5.0/example/solr/data/index lockFactory=org.apache.lucene.store.NativeFSLockFactory@20c906: files: [write.lock] ?org.apache.lucene.index.IndexNotFoundException: no segments* file found in org.apache.lucene.store.NIOFSDirectory@/home/hadoop/program/apache-solr-3.5.0/example/solr/data/index lockFactory=org.apache.lucene.store.NativeFSLockFactory@20c906: files: [write.lock]
是说没有找到data/index,于是按照如下步骤重新来一遍:1、关闭solr2、删除solr的data下面的所有文件和文件夹3、启动solr,这时会自动在solr的data下面建立index和spellchecker文件夹
再执行solrindex就可以了!