File Doc Category Size Date Package
TestIndexWriter.java API Doc Apache Lucene 2.1.0 25820 Wed Feb 14 10:46:36 GMT 2007 org.apache.lucene.index

TestIndexWriter

java.lang.Object
- junit.framework.Assert
  - junit.framework.TestCase

public class TestIndexWriter extends TestCase

author: goller
version: $Id: TestIndexWriter.java 499089 2007-01-23 17:33:11Z mikemccand $

Fields Summary
Constructors Summary
Methods Summary
private void addDoc(org.apache.lucene.index.IndexWriter writer)
Document doc = new Document(); doc.add(new Field("content", "aaa", Field.Store.NO, Field.Index.TOKENIZED)); writer.addDocument(doc);
private void addDocWithIndex(org.apache.lucene.index.IndexWriter writer, int index)
Document doc = new Document(); doc.add(new Field("content", "aaa " + index, Field.Store.YES, Field.Index.TOKENIZED)); doc.add(new Field("id", "" + index, Field.Store.YES, Field.Index.TOKENIZED)); writer.addDocument(doc);
private java.lang.String arrayToString(java.lang.String[] l)
String s = ""; for(int i=0;i<l.length;i++) { if (i > 0) { s += "\n "; } s += l[i]; } return s;
private void rmDir(java.io.File dir)
File[] files = dir.listFiles(); if (files != null) { for (int i = 0; i < files.length; i++) { files[i].delete(); } } dir.delete();
public void testAddIndexOnDiskFull()
int START_COUNT = 57; int NUM_DIR = 50; int END_COUNT = START_COUNT + NUM_DIR*25; boolean debug = false; // Build up a bunch of dirs that have indexes which we // will then merge together by calling addIndexes(*): Directory[] dirs = new Directory[NUM_DIR]; long inputDiskUsage = 0; for(int i=0;i<NUM_DIR;i++) { dirs[i] = new RAMDirectory(); IndexWriter writer = new IndexWriter(dirs[i], new WhitespaceAnalyzer(), true); for(int j=0;j<25;j++) { addDocWithIndex(writer, 25*i+j); } writer.close(); String[] files = dirs[i].list(); for(int j=0;j<files.length;j++) { inputDiskUsage += dirs[i].fileLength(files[j]); } } // Now, build a starting index that has START_COUNT docs. We // will then try to addIndexes into a copy of this: RAMDirectory startDir = new RAMDirectory(); IndexWriter writer = new IndexWriter(startDir, new WhitespaceAnalyzer(), true); for(int j=0;j<START_COUNT;j++) { addDocWithIndex(writer, j); } writer.close(); // Make sure starting index seems to be working properly: Term searchTerm = new Term("content", "aaa"); IndexReader reader = IndexReader.open(startDir); assertEquals("first docFreq", 57, reader.docFreq(searchTerm)); IndexSearcher searcher = new IndexSearcher(reader); Hits hits = searcher.search(new TermQuery(searchTerm)); assertEquals("first number of hits", 57, hits.length()); searcher.close(); reader.close(); // Iterate with larger and larger amounts of free // disk space. With little free disk space, // addIndexes will certainly run out of space & // fail. Verify that when this happens, index is // not corrupt and index in fact has added no // documents. Then, we increase disk space by 1000 // bytes each iteration. At some point there is // enough free disk space and addIndexes should // succeed and index should show all documents were // added. // String[] files = startDir.list(); long diskUsage = startDir.sizeInBytes(); long startDiskUsage = 0; String[] files = startDir.list(); for(int i=0;i<files.length;i++) { startDiskUsage += startDir.fileLength(files[i]); } for(int method=0;method<3;method++) { // Start with 100 bytes more than we are currently using: long diskFree = diskUsage+100; boolean success = false; boolean done = false; String methodName; if (0 == method) { methodName = "addIndexes(Directory[])"; } else if (1 == method) { methodName = "addIndexes(IndexReader[])"; } else { methodName = "addIndexesNoOptimize(Directory[])"; } String testName = "disk full test for method " + methodName + " with disk full at " + diskFree + " bytes"; int cycleCount = 0; while(!done) { cycleCount++; // Make a new dir that will enforce disk usage: MockRAMDirectory dir = new MockRAMDirectory(startDir); writer = new IndexWriter(dir, new WhitespaceAnalyzer(), false); IOException err = null; for(int x=0;x<2;x++) { // Two loops: first time, limit disk space & // throw random IOExceptions; second time, no // disk space limit: double rate = 0.05; double diskRatio = ((double) diskFree)/diskUsage; long thisDiskFree; if (0 == x) { thisDiskFree = diskFree; if (diskRatio >= 2.0) { rate /= 2; } if (diskRatio >= 4.0) { rate /= 2; } if (diskRatio >= 6.0) { rate = 0.0; } if (debug) { System.out.println("\ncycle: " + methodName + ": " + diskFree + " bytes"); } } else { thisDiskFree = 0; rate = 0.0; if (debug) { System.out.println("\ncycle: " + methodName + ", same writer: unlimited disk space"); } } dir.setMaxSizeInBytes(thisDiskFree); dir.setRandomIOExceptionRate(rate, diskFree); try { if (0 == method) { writer.addIndexes(dirs); } else if (1 == method) { IndexReader readers[] = new IndexReader[dirs.length]; for(int i=0;i<dirs.length;i++) { readers[i] = IndexReader.open(dirs[i]); } try { writer.addIndexes(readers); } finally { for(int i=0;i<dirs.length;i++) { readers[i].close(); } } } else { writer.addIndexesNoOptimize(dirs); } success = true; if (debug) { System.out.println(" success!"); } if (0 == x) { done = true; } } catch (IOException e) { success = false; err = e; if (debug) { System.out.println(" hit IOException: " + e); } if (1 == x) { e.printStackTrace(); fail(methodName + " hit IOException after disk space was freed up"); } } // Whether we succeeded or failed, check that all // un-referenced files were in fact deleted (ie, // we did not create garbage). Just create a // new IndexFileDeleter, have it delete // unreferenced files, then verify that in fact // no files were deleted: String[] startFiles = dir.list(); SegmentInfos infos = new SegmentInfos(); infos.read(dir); IndexFileDeleter d = new IndexFileDeleter(infos, dir); d.findDeletableFiles(); d.deleteFiles(); String[] endFiles = dir.list(); Arrays.sort(startFiles); Arrays.sort(endFiles); /* for(int i=0;i<startFiles.length;i++) { System.out.println(" " + i + ": " + startFiles[i]); } */ if (!Arrays.equals(startFiles, endFiles)) { String successStr; if (success) { successStr = "success"; } else { successStr = "IOException"; err.printStackTrace(); } fail(methodName + " failed to delete unreferenced files after " + successStr + " (" + diskFree + " bytes): before delete:\n " + arrayToString(startFiles) + "\n after delete:\n " + arrayToString(endFiles)); } if (debug) { System.out.println(" now test readers"); } // Finally, verify index is not corrupt, and, if // we succeeded, we see all docs added, and if we // failed, we see either all docs or no docs added // (transactional semantics): try { reader = IndexReader.open(dir); } catch (IOException e) { e.printStackTrace(); fail(testName + ": exception when creating IndexReader: " + e); } int result = reader.docFreq(searchTerm); if (success) { if (result != END_COUNT) { fail(testName + ": method did not throw exception but docFreq('aaa') is " + result + " instead of expected " + END_COUNT); } } else { // On hitting exception we still may have added // all docs: if (result != START_COUNT && result != END_COUNT) { err.printStackTrace(); fail(testName + ": method did throw exception but docFreq('aaa') is " + result + " instead of expected " + START_COUNT + " or " + END_COUNT); } } searcher = new IndexSearcher(reader); try { hits = searcher.search(new TermQuery(searchTerm)); } catch (IOException e) { e.printStackTrace(); fail(testName + ": exception when searching: " + e); } int result2 = hits.length(); if (success) { if (result2 != result) { fail(testName + ": method did not throw exception but hits.length for search on term 'aaa' is " + result2 + " instead of expected " + result); } } else { // On hitting exception we still may have added // all docs: if (result2 != result) { err.printStackTrace(); fail(testName + ": method did throw exception but hits.length for search on term 'aaa' is " + result2 + " instead of expected " + result); } } searcher.close(); reader.close(); if (debug) { System.out.println(" count is " + result); } if (result == END_COUNT) { break; } } // Javadocs state that temp free Directory space // required is at most 2X total input size of // indices so let's make sure: assertTrue("max free Directory space required exceeded 1X the total input index sizes during " + methodName + ": max temp usage = " + (dir.getMaxUsedSizeInBytes()-startDiskUsage) + " bytes; " + "starting disk usage = " + startDiskUsage + " bytes; " + "input index disk usage = " + inputDiskUsage + " bytes", (dir.getMaxUsedSizeInBytes()-startDiskUsage) < 2*(startDiskUsage + inputDiskUsage)); writer.close(); dir.close(); // Try again with 1000 more bytes of free space: diskFree += 1000; } } startDir.close();
public void testCreateWithReader()
String tempDir = System.getProperty("java.io.tmpdir"); if (tempDir == null) throw new IOException("java.io.tmpdir undefined, cannot run test"); File indexDir = new File(tempDir, "lucenetestindexwriter"); try { Directory dir = FSDirectory.getDirectory(indexDir); // add one document & close writer IndexWriter writer = new IndexWriter(dir, new WhitespaceAnalyzer(), true); addDoc(writer); writer.close(); // now open reader: IndexReader reader = IndexReader.open(dir); assertEquals("should be one document", reader.numDocs(), 1); // now open index for create: writer = new IndexWriter(dir, new WhitespaceAnalyzer(), true); assertEquals("should be zero documents", writer.docCount(), 0); addDoc(writer); writer.close(); assertEquals("should be one document", reader.numDocs(), 1); IndexReader reader2 = IndexReader.open(dir); assertEquals("should be one document", reader2.numDocs(), 1); reader.close(); reader2.close(); } finally { rmDir(indexDir); }
public void testCreateWithReader2()
String tempDir = System.getProperty("java.io.tmpdir"); if (tempDir == null) throw new IOException("java.io.tmpdir undefined, cannot run test"); File indexDir = new File(tempDir, "lucenetestindexwriter"); try { // add one document & close writer IndexWriter writer = new IndexWriter(indexDir, new WhitespaceAnalyzer(), true); addDoc(writer); writer.close(); // now open reader: IndexReader reader = IndexReader.open(indexDir); assertEquals("should be one document", reader.numDocs(), 1); // now open index for create: writer = new IndexWriter(indexDir, new WhitespaceAnalyzer(), true); assertEquals("should be zero documents", writer.docCount(), 0); addDoc(writer); writer.close(); assertEquals("should be one document", reader.numDocs(), 1); IndexReader reader2 = IndexReader.open(indexDir); assertEquals("should be one document", reader2.numDocs(), 1); reader.close(); reader2.close(); } finally { rmDir(indexDir); }
public void testCreateWithReader3()
String tempDir = System.getProperty("tempDir"); if (tempDir == null) throw new IOException("java.io.tmpdir undefined, cannot run test"); String dirName = tempDir + "/lucenetestindexwriter"; try { // add one document & close writer IndexWriter writer = new IndexWriter(dirName, new WhitespaceAnalyzer(), true); addDoc(writer); writer.close(); // now open reader: IndexReader reader = IndexReader.open(dirName); assertEquals("should be one document", reader.numDocs(), 1); // now open index for create: writer = new IndexWriter(dirName, new WhitespaceAnalyzer(), true); assertEquals("should be zero documents", writer.docCount(), 0); addDoc(writer); writer.close(); assertEquals("should be one document", reader.numDocs(), 1); IndexReader reader2 = IndexReader.open(dirName); assertEquals("should be one document", reader2.numDocs(), 1); reader.close(); reader2.close(); } finally { rmDir(new File(dirName)); }
public void testDocCount()
Directory dir = new RAMDirectory(); IndexWriter writer = null; IndexReader reader = null; int i; IndexWriter.setDefaultWriteLockTimeout(2000); assertEquals(2000, IndexWriter.getDefaultWriteLockTimeout()); writer = new IndexWriter(dir, new WhitespaceAnalyzer()); IndexWriter.setDefaultWriteLockTimeout(1000); // add 100 documents for (i = 0; i < 100; i++) { addDoc(writer); } assertEquals(100, writer.docCount()); writer.close(); // delete 40 documents reader = IndexReader.open(dir); for (i = 0; i < 40; i++) { reader.deleteDocument(i); } reader.close(); // test doc count before segments are merged/index is optimized writer = new IndexWriter(dir, new WhitespaceAnalyzer()); assertEquals(100, writer.docCount()); writer.close(); reader = IndexReader.open(dir); assertEquals(100, reader.maxDoc()); assertEquals(60, reader.numDocs()); reader.close(); // optimize the index and check that the new doc count is correct writer = new IndexWriter(dir, new WhitespaceAnalyzer()); writer.optimize(); assertEquals(60, writer.docCount()); writer.close(); // check that the index reader gives the same numbers. reader = IndexReader.open(dir); assertEquals(60, reader.maxDoc()); assertEquals(60, reader.numDocs()); reader.close(); // make sure opening a new index for create over // this existing one works correctly: writer = new IndexWriter(dir, new WhitespaceAnalyzer(), true); assertEquals(0, writer.docCount()); writer.close();
public void testNullLockFactory()
final class MyRAMDirectory extends RAMDirectory { private LockFactory myLockFactory; MyRAMDirectory() { lockFactory = null; myLockFactory = new SingleInstanceLockFactory(); } public Lock makeLock(String name) { return myLockFactory.makeLock(name); } } Directory dir = new MyRAMDirectory(); IndexWriter writer = new IndexWriter(dir, new WhitespaceAnalyzer(), true); for (int i = 0; i < 100; i++) { addDoc(writer); } writer.close(); IndexReader reader = IndexReader.open(dir); Term searchTerm = new Term("content", "aaa"); IndexSearcher searcher = new IndexSearcher(dir); Hits hits = searcher.search(new TermQuery(searchTerm)); assertEquals("did not get right number of hits", 100, hits.length()); writer.close(); writer = new IndexWriter(dir, new WhitespaceAnalyzer(), true); writer.close(); dir.close();
public void testOptimizeTempSpaceUsage()
Make sure optimize doesn't use any more than 1X starting index size as its temporary free space required.
MockRAMDirectory dir = new MockRAMDirectory(); IndexWriter writer = new IndexWriter(dir, new WhitespaceAnalyzer(), true); for(int j=0;j<500;j++) { addDocWithIndex(writer, j); } writer.close(); long startDiskUsage = 0; String[] files = dir.list(); for(int i=0;i<files.length;i++) { startDiskUsage += dir.fileLength(files[i]); } dir.resetMaxUsedSizeInBytes(); writer = new IndexWriter(dir, new WhitespaceAnalyzer(), false); writer.optimize(); writer.close(); long maxDiskUsage = dir.getMaxUsedSizeInBytes(); assertTrue("optimized used too much temporary space: starting usage was " + startDiskUsage + " bytes; max temp usage was " + maxDiskUsage + " but should have been " + (2*startDiskUsage) + " (= 2X starting usage)", maxDiskUsage <= 2*startDiskUsage);
public void testSimulatedCorruptIndex1()
Directory dir = new RAMDirectory(); IndexWriter writer = null; writer = new IndexWriter(dir, new WhitespaceAnalyzer(), true); // add 100 documents for (int i = 0; i < 100; i++) { addDoc(writer); } // close writer.close(); long gen = SegmentInfos.getCurrentSegmentGeneration(dir); assertTrue("segment generation should be > 1 but got " + gen, gen > 1); String fileNameIn = SegmentInfos.getCurrentSegmentFileName(dir); String fileNameOut = IndexFileNames.fileNameFromGeneration(IndexFileNames.SEGMENTS, "", 1+gen); IndexInput in = dir.openInput(fileNameIn); IndexOutput out = dir.createOutput(fileNameOut); long length = in.length(); for(int i=0;i<length-1;i++) { out.writeByte(in.readByte()); } in.close(); out.close(); dir.deleteFile(fileNameIn); IndexReader reader = null; try { reader = IndexReader.open(dir); fail("reader did not hit IOException on opening a corrupt index"); } catch (Exception e) { } if (reader != null) { reader.close(); }
public void testSimulatedCorruptIndex2()
Directory dir = new RAMDirectory(); IndexWriter writer = null; writer = new IndexWriter(dir, new WhitespaceAnalyzer(), true); // add 100 documents for (int i = 0; i < 100; i++) { addDoc(writer); } // close writer.close(); long gen = SegmentInfos.getCurrentSegmentGeneration(dir); assertTrue("segment generation should be > 1 but got " + gen, gen > 1); String[] files = dir.list(); for(int i=0;i<files.length;i++) { if (files[i].endsWith(".cfs")) { dir.deleteFile(files[i]); break; } } IndexReader reader = null; try { reader = IndexReader.open(dir); fail("reader did not hit IOException on opening a corrupt index"); } catch (Exception e) { } if (reader != null) { reader.close(); }
public void testSimulatedCrashedWriter()
Directory dir = new RAMDirectory(); IndexWriter writer = null; writer = new IndexWriter(dir, new WhitespaceAnalyzer(), true); // add 100 documents for (int i = 0; i < 100; i++) { addDoc(writer); } // close writer.close(); long gen = SegmentInfos.getCurrentSegmentGeneration(dir); assertTrue("segment generation should be > 1 but got " + gen, gen > 1); // Make the next segments file, with last byte // missing, to simulate a writer that crashed while // writing segments file: String fileNameIn = SegmentInfos.getCurrentSegmentFileName(dir); String fileNameOut = IndexFileNames.fileNameFromGeneration(IndexFileNames.SEGMENTS, "", 1+gen); IndexInput in = dir.openInput(fileNameIn); IndexOutput out = dir.createOutput(fileNameOut); long length = in.length(); for(int i=0;i<length-1;i++) { out.writeByte(in.readByte()); } in.close(); out.close(); IndexReader reader = null; try { reader = IndexReader.open(dir); } catch (Exception e) { fail("reader failed to open on a crashed index"); } reader.close(); try { writer = new IndexWriter(dir, new WhitespaceAnalyzer(), true); } catch (Exception e) { fail("writer failed to open on a crashed index"); } // add 100 documents for (int i = 0; i < 100; i++) { addDoc(writer); } // close writer.close();