PubMan Indexing Problems

=Beschreibung= item_container_admin wird mit einer write.lock-Datei permanent geblockt

=Fehlerhistorie=
 * 16.01.13
 * 14:59 Uhr
 * 15:57 Uhr
 * 17.01.13
 * 11:11 Uhr
 * 18.01.13
 * 12:23 Uhr
 * 22.01.13
 * 15:18 Uhr
 * 16:14 Uhr
 * 23.01.13
 * 13:19 Uhr
 * 17:06 Uhr
 * 24.01.13
 * 17:06 Uhr
 * 28.01.13
 * 15:46 Uhr
 * 29.02.13
 * 11:25 Uhr
 * 30.01.13
 * 11:35 Uhr
 * 31.01.13
 * 13:24 Uhr
 * 17:33 Uhr
 * 01.02.13
 * 08:45 Uhr
 * 09:39 Uhr
 * 04.02.2013
 * 11:10 Uhr
 * 06.02.2013
 * 09:33 Uhr
 * 10:56 Uhr
 * 11:48 Uhr
 * 13:48 Uhr
 * 14:25 Uhr
 * 22:58 Uhr

=Infos=
 * Scheint eher reproduzierbar mit sehr einfachen Items
 * Sicherheits-Alarm kommt mit 5 Min Verzögerung
 * Timestamp wird für jedes File geändert(evtl. Alarm auf Timestampänderungen eingrenzen?)
 * Framework 1.3.8 verwendet Lucene 3.4.0

=Mögliche Fehlergründe= laut:
 * http://www.gossamer-threads.com/lists/lucene/java-dev/98176

könnte ein NFS (Network File System) stale
 * ''A filehandle becomes stale whenever the file or directory referenced by the handle is removed by another host, while your client still holds an active reference to the object. A typical example occurs when the current directory of a process, running on your client, is removed on the server (either by a process running on the server or on another client).

das Problem sein.'' Mehr zu NFS stales unter:


 * http://www.cyberciti.biz/tips/nfs-stale-file-handle-error-and-solution.html
 * https://issues.apache.org/jira/browse/LUCENE-1011

Aus org.apache.lucene.index.IndexFileDeleter :

Problem: wir verwenden kein NFS. Da dies aber die einzige Stelle in Lucene zu sein scheint, die diese Exception wirft, muss der Fehler auf das System wie ein NFS stale wirkt.

=Logfiles=

fedoragsearch.log

 * Fehler von LIVE (wurde so auch auf QA reproduziert bei zwei gleichzeitigen Importen - auf LIVE war kein Import aktiv wenn der Fehler aufgetreten ist)


 * Reproduziert durch batch-delete auf QA und batch-import auf DEV

indexer_error.log

 * Fehler von LIVE

server.log

 * keine passende Meldung, erst die Folgeerscheinungen sind sichtbar

import-log

 * Warning im Import-Bereich:

Experimente

 * fgsindex.defaultWriteLockTimeout = 3000 (msec anstelle von 100.000.000) wait time for an IndexWriter for the same directory in case of a write.lock before throwing a LockObtainFailedException


 * project FgsLucene OperationsImpl.java ohne closeIndexReader