Blogger Template by Blogcrowds.

Visión Global de funcionamiento

A Lucene se le pasa un fichero que se quiere indexar. Si dicho fichero es de texto plano, la indexación será automática (la lleva a cabo la biblioteca de Java java.io). En otro caso, se debe extraer el texto plano del fichero realizando un análisis sintáctico con ayuda de otra herramienta.

A partir de esta entrada, Lucene analiza el texto, lo tokeniza y crea un índice que almacena en memoria RAM o en disco según se especifique. Los autores indican que Lucene trabaja muy bien con la indexación en memoria RAM, pues permite realizar búsquedas más rápidas. Normalmente, se usará el almacenamiento en disco.

A continuación vemos un gráfico que ilustra el proceso:


Una vez creados los índices, se puede hacer búsquedas sobre ellos. Para realizar las consultas se puede optar por codificar una aplicación que lo haga (ver códigos de ejemplo), o bien utilizar alguna herramienta gráfica de tipo LuKE, que generalmente permiten consultar y editar los documentos de forma gráfica.

El inconveniente de esta elección es la versión que usamos de Lucene y de Java, si son muy nuevas, pueden no ser compatibles con las herramientas gráficas.

A continuación un gráfico que ilustra el funcionamiento:


2 comentarios:

Hola

Durante el post pones esto: (ver códigos de ejemplo), pero no se desde donde se pueden ver...

¿Me podrias indicar donde estan colocados los ficheros de ejemplo?
¿Con que versión estan hechos?

Enhorabuena por la idea del blog ya que como comentas realmente muy pocos sitios hablan de Lucene en español.

Saludos

Antonio

22 de enero de 2009, 19:37  

Hola Antonio,
como soy estudiante, esto lo he dejado parado durante el mes de enero y febrero.

En estos días lo actualizaré y colgaré los códigos, como era mi intención en un principio y ya pongo las versiones y demás.

Un saludo :)

9 de febrero de 2009, 20:24  

Entrada más reciente Entrada antigua Inicio