Indexar documentos de Microsoft Word

Utilizaremos el analizador desarrollado por Apache-POI, que nos permitirá analizar sintácticamente  documentos Word de Office 97, 2000 y XP. Los documentos de Office 2007 no son por el momento compatibles.

El procedimiento para hacerlo es el siguiente:

  • Descargamos los ficheros de la web de Apache-POI, buscaremos una versión estable (FINAL).
  • Descomprimimos el fichero. Buscamos en el archivo descomprimido y encontraremos unos ficheros .JAR.
  • Añadimos estos ficheros al classpath de el IDE que utilicemos y el uso es inmediato al igual que en el caso de los PDF.
Ejemplos de código más adelante.

0 comentarios:

Entrada más reciente Entrada antigua Inicio