Alguien tiene documentacion de la API apache tika?

Buenas madrugadas, pues soy un nuevo integrante de la comunidad y me gustaría saber si alguno de ustedes tiene documentación o ejemplos del uso de la API apache tika para java, ya que en mi proyecto de residencias tendré que usarla y necesito toda la ayuda posible.

Otra pregunta aprovechando es que, según sus experiencias, una aplicación desktop con acceso a base de datos por intranet es aceptablemente funcional? ya que en entorno web no es posible trabajar debido a que los servers de la empresa están montados en PHP.

Les agradezco infinitamente su ayuda y atención.

Opciones de visualización de comentarios

Seleccione la forma que prefiera para mostrar los comentarios y haga clic en «Guardar las opciones» para activar los cambios.
Imagen de neko069

de la API apache tika para

de la API apache tika para java, ya que en mi proyecto de residencias tendré que usarla y necesito toda la ayuda posible.

Hace aproximadamente 3 años que ni siquiera había oído escuchar de ése API .. por favor, explica más a detalle para qué la quieres, igual, si recuerdo y no ha cambiado mucho el API te pueda ayudar.

Otra pregunta aprovechando es que, según sus experiencias, una aplicación desktop con acceso a base de datos por intranet es aceptablemente funcional? ya que en entorno web no es posible trabajar debido a que los servers de la empresa están montados en PHP.

En mi opinión, éso depende del requerimiento que tengas, porque si en base a análisis, es a fuerza una aplicación web, de menos un tomcat te tienen que dejar montar, si de plano no es viable, desktop app es buena opción.

detalles de la aplicacion de la API apache tika

Hola buenas tardes, en primer lugar gracias por responder, mira esta api por lo que mi asesora me comento esta destinada a extraer informacion de documentos de texto, imágenes, mp3 entre otros, y bueno se bien que pues debo meterme al sitio oficial de apache a documentarme lo mas que pueda, pero un ejemplo o información resumida de personas con experiencia en su uso me beneficiaria mucho, ya sabrás que digerir la teoría de un nuevo tema lleva algo de tiempo, mucho mas del que se toma digerir información ya procesada por alguien que le ah aplicado, con un par de ejemplos de extraccion de texto de un pdf me sentiría muy agradecido ya que eso es lo que necesito hacer, extraer datos sensibles de un documento pdf que respeta una estructura especifica de datos.

Y sobre la aplicación, no es viable que sea entorno web, me lo recalco la asesora por motivos de tiempo y su uniformidad en PHP, aunque seria mucho mas fácil para mi en entorno web, pero pues esos fueron los lineamientos.

Espero me puedas proveer un ejemplo o recomendar algun sitio donde encontrar ejemplos de clases usando esta API, de antemano te agradezco nuevamente tu atencion.

Imagen de neko069

Sugerencias.

Para usar la biblioteca en modo consola, pues tienes, en la página Getting started en la parte del final el apartado "Using Tika as a command line utility" y bueno, el uso es bastante sencillo y descriptivo.

Para usar la biblioteca dentro de un programa, pues existe un ejemplo de cómo usar su interface Parser y su clase abstracta AbstractParser en éste apartado.

Y pues así como que yo tenga un ejemplo funcional, no, ahi te fallo, pero aquí, aquí y aquí hay información bastante útil.

Si quieres y puedes, pues postea tu avance, igual terminas formando algún tutorial del uso de la biblioteca.

Gracias

Muchas gracias por los links, en efecto conforme vaya generando documentación al respecto la iré posteando para ayudar a quienes lo tengan que utilizar en algún momento, estamos en contacto para cualquier cosa colega.

Imagen de rugi

Tika ya está en la version

Tika ya está en la version 1.0, por lo que, cada vez encontrarás mas y mas ejemploe:

Seguramente requerirás algun otro mecanismo para indexar y buscar sobre la información que extraerás de los archivos que revises.
Apache lucene es el complemento ideal para apache tika.

Saludos!
---