PDF Extracción Toolkit

  • 1 Respuestas
  • 1969 Vistas

0 Usuarios y 1 Visitante están viendo este tema.

Desconectado ZanGetsu

  • *
  • Ex-Staff
  • *****
  • Mensajes: 329
  • Actividad:
    0%
  • Country: 00
  • Reputación 0
  • I ZanGetsu
  • Skype: thenicox
  • Twitter: black_zangetsu
    • Ver Perfil

PDF Extracción Toolkit

  • en: Abril 18, 2013, 03:24:27 pm
El kit de herramientas de extracción PDF (antes Analyser PDF ) es un framework Java construida sobre la PDFBox biblioteca para llevar a cabo el análisis de documentos de los archivos PDF y la creación de métodos de conversión personalizadas en HTML y otros formatos. Se basa en parte en mi trabajo de doctorado e incluye un algoritmo de segmentación de la página. GraphWrap , un sistema para envolver gráfico o basado en la extracción de datos semi-automática de archivos PDF, también se incluye en el kit de herramientas de extracción PDF. El kit de herramientas principal (incluyendo GraphWrap) se distribuye bajo la licencia Apache, lo que le permite incorporarse libremente al software propietario.
Una interfaz gráfica de usuario también se incluye, construida sobre la XMIllum biblioteca, que permite a los resultados del proceso de análisis de documentos para ser visualizados. Además, se proporciona una visualización gráfica interactiva para observar las estructuras gráficas creadas por el sistema y permitir la creación y el ensayo de envolturas gráfico basado en documentos PDF interactivo. Esta GUI es liberado bajo la licencia GPL. Una captura de pantalla de la interfaz gráfica de usuario en la acción se muestra a continuación.

Descarga: You are not allowed to view links. Register or Login

Desconectado baron.power

  • *
  • Underc0der
  • Mensajes: 294
  • Actividad:
    0%
  • Reputación 0
    • Ver Perfil

Re:PDF Extracción Toolkit

  • en: Abril 18, 2013, 04:22:58 pm
gracias, lo mprobare a ver si supera a la foca...