Apache POI HDGF
Biblioteca Java de código abierto para diagramas de Visio
Lea y extraiga contenidos textuales almacenados en formato binario de Microsoft Visio a través de las API gratuitas de Java.
Apache POI HDGF (Horrible DiaGram Format) es una implementación pura de Java para archivos binarios de Microsoft Visio (VSD). Este módulo es joven y sus capacidades son limitadas en este momento, sin embargo, proporciona acceso de bajo nivel a las secuencias, fragmentos y comandos de fragmentos para proporcionar una forma de extraer el contenido textual del archivo.
Primeros pasos con Apache POI HDGF
En primer lugar, debe tener instalado el kit de desarrollo de Java (JDK) en su sistema. Si ya lo tiene, vaya a la página de descarga de Apache POI para obtener la última versión estable en un archivo. Extraiga el contenido del archivo ZIP en cualquier directorio desde donde se puedan vincular las bibliotecas requeridas a su programa Java. ¡Eso es todo!
Hacer referencia a Apache POI en su proyecto Java basado en Maven es aún más simple. Todo lo que necesita es agregar la siguiente dependencia en su pom.xml y dejar que su IDE obtenga y haga referencia a los archivos Jar de POI de Apache.
Dependencia de Apache POI Maven
<!-- https://mvnrepository.com/artifact/org.apache.poi/poi -->
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi-scratchpad</artifactId>
<version>4.1.0</version>
</dependency>
Extraiga contenido textual del diagrama de Visio a través de Java
Apache POI HDGF ha proporcionado extracción de texto básica para todos los formatos de archivo compatibles con el proyecto. POI-HDGF permite a los desarrolladores de software extraer el contenido textual de un archivo de Visio. Los desarrolladores deben iterar a través de las páginas del diagrama de Visio para cubrir todo el texto del diagrama de Visio. Pueden usar la clase VisioTextExtractor para ubicar todas las entradas de texto en un archivo de Visio y devolver su contenido. Devuelve el contenido textual del archivo. El texto de cada objeto textual estará separado por una nueva línea.
Extraer texto de VSD - Java
// open VSD file
VisioTextExtractor extractor = new VisioTextExtractor(new FileInputStream("sample.vsd"));
// read text
System.out.println(extractor.getAllText());
API de Java para acceder y leer diagramas de Microsoft Visio
Apache POI-HDGF permite a los programadores acceder a documentos de Visio en formatos de archivo VSD. Los desarrolladores pueden leer el contenido de un diagrama de Visio. Dado que la API se encuentra en una etapa muy temprana, las funciones disponibles son limitadas en este momento.