Apache POI HDGF
Visio 다이어그램용 오픈 소스 Java 라이브러리
무료 Java API를 통해 Microsoft Visio 바이너리 형식으로 저장된 텍스트 콘텐츠를 읽고 추출합니다.
Apache POI HDGF 시작하기
먼저 시스템에 JDK(Java Development Kit)가 설치되어 있어야 합니다. 이미 가지고 있는 경우 Apache POI의 다운로드 페이지로 이동하여 아카이브에서 최신 안정 릴리스를 얻으십시오. 필요한 라이브러리가 Java 프로그램에 링크될 수 있는 디렉토리에서 ZIP 파일의 컨텐츠를 추출하십시오. 그게 다야!
Maven 기반 Java 프로젝트에서 Apache POI를 참조하는 것은 훨씬 더 간단합니다. pom.xml에 다음 종속성을 추가하고 IDE가 Apache POI Jar 파일을 가져와 참조하도록 하기만 하면 됩니다.
Apache POI Maven 종속성
<!-- https://mvnrepository.com/artifact/org.apache.poi/poi -->
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi-scratchpad</artifactId>
<version>4.1.0</version>
</dependency>
Java를 통해 Visio Diagram에서 텍스트 콘텐츠 추출
Apache POI HDGF는 모든 프로젝트 지원 파일 형식에 대한 기본 텍스트 추출을 제공했습니다. POI-HDGF를 사용하면 소프트웨어 개발자가 Visio 파일에서 텍스트 콘텐츠를 추출할 수 있습니다. 개발자는 전체 Visio 다이어그램 텍스트를 다루기 위해 Visio 다이어그램 페이지를 반복해야 합니다. VisioTextExtractor 클래스를 사용하여 Visio 파일의 모든 텍스트 항목을 찾고 해당 내용을 반환할 수 있습니다. 파일의 텍스트 내용을 반환합니다. 각 텍스트 개체의 텍스트는 줄 바꿈으로 구분됩니다.
VSD에서 텍스트 추출 - Java
// open VSD file
VisioTextExtractor extractor = new VisioTextExtractor(new FileInputStream("sample.vsd"));
// read text
System.out.println(extractor.getAllText());
Microsoft Visio 다이어그램에 액세스하고 읽기 위한 Java API
Apache POI-HDGF를 사용하면 프로그래머가 VSD 파일 형식의 Visio 문서에 액세스할 수 있습니다. 개발자는 Visio 다이어그램의 내용을 읽을 수 있습니다. API는 초기 단계이므로 현재 사용 가능한 기능이 제한되어 있습니다.