Apache POI HDGF
Thư viện Java nguồn mở cho sơ đồ Visio
Đọc & Trích xuất nội dung văn bản được lưu trữ ở định dạng Microsoft Visio Binary thông qua các API Java miễn phí.
Apache POI HDGF (Định dạng DiaGram Kinh khủng) là một triển khai Java thuần túy cho các tệp nhị phân Microsoft Visio (VSD). Mô-đun này còn non trẻ và khả năng của nó còn hạn chế tại thời điểm này, tuy nhiên, nó cung cấp quyền truy cập cấp thấp vào các luồng, khối và lệnh chunk để cung cấp cách trích xuất nội dung văn bản từ tệp.
Bắt đầu với Apache POI HDGF
Trước hết, bạn cần cài đặt Bộ phát triển Java (JDK) trên hệ thống của mình. Nếu bạn đã có thì hãy truy cập trang tải xuống của Apache POI để tải xuống bản phát hành ổn định mới nhất trong kho lưu trữ. Trích xuất nội dung của tệp ZIP trong bất kỳ thư mục nào từ đó các thư viện bắt buộc có thể được liên kết với chương trình Java của bạn. Đó là tất cả!
Tham chiếu Apache POI trong dự án Java dựa trên Maven của bạn thậm chí còn đơn giản hơn. Tất cả những gì bạn cần là thêm phần phụ thuộc sau vào pom.xml và cho phép IDE của bạn tìm nạp và tham chiếu các tệp Apache POI Jar.
Apache POI Maven Phụ thuộc
<!-- https://mvnrepository.com/artifact/org.apache.poi/poi -->
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi-scratchpad</artifactId>
<version>4.1.0</version>
</dependency>
Trích xuất nội dung văn bản từ Sơ đồ Visio qua Java
Apache POI HDGF đã cung cấp tính năng trích xuất văn bản cơ bản cho tất cả các định dạng tệp được hỗ trợ của dự án. POI-HDGF cho phép các nhà phát triển phần mềm trích xuất nội dung văn bản từ tệp Visio. Các nhà phát triển cần phải duyệt qua các trang sơ đồ Visio để bao quát toàn bộ văn bản sơ đồ Visio. Họ có thể sử dụng lớp VisioTextExtractor để định vị tất cả các mục nhập văn bản trong tệp Visio và trả về nội dung của chúng. Nó Trả về nội dung văn bản của tệp. Văn bản của mỗi đối tượng văn bản sẽ được phân tách bằng một dòng mới.
Trích xuất văn bản từ VSD - Java
// open VSD file
VisioTextExtractor extractor = new VisioTextExtractor(new FileInputStream("sample.vsd"));
// read text
System.out.println(extractor.getAllText());
Các API Java để truy cập và đọc sơ đồ Microsoft Visio
Apache POI-HDGF cho phép lập trình viên truy cập tài liệu Visio ở định dạng tệp VSD. Các nhà phát triển có thể đọc nội dung của sơ đồ Visio. Do API đang ở giai đoạn rất sớm, do đó, các tính năng có sẵn tại thời điểm này bị hạn chế.