Microsoft® ワード プロセッシング ファイルを変換するためのオープン ソース Go ライブラリ
無料の GO API を使用して Microsoft ワープロ ドキュメントをプレーン テキストに変換する
ドコンブとは?
多くの場合、開発者は Microsoft ワープロ ドキュメントで作業しているときに、プレーン フォーマットのドキュメント テキストを必要とします。場合によっては、テキストを処理したり、別の形式で表示したりすることもあります。オープンソースで無料の API Docconv を使用すると、GO 開発者は DOC および DOCX からプレーン形式でテキストを抽出できます。
ライブラリは完全に GO で開発されていますが、正しく動作するためにいくつかの依存関係があります。 API には、tidy、wv、popplerutils、および unrtf JustText が必要です
Docconv の使用を開始する
プロジェクトへの Docconv の推奨される方法は、GitHub を使用することです。スムーズなインストールのために、次のコマンドを使用してください。
GitHub 経由で Docconv をインストールする
$ go get code.sajari.com/docconv/...
Free Go API を介して DOCX をプレーン テキストに変換する
オープン ソース ライブラリ Docconv を使用すると、コンピューター プログラマーは、独自の Go アプリケーション内で DOCX をプレーン テキストに変換できます。 DOCX をプレーン テキストに変換するには、ドキュメントを読み込んで occonv.ConvertPath() メソッドを使用して変換するだけです。次のコード行を使用すると、DOCX をプレーン テキストに簡単に変換できます。
GO でワード プロセッシングをテキストに変換する
- 新しいクライアントを作成する
- client.ConvertPath() を使用して DOCX をテキストに変換し、ファイル パスをパラメータとして渡します
- エラーをチェックする
- プレーンテキストを印刷する
無料の GO API を介して DOCX をテキストに変換する
// create a new client
c := client.New()
// convert DOCX to Text
res, err := client.ConvertPath(c, "fileformat.docx")
if err != nil {
log.Fatal(err)
}
// print output
fmt.Println(res)