Power AutomateでPDFからテキスト抽出する方法【ファイルに保存可】

スポンサードリンク
PowerAutomate
  • PDFから文字を自動で抽出したい
  • 抽出した文字をファイルに保存したい

上記のようなことをお考えでしたら、このまま読んでいってください。
この記事では、下記の内容をまとめて解説いたします。

  • Power AutomateでPDFからテキストを自動抽出
  • 抽出した内容をテキストファイルに保存

※わかりやすさを重視しております。厳密には解釈が異なる場合がありますことをご了承ください

スポンサードリンク

Power AutomateでPDFテキスト抽出はできる?

ExcelやWordをダイレクトにPDF化した場合のテキスト(クリックするとカーソルが点滅)はおおむね抽出が可能です。
ただし、文字として認識されない画像化したテキスト(クリックすると全体が選択される)を抽出することはできません。

Power AutomateでPDFテキスト抽出はできる?

できること

  • 文字として認識されているテキストの抽出

できないこと

  • 画像化されているテキストの抽出
  • 書式やレイアウトの抽出
スポンサードリンク

PDFからテキスト抽出する方法

今回は「Cドライブ」の「Utatane」フォルダにある「あいうえお.pdf」からテキストを抽出してみます。

PDFからテキスト抽出する方法1

手順は下記のとおりです。

  1. 「PDFからテキストを抽出」アクションを追加
  2. テキストを抽出するファイルを選択
  3. (メッセージボックスなどで確認)

では画像付きで解説いたします。

Power Automateを起動したら、新しいフローを作成します。

左側のアクションエリアから「PDF」を探し、左の「>」をクリックします。

PDFからテキスト抽出する方法2

PDFに関するアクション一覧が表示されますので、「PDFからテキストを抽出」を中央エリアにドラッグ&ドロップします。

PDFからテキスト抽出する方法3

「PDFからテキストを抽出」画面が開いたら、下記を指定します。

  • PDFファイル:右側のファイルアイコンからPDFファイルを選択
PDFからテキスト抽出する方法4

抽出されたテキストは下部に表示された変数「ExtractedPDFText」に保存されます。

これでPDFファイルからテキストを抽出するフローが完成しました。

PDFからテキスト抽出する方法5

結果を確認するために、メッセージボックスで変数「ExtractedPDFText」を表示させてみましょう。

PDFからテキスト抽出する方法6
PDFからテキスト抽出する方法7

ではフローを実行してみます。

PDFからテキスト抽出する方法8

無事、PDFファイル内のテキストが全て抽出できました。

スポンサードリンク

抽出したテキストをファイルに保存する方法

ここからは、抽出したテキストをファイルに保存する方法を紹介いたします。
保存するのはシンプルなテキストファイル(.txt)です。

Excelファイルにも保存することができるのですが、下記のようなデメリットがあるためおすすめしません。

  • すべて1つのセルに格納される
  • 文字数制限がある
  • 書式やレイアウトは反映されない
抽出したテキストをExcelファイルに保存した例

では手順を紹介いたします。

  1. 「テキストをファイルに書き込む」アクションを追加
  2. 書き込むファイルなどを指定

1つ1つ画像付きで解説いたします。

前項の続きで、メッセージボックス表示を削除したら、
「ファイル」→「テキストをファイルに書き込む」アクションを追加します。

抽出したテキストをファイルに保存する方法1

「テキストをファイルに書き込む」画面が開いたら、下記を指定します。

  • ファイルパス:右側のファイルアイコンから、書き込みするファイルを選択
    (ファイルが存在しない場合は新規作成される)
  • 書き込むテキスト:右側の{x}から「ExtractedPDFText」(抽出されたテキストが入った変数)を指定
  • エンコード:「UTF-8」が無難
抽出したテキストをファイルに保存する方法2
抽出したテキストをファイルに保存する方法3

これでテキストファイルへ保存するフローが完成しました。
実行してみましょう。

抽出したテキストをファイルに保存する方法4
抽出したテキストをファイルに保存する方法5

「Utatane」フォルダ内に「あいうえお.txt」ファイルが作成され、PDFから抽出した文字が入っていますので成功です。

スポンサードリンク

最後に

Power AutomateでPDFからテキスト抽出する方法を解説いたしました。

当ブログでは、VBAマクロやPythonなど、時間を生み出すプログラミング術を公開しております。
この記事がわかりやすいと感じた方は、他の記事も読んでいってください。

最後までお読みいただき、ありがとうございました。がんばってください!

タイトルとURLをコピーしました