Wordの表からCSV形式でデータを取得

1.Microsoft Officeが思いのほか進化してる。

スキャナで作ったPDFじゃなく、PCで生成されたと思われるPDFファイルをWordで開いてみるとキレイにWordで復元することができた。

マジかよと思って別の端末からもやってみたら、お古の端末のOffice2010だと同じファイルでも文字化けしてうまく表示できない。

上手くいった端末には、o365のサブスクリプション版がインストールされていた。

調べてみると、Office2013、2016以降ではWordでPDFを読み込めるようになっているらしい。(もちろんなんでも読めるって訳なじゃないけど。)

MS Officeもいろいろ進化してるんだなーって驚きました。

 

2.試しにWinActorのWordライブラリでPDFを開く。

これはOffice側が対応してれば当然普通にできた。

ライブラリの「Word操作(開く)」のファイルパスにPDFを指定するとそのまま開けるではないか。

 

3.Wordから表のデータを読み取るスクリプト書いてみた。

で、PDFをWordで読めるんだぁ。って思うとWordのデータが読み取りたくなりますよね。

でも、WinActorのライブラリ見ると編集したり表の修正はあるんだけども読み取りがなかった。

なので、とりあえずWordの中のn番目の表をそのままセル情報をカンマ区切りでCSVっぽく読み取るスクリプトを書いてみました。

読み取った内容をテキスト書き出しでファイル化して、データファイルとして繰り返しで使うとかするとPDFで届くデータの自動処理に使えるかもしれませんね。

ノード「繰り返し」でデータファイル指定

スクリプト実行のノードに張り付けてお使いください。

Leave a Reply

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

Related Post