[RPA]PowerShellでブラウザ操作記録

RPAの仕組みを知りたくてコツコツと研究し、ついにPowerShell使ってWebDriver経由でブラウザ側のクリックされた要素を取得できる様になった話。

 

過去には、ブラウザ操作に関する仕様を読み漁り。

しかし、結局、ブラウザを操作する方法はわかってもブラウザが操作された内容の取得の仕方はわからず。

それから、Selenium IDEのソースコード読んだり(ほぼ理解できなかったけど)して

ブラウザ操作記録の仕組みを考える

いよいよ、それらしくなって来たのでございます!

 

1.結論から見せようじゃないか。

PowerShellを開いて、カレントフォルダにWebDriverを置いて以下のコマンドを張り付け。

DOS窓上がって、ブラウザ起動して、スクリプト実行ライブラリのページが開く。

以下のコードを張り付け。(プロンプトは戻らない。)

そして、ブラウザ上で「p,a,div,span,input,textarea」いづれかの要素をクリックする。

プロンプトが戻ってきたら確認。

 

キャプチャ動画撮って公開したかったけど、フリーのキャプチャ取得ツールがうまくうごかなかったので、そこは今度取ることにする・・・。

 

2.わかってしまえば理屈は簡単だった。

 

非同期のスクリプト実行(Execute Async Script)

リクエスト
(POST) http://localhost:9515/session/{sessionId}/execute/async

これを使う訳なんだが、bodyはsyncのスクリプト実行と一緒で、scriptとargsを使う。

@{script=“//*ここにJavascript*//”;args=@(“ここに引数”)}

で、scriptで渡されたJavascriptの中では、argumentsにargsで渡した引数が受け取られる訳なんだけども、asyncコマンドの場合は、args引数とプラワンで一番最後の要素にコールバック用の関数が渡されることになっている様だ。

だから、このシンプルな例だと引数なしで実行したarguments[0]にコールバック関数がいることになる。

ほんだらあとは、EventListener仕込んで取りたい要素がクリックされたタイミングでコールバック関数を呼び出すだけで良い訳だ。

コールバック関数の引数に渡したデータはjsonでプロンプトに返る。

非同期って言葉に惑わされてPromiseだのresolveだの勉強してたけど、コールバック関数の受け取り方だけわかったら特に小難しいこと考える必要なかった・・・。

 

こんな処理をループで回せば、連続した操作をポコポコ取得し続けることもできるね。

hoverとかのイベントで枠のハイライトとかしたりすれば、もっとそれらしくなるんだろうけど、そーゆーカッコイイのはすでに世に溢れてるしね🙄

仕組み分かったから、今日のところはこのくらいでいいか😏

タグ: ,

Leave a Reply

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

Related Post