研究や課題、あるいは仕事上で学術文献を参照する機会は多々あります。そこで役立つのが論文検索サイトです。
論文検索サイトを利用する際は、特定の学術文献ではなく、あるキーワードに絞ってさまざまな文献を参照したい時もあります。
そうした際に「もっと効率よく文献を探す方法はないか?」効率性を追求したい方も多いのではないでしょうか。
今回ご紹介するのは、論文検索サイトである「Google Scholar」から学術文献をリスト化する方法です。Webスクレイピングツールの「Octoparse(オクトパス)」を使えば、わずか11分で100件の学術文献をリスト化できます。
やり方は非常にシンプルなので、学術文献を効率よく探したいという方はぜひ参考にしてみてください。
Google Scholarとは?
Google Scholarとは、Googleが無料で提供している無料の論文検索サイトです。Google検索と同じようなインターフェースで学術文献を検索でき、世界中の文献が2億件以上登録されています。
多くの学術文献は全文を無料で読むことができ、研究や課題、仕事上で参照にしたい文献を探し出すのに最適なサービスです。
Google Scholarの使い方
Google Scholarの使い方は非常にシンプルです。
1. Google Scholar(https://scholar.google.co.jp/)にアクセスする
2. キーワードを入力して検索(虫メガネボタン)をクリックする

3. 気になる学術文献をクリックする

以上です。
学術文献をクリックすると文献が掲載されているページに移動し、文献の閲覧やダウンロードが行えるようになります。
また、Google Scholarは期間や言語、特許の有無などで学術文献を絞り込むことができるため、目的の文献を探しやすいのが特徴です。
Google Scholarから学術文献をリスト化する方法
それでは早速、Google Scholarから学術文献をリスト化する方法をご紹介します。
Octoparse(オクトパス)とは?
今回使用するOctoparseというツールは、インターネット上にあるさまざまな情報を自動で取得・リスト化する、Webスクレイピングツールです。
Octoparseを使用すれば、情報によっては数分で数百件取得することも可能です。
また、Octoparseにはテンプレートタスクが提供されています。各種Webサービスからの情報収集を素早く行えるテンプレートタスクを利用すると、Octoparse初心者でも簡単にWebスクレイピングを実行できます。
Google Scholarのテンプレートタスクも提供されているので、今回はテンプレートタスクを使ったWebスクレイピングのやり方をご紹介します。
1. Octoparseに登録する
まずはOctoparseの無料アカウントに登録しましょう。
Octoparseの新規登録ページに移動し、メールアドレス、ユーザー名、パスワードを入力し、業種を選択したら「登録」をクリックしてください。

設定したメールアドレスにOctoparseからメールが届くので開封し、「メールアドレスを認証する」をクリックしてください。
以上でOctoparseへの登録は完了です。
2. Octoparseをインストール&起動する
続いてお使いのPCにOctoparseをインストールし、起動しましょう。
Octoparseのダウンロードページに移動し、中央に表示されているバージョン番号をクリックしてください。

お手持ちのPCがWindowsの場合、Windows版のダウンロードページが自動的に表示される仕組みになっているので、上記と同じくバージョン番号をクリックしてください。
Octoparseをダウンロードできたらファイルを実行し、Octoparseを起動しましょう。するとログイン画面が表示されるので、先ほど登録したメールアドレスとパスワードを入力し、「ログイン」をクリックしてください。

以上で、Octoparseを使ったWebスクレイピングの準備が整いました。
3. Google Scholarのテンプレートタスクを探す
続いて数あるテンプレートタスクの中から、Google Scholarのテンプレートタスクを探します。
ホーム画面の左上にある「新規作成」をクリックし、表示されたメニューから「テンプレートタスク」をクリックしてください。

次にカテゴリーで「学術文献」をクリックしてください。

Google Scholarがヒットしたのでクリックしましょう。

もう1度、Google Scholarをクリックしてください。

これでGoogle Scholarのテンプレートタスクを探すことができました。

「サンプルデータ」をクリックすると、テンプレートタスクを使ってどのような情報がリスト化されるかを確認できます。
4. Google ScholarをWebスクレイピングする
先ほどの手順で表示されたGoogle Scholarのテンプレートタスクのページにて、「今すぐ使う」をクリックしてください。

続けてパラメーターの部分にGoogle Scholarで検索したいキーワードを入力し、「保存して実行」をクリックしてください

タスク名は任意の名称を入力しましょう。「保存して実行」をクリックすると、タスクの実行方法を選択する画面が表示されるので、ローカル抽出の「通常モード」をクリックしてください。

クラウド抽出は有料プランで利用でき、Octoparseを使って収集した情報をクラウド上に保存することができます。
以上の手順をもって、Google ScholarのWebスクレイピングがスタートします。
5. Webスクレイピングした情報をエクスポートする
Google ScholarのWebスクレイピングがスタートしてからわずか11分ほどで100件の文献情報をリスト化できました。

今回は文献情報を100件収集したところで「一時停止」をクリックしてWebスクレイピングを止めましたが、通常はヒットした学術文献をすべてリスト化するまで実行されます。
Webスクレイピングが終了したらファイルをエクスポートする画面が表示されるので、ExcelやCSVなど任意の形式でリストファイルをダウンロードしましょう。
こちらがExcelでダウンロードし、体裁を整えたリストです。

学術文献のタイトルやディスクリプションなどが一覧で表示されるので、気になる文献を探しやすく、文献のリンクをクリックすればすぐに閲覧できます。
このようにOctoparseを使ってGoogle ScholarをWebスクレイピングすれば、学術文献を探す時間を圧倒的に短縮できます。
まとめ
Google Scholarなどの論文検索サイトは素晴らしいサービスですが、目的の学術文献を探し出すのに手間と時間がかかるのが、ちょっとした難点です。
しかしOctoparseを使えば、その難点が一気に解消され、短時間で100件以上の学術文献をリスト化できます。Webスクレイピングを実行している間は他の作業に集中できるので、生産性もアップしますね。
Octoparseを使ったことがないという方は、この機会にGoogle Scholarの情報収集に是非ご活用ください。
また、Octoparseを使えばあらゆるサイトやサービスから情報をリスト化できるので、Google Scholar以外での情報収集にもおすすめです。
