【機械学習】キーワードの画像をまとめてダウンロードする方法【linux】

スポンサーリンク

機械学習などを勉強していると、まとまったデータが欲しくなるもの。

数字などのデータセットがあればそちらで勉強もできます。

しかし画像を使ったものですと、なかなかまとまった画像が集まりません。

例えばりんごの画像を集めるとなると、ひとつひとつダウンロードしていては大変。

そんな時はgoogle_images_downloadというもので指定した画像を探してダウンロードしてくれます。

ここではlinuxでの使い方を書いています。

導入の仕方

pipからでもインストールできるようでインストールして使ってみましたが、エラーが出て使えませんでした。

何度か繰り返し、あきらめて探していると解決策がありました。

こちらのサイト様を参考に解決できました。ありがたいです。

インストールはターミナルにこの2行を実行すると終わりです。

git clone https://github.com/Joeclinton1/google-images-download.git gid-joeclinton
pip install -e gid-joeclinton

そのあとターミナルで

googleimagesdownload –keywords “みかん”

のようにいれて検索すると画像が検索されて、downloadsフォルダのみかんフォルダに画像がダウンロードされます。

100件ダウンロードできました。

それ以上の場合

それ以上はchromedriverが必要になりました。

必要なものは

  • パッチ版のgoogle_images_download
  • GoogleChromeのブラウザ
  • chromedriver

です。chromedriverはこちらからブラウザと同じものをダウンロードします。

解凍したら/usr/local/bin/にいれておきます。

chmod 775

検索の例は

googleimagesdownload –keywords “みかん” -l 1000 –chromedriver /usr/local/bin/chromedriver

です。

-lは検索数。–chromedriverのパスは先ほどのパスを。

キーワードは”みかん,ミカン”と増やせます。

終わりに

今後は集めた画像などを学習させて、画像を生成できたらと思います。

技術の進化ってすごいですね。

コメント

タイトルとURLをコピーしました