機械学習などを勉強していると、まとまったデータが欲しくなるもの。
数字などのデータセットがあればそちらで勉強もできます。
しかし画像を使ったものですと、なかなかまとまった画像が集まりません。
例えばりんごの画像を集めるとなると、ひとつひとつダウンロードしていては大変。
そんな時はgoogle_images_downloadというもので指定した画像を探してダウンロードしてくれます。
ここではlinuxでの使い方を書いています。
導入の仕方
pipからでもインストールできるようでインストールして使ってみましたが、エラーが出て使えませんでした。
何度か繰り返し、あきらめて探していると解決策がありました。
こちらのサイト様を参考に解決できました。ありがたいです。
インストールはターミナルにこの2行を実行すると終わりです。
git clone https://github.com/Joeclinton1/google-images-download.git gid-joeclinton
pip install -e gid-joeclinton
そのあとターミナルで
googleimagesdownload –keywords “みかん”
のようにいれて検索すると画像が検索されて、downloadsフォルダのみかんフォルダに画像がダウンロードされます。
100件ダウンロードできました。
それ以上の場合
それ以上はchromedriverが必要になりました。
必要なものは
- パッチ版のgoogle_images_download
- GoogleChromeのブラウザ
- chromedriver
です。chromedriverはこちらからブラウザと同じものをダウンロードします。
解凍したら/usr/local/bin/にいれておきます。
chmod 775
検索の例は
googleimagesdownload –keywords “みかん” -l 1000 –chromedriver /usr/local/bin/chromedriver
です。
-lは検索数。–chromedriverのパスは先ほどのパスを。
キーワードは”みかん,ミカン”と増やせます。
終わりに
今後は集めた画像などを学習させて、画像を生成できたらと思います。
技術の進化ってすごいですね。
コメント