こちら読み始めました。
前々から興味があったスクレイピング。ついにデビューしちゃいました。
スクレイピングとは
あるサイトのあるページからHTMLを取得して欲しい情報を取得することです。
やったこと
ローソンの公式サイトから、販売中のおでんの名前と値段を取得しました。
コードがこちら。
ちなみに、サイトがこちら。
こんな風に、おでん一覧が表示されています。
コードをターミナルで実行した結果がこちら。
きちんと欲しい情報が取得できています。
これでいつでもおでんの値段を知ることができますね!
ポイント
今回のスクレイピングには、nokogiriとanemoneというgemを使っています。
このanemoneが強力なんですよね。
僕らがやることは、URLを指定してHTMLをたどるだけです。
HTMLをたどる、というのはこんな感じです。
HTML構造をたどっていって、必要な情報まで降りていきます。
以上さえできれば、誰でもスクレイピングできると思います。
次回
次回はあらゆるコンビニからおでん情報を取得して、比較するとこまでやりたいです。