普段はrequests+pyqueryでやるが、今はHaskell強化月間なのでHandsomeSoupを使ってみた。
import Text.HandsomeSoup import Text.XML.HXT.Core main = do doc <- fromUrl "http://matome.naver.jp/odai/2135350364969742801" links <- runX $ doc >>> css ".MTMItemThumb" ! "src" mapM_ (putStrLn . show) links
- たった10行のコードでひたすらアイドル水着画像をあつめる
- たった 4 行のコードでひたすらアイドル水着画像をあつめる(Python だよ)
- たった3行のコードでひたすらアイドル水着画像をあつめる(Rubyだよ)
- たった数行のコードでひたすらアイドル水着画像をあつめるのをGoutteで書いてみた
調べてわかったんだが、Haskellって意外とスクレイピング用のライブラリが充実していた。