Drkcore

16 12 2009 Haskell Tweet

haskellでlivedoor clipのRSSをとってきてパースする

普段やるようなことをHaskellで書くようにすればよかろうとHaXmlとhttpをつかってみた。

ほとんどhttpのテストサンプルのget.hsだけど。HaXmlのほうはHaXml の Combinators を使って XML をいじるを参考にした。

import Data.Char (intToDigit)
import Network.HTTP
import Network.URI
import System.Environment (getArgs)
import System.Exit (exitFailure)
import System.IO (hPutStrLn, stderr)
import Text.XML.HaXml
import Text.XML.HaXml.Xml2Haskell
import Text.XML.HaXml.Pretty

main = 
    do
    args <- getArgs
    case args of 
    [addr] -> case parseURI addr of
                   Nothing -> err "Could not parse URI"
                   Just uri -> do
                               cont <- get uri
                               elems <- fGetElem "test" cont
                                   mapM_ (print . content) $ (deep $ tag "title") elems 
    _ -> err "Usage: get <url>"

err :: String -> IO a
err msg = do 
      hPutStrLn stderr msg
      exitFailure

get :: URI -> IO String
get uri =
    do
    eresp <- simpleHTTP (request uri)
    resp <- handleE (err . show) eresp
    case rspCode resp of
                      (2,0,0) -> return (rspBody resp)
                      _ -> err (httpError resp)
    where
    showRspCode (a,b,c) = map intToDigit [a,b,c]
    httpError resp = showRspCode (rspCode resp) ++ " " ++ rspReason resp

request :: URI -> Request
request uri = Request{ rqURI = uri,
                       rqMethod = GET,
                       rqHeaders = [],
                       rqBody = "" }

handleE :: Monad m => (ConnError -> m a) -> Either ConnError a -> m a
handleE h (Left e) = h e
handleE _ (Right v) = return v

fGetElem fname cont = return (CElem elems)
                 where Document _ _ elems _ = xmlParse fname cont

xmlParseにファイル名入れなきゃいけないので適当に名前をいれといた。

Text.XML.HaXml.Parse

xmlParse :: String -> String -> Document To parse a whole document, xmlParse file content takes a filename (for generating error reports) and the string content of that file. A parse error causes program failure, with message to stderr.

なんか良く分からんが。

実行するとタイトルだけ抜き出すはず。

$ ./rssparse http://clip.livedoor.com/rss/clips/fmkz336
<title>fmkz336のクリップ - livedoor クリップ</title>
<title>haxml.pdf (application/pdf オブジェクト)</title>
<title>CategoryBinaries - DarcsWiki</title>
<title>PLEAC-Haskell</title>
<title>AIRアプリはドラッグ&ドロップでこんなことまで!(1/3) ─ @IT</title>
<title>Javascript でタートルグラフィックス - 言語ゲーム</title>
<title>[Haskell][30分プログラム]テトリスっぽい何か</title>
<title>ほにゃ。</title>
<title>はたしてバイオはオープンか?(Re:研究とかをオープンにすること) - バイオ研究者見習い生活 with IT</title>
<title>[REST][書きかけ][WebService][SOAP] RESTful な blast 検索サービスを作るとしたらどうするかを考えてみた</title>
<title>こういうことがしたいんだけど - 刺身☆ブーメランのはてなダイアリー</title>
<title>Version Control with SVK</title>
<title>svkでもう少し攻めてみる</title>
<title>Programming:WayToHaskeller</title>
<title>TM23Proof.pdf (application/pdf オブジェクト)</title>
<title>サーバーのリソースを定期的に取得する - Hatena::Diary::Ubuntu</title>
<title>モナドのすべて - Enjoy Programming</title>
<title>howm wiki - モナド</title>
<title>好きなフォント</title>
<title>Pexpect - a Pure Python Expect-like module</title>
<title>wxPython Cookbook - wxPyWiki</title>

HTTPのほうは読めば分かりそうなもんだけど、HaXmlはなかなか簡単なサンプルがなかったので難儀した。

About

  • もう5年目(wishlistありマス♡)
  • 最近はPythonとDeepLearning
  • 日本酒自粛中
  • ドラムンベースからミニマルまで
  • ポケモンGOゆるめ

Tag

Python Deep Learning javascript chemoinformatics Emacs sake and more...

Ad

© kzfm 2003-2021