普段やるようなことをHaskellで書くようにすればよかろうとHaXmlとhttpをつかってみた。
ほとんどhttpのテストサンプルのget.hsだけど。HaXmlのほうはHaXml の Combinators を使って XML をいじるを参考にした。
import Data.Char (intToDigit)
import Network.HTTP
import Network.URI
import System.Environment (getArgs)
import System.Exit (exitFailure)
import System.IO (hPutStrLn, stderr)
import Text.XML.HaXml
import Text.XML.HaXml.Xml2Haskell
import Text.XML.HaXml.Pretty
main =
do
args <- getArgs
case args of
[addr] -> case parseURI addr of
Nothing -> err "Could not parse URI"
Just uri -> do
cont <- get uri
elems <- fGetElem "test" cont
mapM_ (print . content) $ (deep $ tag "title") elems
_ -> err "Usage: get <url>"
err :: String -> IO a
err msg = do
hPutStrLn stderr msg
exitFailure
get :: URI -> IO String
get uri =
do
eresp <- simpleHTTP (request uri)
resp <- handleE (err . show) eresp
case rspCode resp of
(2,0,0) -> return (rspBody resp)
_ -> err (httpError resp)
where
showRspCode (a,b,c) = map intToDigit [a,b,c]
httpError resp = showRspCode (rspCode resp) ++ " " ++ rspReason resp
request :: URI -> Request
request uri = Request{ rqURI = uri,
rqMethod = GET,
rqHeaders = [],
rqBody = "" }
handleE :: Monad m => (ConnError -> m a) -> Either ConnError a -> m a
handleE h (Left e) = h e
handleE _ (Right v) = return v
fGetElem fname cont = return (CElem elems)
where Document _ _ elems _ = xmlParse fname cont
xmlParseにファイル名入れなきゃいけないので適当に名前をいれといた。
Text.XML.HaXml.Parse
xmlParse :: String -> String -> Document
To parse a whole document, xmlParse file content takes a filename (for generating error reports) and the string content of that file. A parse error causes program failure, with message to stderr.
なんか良く分からんが。
実行するとタイトルだけ抜き出すはず。
$ ./rssparse http://clip.livedoor.com/rss/clips/fmkz336
<title>fmkz336のクリップ - livedoor クリップ</title>
<title>haxml.pdf (application/pdf オブジェクト)</title>
<title>CategoryBinaries - DarcsWiki</title>
<title>PLEAC-Haskell</title>
<title>AIRアプリはドラッグ&ドロップでこんなことまで!(1/3) ─ @IT</title>
<title>Javascript でタートルグラフィックス - 言語ゲーム</title>
<title>[Haskell][30分プログラム]テトリスっぽい何か</title>
<title>ほにゃ。</title>
<title>はたしてバイオはオープンか?(Re:研究とかをオープンにすること) - バイオ研究者見習い生活 with IT</title>
<title>[REST][書きかけ][WebService][SOAP] RESTful な blast 検索サービスを作るとしたらどうするかを考えてみた</title>
<title>こういうことがしたいんだけど - 刺身☆ブーメランのはてなダイアリー</title>
<title>Version Control with SVK</title>
<title>svkでもう少し攻めてみる</title>
<title>Programming:WayToHaskeller</title>
<title>TM23Proof.pdf (application/pdf オブジェクト)</title>
<title>サーバーのリソースを定期的に取得する - Hatena::Diary::Ubuntu</title>
<title>モナドのすべて - Enjoy Programming</title>
<title>howm wiki - モナド</title>
<title>好きなフォント</title>
<title>Pexpect - a Pure Python Expect-like module</title>
<title>wxPython Cookbook - wxPyWiki</title>
HTTPのほうは読めば分かりそうなもんだけど、HaXmlはなかなか簡単なサンプルがなかったので難儀した。