Haskellで継続

Haskell - WikiBookを読んでる。

継続のあたりまで進んだのだけど、動かすのに困ったのでメモ。説明は分かりやすかった。あと、Haskell-modeはミニバッファに型が出てきて便利。いちいち:tとかやって確認するの面倒だし。

import Control.Monad.Cont

foo :: Int -> Cont r String
foo n =
  callCC $ \k -> do
    let n' = n ^ 2 + 3
    when (n' > 20) $ k "over twenty"
    return (show $ n' - 4)

-- runCont (foo 5) id

そしてさらに、Haskellの継続モナド(Continuation Monad)を理解するポイントも併せて読んで吉。

wikibookはarrowのとことかも分かりやすかった。

HaskellかScalaか

うーん両方とも欲しい

ProductName Real World Haskell―実戦で学ぶ関数型言語プログラミング
Bryan O'Sullivan,John Goerzen,Don Stewart
オライリージャパン / ¥ 3,990 ()
在庫あり。

ProductName Scalaスケーラブルプログラミング[コンセプト&コーディング] (Programming in Scala)
Martin Odersky,Lex Spoon、Bill Venners
インプレスジャパン / ¥ 4,830 ()
在庫あり。

haskellでlivedoor clipのRSSをとってきてパースする

普段やるようなことをHaskellで書くようにすればよかろうとHaXmlhttpをつかってみた。

ほとんどhttpのテストサンプルのget.hsだけど。HaXmlのほうはHaXml の Combinators を使って XML をいじるを参考にした。

import Data.Char (intToDigit)
import Network.HTTP
import Network.URI
import System.Environment (getArgs)
import System.Exit (exitFailure)
import System.IO (hPutStrLn, stderr)
import Text.XML.HaXml
import Text.XML.HaXml.Xml2Haskell
import Text.XML.HaXml.Pretty

main = 
    do
    args <- getArgs
    case args of 
    [addr] -> case parseURI addr of
                   Nothing -> err "Could not parse URI"
                   Just uri -> do
                               cont <- get uri
                               elems <- fGetElem "test" cont
                                   mapM_ (print . content) $ (deep $ tag "title") elems 
    _ -> err "Usage: get <url>"

err :: String -> IO a
err msg = do 
      hPutStrLn stderr msg
      exitFailure

get :: URI -> IO String
get uri =
    do
    eresp <- simpleHTTP (request uri)
    resp <- handleE (err . show) eresp
    case rspCode resp of
                      (2,0,0) -> return (rspBody resp)
                      _ -> err (httpError resp)
    where
    showRspCode (a,b,c) = map intToDigit [a,b,c]
    httpError resp = showRspCode (rspCode resp) ++ " " ++ rspReason resp

request :: URI -> Request
request uri = Request{ rqURI = uri,
                       rqMethod = GET,
                       rqHeaders = [],
                       rqBody = "" }

handleE :: Monad m => (ConnError -> m a) -> Either ConnError a -> m a
handleE h (Left e) = h e
handleE _ (Right v) = return v

fGetElem fname cont = return (CElem elems)
                 where Document _ _ elems _ = xmlParse fname cont

xmlParseにファイル名入れなきゃいけないので適当に名前をいれといた。

Text.XML.HaXml.Parse

xmlParse :: String -> String -> Document To parse a whole document, xmlParse file content takes a filename (for generating error reports) and the string content of that file. A parse error causes program failure, with message to stderr.

なんか良く分からんが。

実行するとタイトルだけ抜き出すはず。

$ ./rssparse http://clip.livedoor.com/rss/clips/fmkz336
<title>fmkz336のクリップ - livedoor クリップ</title>
<title>haxml.pdf (application/pdf オブジェクト)</title>
<title>CategoryBinaries - DarcsWiki</title>
<title>PLEAC-Haskell</title>
<title>AIRアプリはドラッグ&ドロップでこんなことまで!(1/3) ─ @IT</title>
<title>Javascript でタートルグラフィックス - 言語ゲーム</title>
<title>[Haskell][30分プログラム]テトリスっぽい何か</title>
<title>ほにゃ。</title>
<title>はたしてバイオはオープンか?(Re:研究とかをオープンにすること) - バイオ研究者見習い生活 with IT</title>
<title>[REST][書きかけ][WebService][SOAP] RESTful な blast 検索サービスを作るとしたらどうするかを考えてみた</title>
<title>こういうことがしたいんだけど - 刺身☆ブーメランのはてなダイアリー</title>
<title>Version Control with SVK</title>
<title>svkでもう少し攻めてみる</title>
<title>Programming:WayToHaskeller</title>
<title>TM23Proof.pdf (application/pdf オブジェクト)</title>
<title>サーバーのリソースを定期的に取得する - Hatena::Diary::Ubuntu</title>
<title>モナドのすべて - Enjoy Programming</title>
<title>howm wiki - モナド</title>
<title>好きなフォント</title>
<title>Pexpect - a Pure Python Expect-like module</title>
<title>wxPython Cookbook - wxPyWiki</title>

HTTPのほうは読めば分かりそうなもんだけど、HaXmlはなかなか簡単なサンプルがなかったので難儀した。

Real World Haskell 10章

Functorのあたりがついてくのがきびしくなった。

ProductName Real World Haskell―実戦で学ぶ関数型言語プログラミング
Bryan O'Sullivan,John Goerzen,Don Stewart
オライリージャパン / ¥ 3,990 ()
在庫あり。

もう一度丁寧に読み直す。

HaskellのfromIntegral

fromIntegralは型を変換してNum型に

Prelude> let a = 2 :: Int
Prelude> :t a
a :: Int
Prelude> :t (fromIntegral a)
(fromIntegral a) :: (Num b) => b

Num型なので、Fractionalの和も求まる

Prelude> (fromIntegral a) + 3.0
5.0

Haskellで安全なファイルのオープン

例外処理をやるためにhandleとbracketがある。

Prelude> :m +Control.OldException
Prelude Control.OldException> :t handle
handle :: (Exception -> IO a) -> IO a -> IO a
Prelude Control.OldException> :t bracket
bracket :: IO a -> (a -> IO b) -> (a -> IO c) -> IO c

handleは最初の引数に処理が失敗した時の例外ハンドラ。本ではファイルのサイズを返す関数を書くときに使っていて、openに失敗したらNothingを返すようなアクションを定義してた。

bracketは最初のアクションでリソース獲得、二番目のアクションがリソース開放、最後のアクションがリソース獲得から開放までにはしるアクション。pythonでいうところのtry-except-finallyみたいなものか。

RWHではhandleとbracketを組み合わせて

getFileSize path = handle (\_ -> return Nothing) $
  bracket (openFile path ReadMode) hClose $ \h -> do
    size <- hFileSize h
    return (Just size)

ってなってんだけど、もしhandleなしでbracketのopenが失敗して例外が返ったらどうなんのとか?基本的にhandleとbracketは組み合わせて使うものなのか?

ProductName Real World Haskell―実戦で学ぶ関数型言語プログラミング
Bryan O'Sullivan,John Goerzen,Don Stewart
オライリージャパン / ¥ 3,990 ()
在庫あり。

HaskellでEmacsのバックアップファイルを探す

9章のforMの練習

forM :: (Monad m) => [a] -> (a -> m b) -> m [b]

リストと、関数をとってリストのモナドを返す

module RecursiveContents (getRecursiceContents) where

import Control.Monad (forM)
import System.Directory (doesDirectoryExist, getDirectoryContents)
import System.FilePath ((</>))
import Text.Regex.Posix ((=~))

getRecursiceContents :: FilePath -> IO [FilePath]
getRecursiceContents topdir = do
  names <- getDirectoryContents topdir
  let properNames = filter (`notElem` [".", ".."]) names
  paths <- forM properNames $ \name -> do
    let path = topdir </> name
    isDirectory <- doesDirectoryExist path
    if isDirectory
       then getRecursiceContents path
       else 
           if path =~ ".+~$"
           then return [path]
           else return []
  return (concat paths)

実行

$ ghci RecursiveContents.hs 
*RecursiveContents> getRecursiceContents "/Users/kzfm/perl"
["/Users/kzfm/perl/hori.pl~","/Users/kzfm/perl/Moosp/lib/Moosp/Function \
/Defun.pm~","/Users/kzfm/perl/Moosp/t/17-function-defun.t~"]

ProductName Real World Haskell―実戦で学ぶ関数型言語プログラミング
Bryan O'Sullivan,John Goerzen,Don Stewart
オライリージャパン / ¥ 3,990 ()
在庫あり。

doesDirectoryExist関数はアクションで返り値はIO Boolのため、<-でBoolにする必要がある。

Haskellで正規表現

RWH8章のメモ

Haskellの正規表現のための演算子は=~でperlと一緒だ。

Prelude> :m +Text.Regex.Posix
Prelude Text.Regex.Posix> "Haskell" =~ "^.+ll$" :: Bool
Loading package syb ... linking ... done.
Loading package array-0.2.0.0 ... linking ... done.
Loading package bytestring-0.9.1.4 ... linking ... done.
Loading package regex-base-0.72.0.2 ... linking ... done.
Loading package regex-posix-0.72.0.3 ... linking ... done.
True

さらに型の指定を変えると、それに合わせた値を返してくる。(Int,Int)とか。=~の型が気になるので:tして後悔した。

Prelude Text.Regex.Posix> :t (=~)
(=~)
  :: (Text.Regex.Base.RegexLike.RegexMaker
        Regex CompOption ExecOption source,
      Text.Regex.Base.RegexLike.RegexContext Regex source1 target) =>
     source1 -> source -> target

ぶっちゃけ全然わからん。

ProductName Real World Haskell―実戦で学ぶ関数型言語プログラミング
Bryan O'Sullivan,John Goerzen,Don Stewart
オライリージャパン / ¥ 3,990 ()
在庫あり。

Haskellのファイル入出力(RWH 7章)

抽象度を上げていく。

ProductName Real World Haskell―実戦で学ぶ関数型言語プログラミング
Bryan O'Sullivan,John Goerzen,Don Stewart
オライリージャパン / ¥ 3,990 ()
在庫あり。

ファイルを読んで、コンテンツを大文字に変えてファイルに書き込む処理を考える。これはハンドルを開いて読み書きすればいい。

import System.IO
import Data.Char(toUpper)

main :: IO ()
main = do
  inh <- openFile "input.txt" ReadMode
  outh <- openFile "output.txt" WriteMode
  mainloop inh outh
  hClose inh
  hClose outh

mainloop :: Handle -> Handle ->IO ()
mainloop inh outh =
    do ineof <- hIsEOF inh
       if ineof then return ()
                else do inpStr <- hGetLine inh
                        hPutStrLn outh $ processData inpStr
                        mainloop inh outh

processData :: String -> String
processData = map toUpper

このmainloop関数はEOFが見つかるまでストリームを読んでいくが、これはhGetContentsで抽象化出来る

import System.IO
import Data.Char(toUpper)

main :: IO()
main = do
  inh <- openFile "input.txt" ReadMode
  outh <- openFile "output.txt" WriteMode
  inpStr <- hGetContents inh
  let result = processData inpStr
  hPutStr outh result
  hClose inh
  hClose outh

processData :: String -> String
processData = map toUpper

さらに、さらにハンドルを開いて文字列を読み出す処理と、文字列に大して何らかの処理をしながら、ハンドルを開いてファイルに書き出すという処理もそれぞれreadFile,writeFileで抽象化できるので、結局次のようになる

import Data.Char(toUpper)

main = do
  inpStr <- readFile "input.txt"
  writeFile "output.txt" $ processData inpStr

processData :: String -> String
processData = map toUpper

となると、読み出すファイル名と、書き出すファイル名と、ストリームに対し作用させる関数を受け取ってよろしくやってくれる関数まであっていいと思うのだけど、それは標準ライブラリに存在するのだろうか?

convert readfile writefile (map toUpper)

みたいなの。

RWH5章

JSONライブラリを作る

ProductName Real World Haskell―実戦で学ぶ関数型言語プログラミング
Bryan O'Sullivan,John Goerzen,Don Stewart
オライリージャパン / ¥ 3,990 ()
在庫あり。

GHCのパッケージマネージャはpython setup.py buildみたいな感じでらくちん。

ただ、この章をやってみて、分かり難い箇所が二点あった。

一つ目は5.9「混乱せずにHaskellコードを開発する」という章でスタブに触れられていて、かつPrettyStub.hsというコードが載っているのだけど、本文中で実際に実行されていない。そのため、このコードをどう使っていいのかいまいち理解できなかった。Developing Haskell code without going nutsでも同じようなコメントがあった。

二つ目はPrettify.hsのモジュール宣言に触れられてなかったので

module Prettify where

ってつけといた。

Haskellでスタブを利用する時のわかりやすい説明どっかにないかな