<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0"><channel><title>Hadoop / Drkcore</title><link>http://blog.kzfmix.com/Hadoop</link><description>Programming, Music, Snowboarding</description><language>ja</language><lastBuildDate>Thu, 21 Apr 2011 05:46:22 +0919</lastBuildDate><item><title>osxでHadoopのNameNodeが起動しない</title><link>http://blog.kzfmix.com/entry/1303330532</link><description>&lt;p&gt;&lt;a href="http://blog.kzfmix.com/entry/1302681116"&gt;macbookにHadoopを入れた&lt;/a&gt;のだけどきちんと起動してない。jpsで見てみるとNameNodeが起動していないことが原因のようだった。&lt;/p&gt;
&lt;p&gt;ログを見てみると、設定ファイルに記述したlocalhostじゃなくてマシン名+".local"(hostnameで表示される文字列)で立ち上げようとしてた。理由は良くわからんがとりあえず設定ファイルをこちらの名前で書き直す。&lt;/p&gt;
&lt;p&gt;さらに、パスワードなしsshアクセスできるように.ssh/authorized_keysに追加しておく。&lt;/p&gt;
&lt;p&gt;&lt;p&gt;&lt;div class="awsxom"&gt;
    &lt;a href="http://www.amazon.co.jp/exec/obidos/ASIN/487311439X/ref=nosim/kaerutyuuihou-22"&gt;
    &lt;img src="http://ecx.images-amazon.com/images/I/51ecKX5HnQL._SL160_.jpg" align="left" hspace="5" border="0" alt="ProductName" class="image" /&gt;
    &lt;strong&gt;Hadoop&lt;/strong&gt;&lt;/a&gt;&lt;br /&gt;
    Tom White&lt;br /&gt;
    オライリージャパン / 4830円 ( 2010-01-25 )&lt;br /&gt;
    &lt;br /&gt;
    &lt;br clear="all" /&gt;
    &lt;/div&gt;&lt;/p&gt;&lt;/p&gt;
&lt;hr /&gt;
&lt;p&gt;これでうまくうごいたので、早速HadoopStreamingをやってみる。サンプルコードは&lt;a href="http://d.hatena.ne.jp/naoya/20080513/1210684438"&gt;Hadoop Streaming - naoyaのはてなダイアリー&lt;/a&gt;から。&lt;/p&gt;
&lt;div class="codehilite"&gt;&lt;pre&gt;&lt;span class="nv"&gt;$ &lt;/span&gt;hadoop jar hadoop-0.20.2/contrib/streaming/hadoop-0.20.2-streaming.jar &lt;span class="se"&gt;\&lt;/span&gt;
-input log.txt -output log.out -mapper map.pl -reducer reduce.pl
...
11/04/21 05:21:24 INFO streaming.StreamJob:  map 100%  reduce 0%
11/04/21 05:21:33 INFO streaming.StreamJob:  map 100%  reduce 100%
11/04/21 05:21:36 INFO streaming.StreamJob: Job &lt;span class="nb"&gt;complete&lt;/span&gt;: job_201104202054_0004
11/04/21 05:21:36 INFO streaming.StreamJob: Output: log.out
&lt;/pre&gt;&lt;/div&gt;


&lt;p&gt;OKっぽいのでアウトプットを見てみる&lt;/p&gt;
&lt;div class="codehilite"&gt;&lt;pre&gt;&lt;span class="nv"&gt;$ &lt;/span&gt;hadoop fs -cat log.out/part-00000
403 3
304 3786
206 2
400 11
313 14
200 49190
302 48
301 223
404 2476
&lt;/pre&gt;&lt;/div&gt;


&lt;p&gt;あとは擬似分散環境じゃなくてちゃんとした分散環境を構築すればいいですね。&lt;/p&gt;
&lt;p&gt;バーチャルで化合物つくると組み合わせ爆発おこしてその先のハンドリングに難儀するのでchemoinformaticsでもMapReduceうまく使えないかなと思っているわけです。&lt;/p&gt;
&lt;p&gt;参考&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;a href="http://atbrox.com/2010/05/08/mapreduce-hadoop-algorithms-in-academic-papers-may-2010-update/"&gt;Mapreduce &amp;amp; Hadoop Algorithms in Academic Papers&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;</description><pubDate>Thu, 21 Apr 2011 05:46:22 +0919</pubDate><category>macbook</category><category>Hadoop</category></item><item><title>macbookにHadoopを入れた</title><link>http://blog.kzfmix.com/entry/1302681116</link><description>&lt;p&gt;オライリーの本みながら0.21.0使うとはまるので、&lt;a href="http://hadoop.apache.org/common/releases.html#Download"&gt;0.20.2&lt;/a&gt;を入れる。&lt;/p&gt;
&lt;p&gt;conf/hadoop-env.shのJAVA_HOMEを設定&lt;/p&gt;
&lt;div class="codehilite"&gt;&lt;pre&gt;&lt;span class="n"&gt;export&lt;/span&gt; &lt;span class="n"&gt;JAVA_HOME&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sr"&gt;/System/&lt;/span&gt;&lt;span class="n"&gt;Library&lt;/span&gt;&lt;span class="sr"&gt;/Frameworks/&lt;/span&gt;&lt;span class="n"&gt;JavaVM&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;framework&lt;/span&gt;&lt;span class="sr"&gt;/Versions/&lt;/span&gt;&lt;span class="mf"&gt;1.6.0&lt;/span&gt;&lt;span class="o"&gt;/&lt;/span&gt;&lt;span class="n"&gt;Home&lt;/span&gt;
&lt;/pre&gt;&lt;/div&gt;


&lt;p&gt;動作確認でバージョンを表示させてみる。&lt;/p&gt;
&lt;div class="codehilite"&gt;&lt;pre&gt;&lt;span class="nv"&gt;$&lt;/span&gt; &lt;span class="nv"&gt;hadoop&lt;/span&gt;&lt;span class="o"&gt;-&lt;/span&gt;&lt;span class="mf"&gt;0.20.2&lt;/span&gt;&lt;span class="sr"&gt;/bin/&lt;/span&gt;&lt;span class="n"&gt;hadoop&lt;/span&gt; &lt;span class="n"&gt;version&lt;/span&gt;
&lt;span class="n"&gt;Hadoop&lt;/span&gt; &lt;span class="mf"&gt;0.20.2&lt;/span&gt;
&lt;span class="n"&gt;Subversion&lt;/span&gt; &lt;span class="n"&gt;https:&lt;/span&gt;&lt;span class="sr"&gt;//s&lt;/span&gt;&lt;span class="n"&gt;vn&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;apache&lt;/span&gt;&lt;span class="o"&gt;.&lt;/span&gt;&lt;span class="n"&gt;org&lt;/span&gt;&lt;span class="sr"&gt;/repos/&lt;/span&gt;&lt;span class="n"&gt;asf&lt;/span&gt;&lt;span class="sr"&gt;/hadoop/commo&lt;/span&gt;&lt;span class="n"&gt;n&lt;/span&gt;&lt;span class="sr"&gt;/branches/&lt;/span&gt;&lt;span class="n"&gt;branch&lt;/span&gt;&lt;span class="o"&gt;-&lt;/span&gt;&lt;span class="mf"&gt;0.20&lt;/span&gt; &lt;span class="o"&gt;-&lt;/span&gt;&lt;span class="n"&gt;r&lt;/span&gt; &lt;span class="mi"&gt;911707&lt;/span&gt;
&lt;span class="n"&gt;Compiled&lt;/span&gt; &lt;span class="n"&gt;by&lt;/span&gt; &lt;span class="n"&gt;chrisdo&lt;/span&gt; &lt;span class="n"&gt;on&lt;/span&gt; &lt;span class="n"&gt;Fri&lt;/span&gt; &lt;span class="n"&gt;Feb&lt;/span&gt; &lt;span class="mi"&gt;19&lt;/span&gt; &lt;span class="mi"&gt;08&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="mo"&gt;07&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="mi"&gt;34&lt;/span&gt; &lt;span class="n"&gt;UTC&lt;/span&gt; &lt;span class="mi"&gt;2010&lt;/span&gt;
&lt;/pre&gt;&lt;/div&gt;


&lt;p&gt;ちゃんと動いてれば.bashrcに追加&lt;/p&gt;
&lt;div class="codehilite"&gt;&lt;pre&gt;&lt;span class="n"&gt;export&lt;/span&gt; &lt;span class="n"&gt;HADOOP_INSTALL&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="sr"&gt;/Users/&lt;/span&gt;&lt;span class="n"&gt;kzfm&lt;/span&gt;&lt;span class="o"&gt;/&lt;/span&gt;&lt;span class="n"&gt;hadoop&lt;/span&gt;&lt;span class="o"&gt;-&lt;/span&gt;&lt;span class="mf"&gt;0.20.2&lt;/span&gt;
&lt;span class="n"&gt;export&lt;/span&gt; &lt;span class="n"&gt;PATH&lt;/span&gt;&lt;span class="o"&gt;=&lt;/span&gt;&lt;span class="nv"&gt;$HADOOP_INSTALL&lt;/span&gt;&lt;span class="o"&gt;/&lt;/span&gt;&lt;span class="n"&gt;bin:&lt;/span&gt;&lt;span class="nv"&gt;$PATH&lt;/span&gt;
&lt;/pre&gt;&lt;/div&gt;


&lt;p&gt;あとはHadoop本の通りに擬似分散モードで動かす。ちなみにmacbookでsshアクセスできるようにするには「システム環境設定」→「共有」→「リモートログイン」で。&lt;/p&gt;
&lt;p&gt;&lt;p&gt;&lt;div class="awsxom"&gt;
    &lt;a href="http://www.amazon.co.jp/exec/obidos/ASIN/487311439X/ref=nosim/kaerutyuuihou-22"&gt;
    &lt;img src="http://ecx.images-amazon.com/images/I/51ecKX5HnQL._SL160_.jpg" align="left" hspace="5" border="0" alt="ProductName" class="image" /&gt;
    &lt;strong&gt;Hadoop&lt;/strong&gt;&lt;/a&gt;&lt;br /&gt;
    Tom White&lt;br /&gt;
    オライリージャパン / 4830円 ( 2010-01-25 )&lt;br /&gt;
    &lt;br /&gt;
    &lt;br clear="all" /&gt;
    &lt;/div&gt;&lt;/p&gt;&lt;/p&gt;
&lt;p&gt;hdfsを起動させるときには&lt;/p&gt;
&lt;div class="codehilite"&gt;&lt;pre&gt;&lt;span class="nv"&gt;$ &lt;/span&gt;hadoop namenode -format
&lt;span class="nv"&gt;$ &lt;/span&gt;start-dfs.sh
&lt;span class="nv"&gt;$ &lt;/span&gt;start-mapred.sh
&lt;/pre&gt;&lt;/div&gt;


&lt;p&gt;hdfsを停止させるときには&lt;/p&gt;
&lt;div class="codehilite"&gt;&lt;pre&gt;&lt;span class="nv"&gt;$ &lt;/span&gt;stop-mapred.sh 
&lt;span class="nv"&gt;$ &lt;/span&gt;stop-dfs.sh
&lt;/pre&gt;&lt;/div&gt;</description><pubDate>Fri, 15 Apr 2011 08:08:40 +0919</pubDate><category>macbook</category><category>Hadoop</category></item></channel></rss>