30 06 2014 chemoinformatics Python Tweet
ChEMBLからデータを取ってきて、活性が強いほど色が濃くなってドットのサイズも大きくなるようにしてみた。python-ggplotを使うと数行で描くことができるので調子いいですみたいな話をします。
あとはscikit-learnとrdkitで予測モデルを作ったりクラスタリングをしたりといった話もできればなーと考えているので、 興味があれば参加して下さい。
import pandas as pd from ggplot import * import numpy as np d = pd.read_csv("syk.csv") d["pIC50"] = 9 - np.log10(d["IC50"]) print d p = ggplot(aes(x='MWT', y='ALOGP', color="pIC50", size="pIC50"), data=d) + geom_point() #print p ggsave("2dplot.png", p)