23062020 bioinformatics
買った。Kindleだと読みづらいので紙版にした。持ち歩くことも特にないだろうし。
23062020 bioinformatics
買った。Kindleだと読みづらいので紙版にした。持ち歩くことも特にないだろうし。
21062020 chemoinformatics bioinformatics
久しぶりに面白い論文を読んだ。極めてインフォマティクスらしいアプローチでとても素晴らしいと思った。能動学習と組み合わせても面白いんではないかと思ったので後で試してみる。
Practical Applications of Deep Learning To Impute Heterogeneous Drug Discovery DataというJ.C.I.Mのペーパーだけど、research gateからも読めるみたい。
個人的にはマルチタスク学習も転移学習もDrug Discoveryのデータの予測にはあんまり有効じゃないんだろうなーと思っていて、特にマルチタスクなんて共通な特徴量抽出だろうから、それって結局脱溶媒に帰着してハンシュフジタのlogPに無事着陸帰還とというか、「1mmも前進してないじゃないか?美しくないなオイ」くらいに思っている。
Significant improvements over “conventional” machine learning are generally only seen in large data sets or in the case of multitask learning where there are strong correlations between the endpoints.
本論文ではインピュテーションを採用している。特に特徴量学習とかのそもそも化合物表現を攻めずに、与えられたデータから尤もらしい測定値を推定するアプローチをとっているのがインフォマティクスらしくて良いと思った。これにより、特に細胞系のアッセイでの予測精度の向上が大きいが、その理由を次のように考察している。
In particular, we can see that the project A cell 2 (cell proliferation) results cannot be predicted with conventional QSAR methods; a negative R2 indicates a performance that is worse than random (i.e., shuffling the test labels). This is likely because cell activity depends not only on target protein activity but also on the compound reaching the target which will be strongly influenced by physicochemical and ADME properties.
細胞系のアッセイだと、膜透過もパラメータとして取り込んだほうがいいから物性の結果(予測、実験値)ともに特徴量として放り込むこと多いだろうから、inputationで欠損値を埋めるアプローチって上手いよなぁと感心した。
このあたりをもう少し丁寧に読んでおくべきだろう。
測定系同士に関連性がある場合に精度が向上するってあれじゃン、発現データじゃんとおもってバイオインフォマティクス関連の文献調べたらDeepImpute: an accurate, fast, and scalable deep neural network method to impute single-cell RNA-seq dataってのを見つけた。
これとimmunedeconvを組み合わせて、任意の免疫系細胞で着目している遺伝子の発現量を推定できないかな?
14062020 bioinformatics
顧客が本当に必要だったものという風刺画はだれでも一度は目にしたことがあるだろう。
顧客はそもそも自分が欲しい物をきちんと理解していないことが多いため、自分の理解の範囲で要望を伝えることに問題があるし、それを字面通りに受け取るプロジェクトリーダーが要求の本質を理解していないということも同様に問題かと思う。解析という仕事においても同じことはあてはまる。特にケモインフォやバイオインフォの解析において、顧客はメディシナルケミストだったり、薬理の研究者だったりするわけだが、かれらの要求(知りたいこと)を彼ら自身がきちんと認識していないことは往々にしてある。
もし、こうい解析タスクが割り当てられて、その評価に労働時間が考慮されているのであれば、間違ったことを繰り返すことになんの問題もない、むしろ沢山の間違いを繰り返して、顧客から労働対価をぶんどるのは正しい戦略かと思う。社内においても「依頼されたタスク」を遂行する、そしてその時間の多寡が評価されるのであれば、特段問題ないと思う。
ただ、既にWFHが当たり前になりつつ状況で労働時間そのものを評価の指標にすることは減ることはあれど、増えることはないと思う。つまり「顧客が本当に必要だったもの」をいかに早く少ない労力で提供するかが評価指標にシフトしていくんだろうなぁと思っている。
最近、いくつかのミーティングに出ていて、 「それそのまま鵜呑みにして実行したら、そりゃそういう話に持っていかれるだろうな」 と思うことがいくつか重なったのでメモがてら書いてみた。
たまに前置詞の使い分けで混乱するのでなんかいい本ないかなーと買ったのがこれ。まぁイマイチだったら娘に譲ればいいやと思ったけど重宝している。
前置詞って日本語で言う助詞の代わりみたいなもんだからノンネイティブには細かいニュアンスがわからんよねっていう。
あとは、TeXの本を再度買いました。前回5版を買ったんだけど、まったく読まずに、、、でした。最近文書を書くことが増えてTeXの手ほどきを受けたらpdf作るなら断然TeXだなと思うようになった。あと、そろそろ本を出したい。
GitHubでHTMLとPDFを共存させるならasciidocがいいと思っている。
26052020 life
ろたすのチャンネルで竹岡式ラーメンの作り方がアップされていたので試してみた。
麺は西友に唯一売っている、乾麺の棒のやつ
ネギは細めのネギなので大量に投入。チャーシューの色がいい感じになっているが、実際いい感じ。
玉ねぎが良い感じ。スープにコクがないのが嫌だったので、気持ち鶏ガラスープ顆粒を投入した。
かなり満足の出来上がりとなった。
あとは乾麺にこだわるかどうかだけど、個人的にはストレートでもう少し太い麺が良いかなと。
それからもうちょい小洒落たラーメンどんぶりがほしい。器は重要だよなー、秋にどこか火祭り行くかな。
25052020 chemoinformatics bioinformatics
PDBjの今月の分子を眺めて興味が湧いたもののメモ
下の図は、PDBエントリー 4tna のフェニルアラニン運搬RNAの構造で、3つの塩基の相互作用を示している。シトシンとグアニンは、DNAでも見られる典型的な塩基対を形成するが、2つ目のグアニンはメチル基(右端中央の灰色の球)が付加されており、通常見られない相互作用を塩基対と形成する。
FMO案件
シャペロンも改めて考えてみるとよくわからん。フォールディングしやすく空間を与えるのか、熱変性しにくくする空間を与えるのか?HSPの名前の由来であれば後者の気もするけど。
多くのシャペロンタンパク質は「熱ショックタンパク質」(heat shock protein)と呼ばれ、HSP-60のように名付けられている。こう呼ばれるのは細胞が熱にさらされた時大量に作られるからである。一般的に熱はタンパク質を不安定化させ、誤った折りたたみをより起きやすくしてしまう。だから本当に熱くなった時、細胞はこれらシャペロンの追加支援を必要とするのである。
G蛋白質をあまり丁寧にみたことはなかった。
βサブユニットを見ることにも時間を費やして欲しい。ペプチド鎖を主鎖表現やリボン表現で表示すると、鎖がきれいなプロペラ型の構造をとっているのが分かるだろう
FMOかけよ
MHCタンパク質は、黄色い星印で示したチロシン(tyrosine)の各末端でペプチドをつかんでいる。2つの構造でこの3つの位置が似ていることに注目して欲しい。ペプチドはこの場所でMHCにつながれているが、他のアミノ酸は外側に伸びてタンパク質から外れている。
正しくないフォールディングってのは物性的にわかりやすい駄目な指標があるってことかな?免疫系の抗原提示みたいなことが蛋白質レベルで行われているってことかな?
オーキシンがユビキチンに結合した構造によって別の驚くべきことが分かった。オーキシンは、Aux/IAAタンパク質がリガーゼに結合するのを促してそれらの破壊を導くが、タンパク質の形を変えることでこの仕事を行っている訳ではない。そうではなく、2つの分子の間に架橋する分子のりとして働くのである。オーキシンはユビキチンリガーゼの深い窪みの中に結合して穴を埋め、Aux/IAAタンパク質に完全に合致した表面を作り出す。
虚血も興味がある。
酸素が不足した細胞は、多くの赤血球を生み出しより多くの血管をつくるよう身体に伝える信号を送り出す。また、代謝のしくみを変えて、あまり多くの酸素を必要としないエネルギー代謝経路を使うようにする。
わからん
23052020 life
ここではケチャップを説明したいと思う。なぜそんなことをするのか、それは僕にもまったくわからない。しかしだからこそ、やってみるべきだという気もする。
I thought that ketchup was a sour and sweet condiment made from tomatoes, but my conception of it was completely wrong.There are many kinds of ketchup made from ingredients other than tomato, like banana, mushroom, and fish.
I couldn't imagine the taste of ketchup made from fish. After searching for fish ketchup, I found that the name "ketchup" comes from the fish sauce of China or East Asian countries.
It was a really interesting story that the origin of soy sauce and tomato ketchup is the same. We should call soy sauce as "soy ketchup" instead of "shou-yu" :-)
https://en.wikipedia.org/wiki/Ketchup
というわけで、インドネシアのケチャップマニスは鹿児島あたりの甘い醤油の近縁なのではなかろうかということが推測される。
フィリピンもバナナケチャップにそろえて、patisをフィッシュケチャップと呼べばいいのに。
ケチャップについて調べた結果、また東南アジアに遊びに行きたい欲が高まった。
次は何を食べようか、、、
19052020 bioinformatics
ちょっと色々調べないといけなかったのだが、知らんことが多すぎたので週末は細胞の分子生物学の「細胞の内部構造」のパートを精読していた。
15052020 life
在宅していると料理ばかり作っているので色々欲しくなってしまう。
東南アジア系の屋台ユーチューブ動画をみているとだれも中華おたまを使ってないので、「時代はヘラやな!」ということでポチッとした
じゃがいもを蒸していたら、「あーマッシャーでぐしゃっと潰したいなー」と衝動的にポチった。
どこかでコンビーフでも買ってきてマッシャーで潰したポテトとあえてサンドイッチにでもする予定だったのだが、じゃがいもをちょうど切らしてしまって、ぐしゃっとできてない。
ジェイミー・オリバーかなんかのお料理動画を見ていたら、「やっぱじゃがいもと人参は波型カットがよろしいおますな」と物欲がそそられたので、購入。
ひよこ豆のポタージュをつくってみたけど、家にあるザルではうまくこせなかったのでなめらかなポタージュという目標を達成するために買ってしまった。
14052020 life
コロナのせいで学校が休校になってそろそろ三ヶ月に差し掛かろうとしているが、私のいる市立の小中学校ではオンライン授業に移行する気配がまったくない。
そもそも、休校になってすぐのタイミングで、家庭にネットワーク回線がひかれているかとか、子供が使えるタブレットとかPCはあるかというアンケートが来ていたので、当初はその方向で動こうとしていたのであろうが、おそらく、ネット回線とかタブレットのない家庭が学校で負担しろとごねたり、一部の公平厨の教師職の人が揉めたり、ネットに疎い世代の方々の強い抵抗にあったんだろうなーと容易に想像できるので、まぁそれは公立あるあるということで。
というわけで、YouTubeを探してそれっぽい動画を探して息子に見せて、そのあと適当に買ったZ会の問題集をやらせてみているが、なかなか良い。
とある男が授業をしてみたの算数の動画とかめちゃくちゃわかりやすい。
自分がこの時代に生まれていたら多分学校行かなかったかもw
あとは、ブックオフで100円コーナーの小説で息子が読めそうな乙一とか道尾秀介とか買って読ませている。
小学生6年生向けに登録しておくとよいチャンネルとかあれば教えてもらえると嬉しい。ちなみにヒカキンは小3くらいで卒業したw