08092020 life
自分の生き方としてこのあたりはあまりぶれてなくて、子供の教育に関しても同様に場さえ与えればいいんじゃないかなと考えいてる。
特に読書環境というか、読むべき本という場に関しては色々と気を使っていると思うので誰か読んでくれればいいなぁと買ってみた。
面白いけど、わかっているからわかる系の本だよなぁと思ったが、このあたりはわかった上でどうしたいかというのを考えるフェーズが高校時代にあるほうが今どきは健全だよなーと思わないでもない。
08092020 life
突然、「なんか新しいことでも学ぶか」と久しぶりに図書館をぶらついてファイナンスの本を借りてきて、この土日で読んだ。
この本がとてもわかりやすかった。
まぁ、せっかく学んだので、実践しないとなととある会社のの決算を分析しながら答え合わせしてみたら、ほー!となった。 自分のいる業界だと、特に2がやばいところは転職しないようにしなきゃなと強く誓ったのであった。
こっちは逆にあまり響かなかった。業界分析とかするのにはいいかな。
マクロに捉えたい場合にこの本は良かった。
ECとかフィンテックの具体的な読み方が書いてあってよかった。linkedin買収の流れが一番面白かった。
10年近く積んだままになっている「経済学という教養」を読もうかな。
30082020 bioinformatics
PROTACとか色々なdegraderの話がまとまっている。
が、ノンケミストにわかりやすく説明する感じの特集であったので、分かる人はJ.M.Cとかのレビューを見たほうがよいかもと思った。
05082020 curry
サンバル、ラッサム、ウールガイの作り方まで載っているのでとてもよい。
タイトルの通りMacBook Airを購入した。息子に「minecraftをPCでやりたいからお下がりくれ」って言われたのでまぁいいタイミングかなと新調したわけだが、データ移行にトラブった結果過去の資産をほぼ全て失ってしまった。
もとのMacBook Airが2015 earlyかなんかだったので、デーたの移行はWifiかケーブルなんだけどWifiはおそすぎるから却下ということで、Thunderbolt 3->2 変換コネクタとThunderboltケーブルを9000円くらいで購入した挙げ句、データ移行に失敗したので、このもう使い道のないケーブルどうしようかなぁと。まぁ、あと一台移行しないといけないMacBook Airあるからその時使うことになるからいいけどさ、、、
というわけで、新しいMacBook Airは過去のしがらみを断ち切れていてかなり快適だ。SSDにも余裕があるし、レガシーなソフトも入っていない。
実際、必要なデータはGoogle Driveに入れておけば毎回データ移行しないで使ったほうが快適かもしれない。slack,yorufukurou,vscode入れれば環境的にはまぁOKだしね。
11072020 bioinformatics
顧客の要件をきちんと理解することの続き。
に問題があるんだろうなーと。プロジェクトリーダーがきちんと理解してないから適切に現場のタスクにブレークダウンされていなくて、私が現場の月次ミーティングでそれに対して物申しているのだろう。というわけで、ミーティングで文句言うくらいだったら、最初から打ち合わせできちんと調整したほうがよろしいんかなぁと思い始めている。
23062020 bioinformatics
買った。Kindleだと読みづらいので紙版にした。持ち歩くことも特にないだろうし。
21062020 chemoinformatics bioinformatics
久しぶりに面白い論文を読んだ。極めてインフォマティクスらしいアプローチでとても素晴らしいと思った。能動学習と組み合わせても面白いんではないかと思ったので後で試してみる。
Practical Applications of Deep Learning To Impute Heterogeneous Drug Discovery DataというJ.C.I.Mのペーパーだけど、research gateからも読めるみたい。
個人的にはマルチタスク学習も転移学習もDrug Discoveryのデータの予測にはあんまり有効じゃないんだろうなーと思っていて、特にマルチタスクなんて共通な特徴量抽出だろうから、それって結局脱溶媒に帰着してハンシュフジタのlogPに無事着陸帰還とというか、「1mmも前進してないじゃないか?美しくないなオイ」くらいに思っている。
Significant improvements over “conventional” machine learning are generally only seen in large data sets or in the case of multitask learning where there are strong correlations between the endpoints.
本論文ではインピュテーションを採用している。特に特徴量学習とかのそもそも化合物表現を攻めずに、与えられたデータから尤もらしい測定値を推定するアプローチをとっているのがインフォマティクスらしくて良いと思った。これにより、特に細胞系のアッセイでの予測精度の向上が大きいが、その理由を次のように考察している。
In particular, we can see that the project A cell 2 (cell proliferation) results cannot be predicted with conventional QSAR methods; a negative R2 indicates a performance that is worse than random (i.e., shuffling the test labels). This is likely because cell activity depends not only on target protein activity but also on the compound reaching the target which will be strongly influenced by physicochemical and ADME properties.
細胞系のアッセイだと、膜透過もパラメータとして取り込んだほうがいいから物性の結果(予測、実験値)ともに特徴量として放り込むこと多いだろうから、inputationで欠損値を埋めるアプローチって上手いよなぁと感心した。
このあたりをもう少し丁寧に読んでおくべきだろう。
測定系同士に関連性がある場合に精度が向上するってあれじゃン、発現データじゃんとおもってバイオインフォマティクス関連の文献調べたらDeepImpute: an accurate, fast, and scalable deep neural network method to impute single-cell RNA-seq dataってのを見つけた。
これとimmunedeconvを組み合わせて、任意の免疫系細胞で着目している遺伝子の発現量を推定できないかな?
14062020 bioinformatics
顧客が本当に必要だったものという風刺画はだれでも一度は目にしたことがあるだろう。
顧客はそもそも自分が欲しい物をきちんと理解していないことが多いため、自分の理解の範囲で要望を伝えることに問題があるし、それを字面通りに受け取るプロジェクトリーダーが要求の本質を理解していないということも同様に問題かと思う。解析という仕事においても同じことはあてはまる。特にケモインフォやバイオインフォの解析において、顧客はメディシナルケミストだったり、薬理の研究者だったりするわけだが、かれらの要求(知りたいこと)を彼ら自身がきちんと認識していないことは往々にしてある。
もし、こうい解析タスクが割り当てられて、その評価に労働時間が考慮されているのであれば、間違ったことを繰り返すことになんの問題もない、むしろ沢山の間違いを繰り返して、顧客から労働対価をぶんどるのは正しい戦略かと思う。社内においても「依頼されたタスク」を遂行する、そしてその時間の多寡が評価されるのであれば、特段問題ないと思う。
ただ、既にWFHが当たり前になりつつ状況で労働時間そのものを評価の指標にすることは減ることはあれど、増えることはないと思う。つまり「顧客が本当に必要だったもの」をいかに早く少ない労力で提供するかが評価指標にシフトしていくんだろうなぁと思っている。
最近、いくつかのミーティングに出ていて、 「それそのまま鵜呑みにして実行したら、そりゃそういう話に持っていかれるだろうな」 と思うことがいくつか重なったのでメモがてら書いてみた。
たまに前置詞の使い分けで混乱するのでなんかいい本ないかなーと買ったのがこれ。まぁイマイチだったら娘に譲ればいいやと思ったけど重宝している。
前置詞って日本語で言う助詞の代わりみたいなもんだからノンネイティブには細かいニュアンスがわからんよねっていう。
あとは、TeXの本を再度買いました。前回5版を買ったんだけど、まったく読まずに、、、でした。最近文書を書くことが増えてTeXの手ほどきを受けたらpdf作るなら断然TeXだなと思うようになった。あと、そろそろ本を出したい。
GitHubでHTMLとPDFを共存させるならasciidocがいいと思っている。