先日workflow-meetupにお誘いを頂いて参加してきました。そこでThe Common Workflow Language(CWL)というものを習ったので忘れないうちに医学部生にもわかりやすくまとめます。 CWLって? 一言で言うと、bioinformatics処理の自動化です。ど....
はじめに 「どうぶつしょうぎ」 というゲームをご存知でしょうか。(wikipediaの解説) 普及・教育用のミニ将棋として考案されたもので、本将棋が盤9x9、駒8種のところを盤3x4、駒4種までコンパクトにしたものです。 駒の名前もひよこ(歩)、ぞう(弱い角)、きりん(弱い飛車)、ライオ....
GSEAとは GSEAは発現差異解析の結果などで得られる遺伝子群がどういった機能のものかを明らかにするために用いられる解析手法です。機能表現として用いられる主なものとしてはKEGGのパスウェイ分類やGene Ontology(GO)があります。 clusterProfilerでGSEA....
概要 pandasのpivot_tableは強力な機能で、カテゴリごとの集計や計算を高速に行うことができます。 pivot_tableを使った計算で個人的によく使う処理をまとめたものをkaggle のkernelで公開しました。 このkernelでは簡単なダミーデータでpivot_tab....
※ 編集注:前作シェルスクリプト入門(1)の続編です。まだ読み終わってない方はそちらを先にどうぞ。 テーブルファイルの操作と言えばRです。 (※ 編集注:Pythonでもできます。) が、そこまでbashで書いてきたのに、R呼び出して変数再設定して…面倒くさいから嫌だ!! ってことないでしょ....
皆さん初めまして淡田公久と申します。 リレー投稿初週ということで、僕が現在基礎配属で使用していますデータやツールに関してのお話をさせて頂きます。 TCGA TCGAというサイトをご存じでしょうか? TCGAは2006年からアメリカが開始したガンゲノムプロジェクトで、20種類以上の癌腫につ....
python会なのにpythonまだ触ったことありません。勉強せねば。 データ整形の流れって、教わる機会なくないですか? つまらないものですが、僕のやり方を紹介してみます。 始めたばかりの人は参考にしてください。 経験者の方、変なとこあったらどしどし突っ込みください! そして皆さんの自己流....