概要 pandasのpivot_tableは強力な機能で、カテゴリごとの集計や計算を高速に行うことができます。 pivot_tableを使った計算で個人的によく使う処理をまとめたものをkaggle のkernelで公開しました。 このkernelでは簡単なダミーデータでpivot_tab....
※ 編集注:前作シェルスクリプト入門(1)の続編です。まだ読み終わってない方はそちらを先にどうぞ。 テーブルファイルの操作と言えばRです。 (※ 編集注:Pythonでもできます。) が、そこまでbashで書いてきたのに、R呼び出して変数再設定して…面倒くさいから嫌だ!! ってことないでしょ....
皆さん初めまして淡田公久と申します。 リレー投稿初週ということで、僕が現在基礎配属で使用していますデータやツールに関してのお話をさせて頂きます。 TCGA TCGAというサイトをご存じでしょうか? TCGAは2006年からアメリカが開始したガンゲノムプロジェクトで、20種類以上の癌腫につ....
python会なのにpythonまだ触ったことありません。勉強せねば。 データ整形の流れって、教わる機会なくないですか? つまらないものですが、僕のやり方を紹介してみます。 始めたばかりの人は参考にしてください。 経験者の方、変なとこあったらどしどし突っ込みください! そして皆さんの自己流....
ChIP-seqとは 全身で37兆個あるといわれているヒトの細胞は、基本的にすべて同じDNA配列を有している。しかし、肝細胞、網膜、免疫細胞と細胞にはそれぞれの"個性"がある。更には正常の免疫細胞と暴走している免疫細胞など細胞には"状態"もある。これらを制御する大きな要素としてエピ....
githubとはなにかの説明は省略しています。githubについて知らない人は先にいろいろ調べてみましょう。今回はgithub desktopについてです。 レポジトリの読み込み(プロジェクト開始時の一回のみ。) github上のレポジトリとLocal pathを指定。 これでうまくclo....
ただいま、私のMacbook Proが入院しておりまして、古いWindows10をUbuntuとデュアルブートして作業しております。下級生でもWindowsしか持っていない、でもBioinformaticsに関心があるという人が、スムーズに環境構築できるようにと今回の記事を書きます....
今回はKallistoを用いたRNA-seq解析パイプラインを紹介します。LinuxでのBioinformatics環境構築でこの記事への準備はすべて終了している流れになります。Kallistoは小惑星の名前のようです。つっこみどころありましたら、コメントいただけると嬉しいです!....
ここ最近pymcを使ったベイズ推論のことをずっと考えています(2018年6月執筆当時)。pymc3を扱った本(http://amzn.asia/1TWcfTI)が先週発売されて買ってしまったのですが、まだ前のpymc本(http://amzn.asia/8CPISDp)を読み切っ....