LinuxでのBioinformatics環境構築
ただいま、私のMacbook Proが入院しておりまして、古いWindows10をUbuntuとデュアルブートして作業しております。下級生でもWindowsしか持っていない、でもBioinformaticsに関心があるという人が、スムーズに環境構築できるようにと今回の記事を書きます。なお、前提として、Ubuntuのインストールが完了しているものとします。なお、筆者のインストールしたUbuntuは18.04.1 LTSです。
今回はKallistoを用いたRNA-seq解析パイプラインで使う、RNA-seq系のツールのインストールを行っていきますが、順次別の解析目的のツールインストールも紹介したいと考えております。今回の環境構築で、Kallistoを用いたRNA-seq解析パイプラインに進むことができます。
Pythonのインストール
Ubuntuのバージョンによってはpython2.7がデフォルトとなっている場合もあるので、python3系をダウンロードし、デフォルトに設定しよう。
# check the version of python.
$ python --version
>>> Python 2.7.15rc1
Biocondaのインストール
Anacondaのインストーラーをダウンロードします。
$ bash ~/Downloads/Anaconda3-4.1.0-Linux-x86_64.sh
$ echo 'export PATH=/home/user/anaconda3/bin:$PATH' >> ~/.bashrc
$ conda -V
$ python --version
>>> Python 3.6.6+
バイオインフォマティクスの分野では解析のために様々なツールを利用しますが、インストールのたびにパスを通すなどの作業をしていると大変煩雑ですし、バージョン管理もしにくくなります。パッケージマネージャーを使ってツールを一元管理するのが賢明です。 Homebrewなどのパッケージ管理システムは有名ですが、対応していないツールの多く、現状はBiocondaというパッケージマネージャーがおすすめです。
# Download a Miniconda package for linux python3
$ wget https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64.sh
$ bash Miniconda3-latest-Linux-x86_64.sh
EnterやYesを入力していくとインストールが終了し、パスも通った状態になります。
# condaコマンドが正常に動作していれば成功です。(terminalを開き直しましょう。)
$ conda -h
biocondaのチャンネルを追加。biocondaチャンネルが最上位に来るように設定。
$ conda config --add channels conda-forge
$ conda config --add channels defaults
$ conda config --add channels r
$ conda config --add channels bioconda
それでは早速ツールをインストールしていきましょう。基本 conda install ???
でインストールが完了し正常に動作していきます。非常に便利ですね。
$ conda install parallel-fastq-dump
$ conda install fastqc
$ conda install multiqc
$ conda install trimmomatic
$ conda install kallisto
参照
Rツールのインストール
Rのコンソールを開いて、Rのツールをインストールしていきます。 Tximportのインストール
> source("https://bioconductor.org/biocLite.R")
> biocLite("tximport")
DESeq2のインストール
> source("https://bioconductor.org/biocLite.R")
> biocLite("DESeq2")
参照
- 前の記事 : Kallistoを用いたRNA-seq解析パイプライン
- 次の記事 : GitHub desktopアプリの使い方
- 関連記事 :