【FAQ】異なるデータ解析を行ったChIP-seq結果の比較
解析を行う前に、ラボの担当者からデータ処理のパイプラインに何を使用したか、確認してください。論文では多くの場合何を使用したかは言及されていますが、重要なパラメータについて言及されてない場合もあるようです。
一般に、データの有効性を評価するためのいくつかのパラメータがあります。以下の観点からシーケンス品質を定量化します:
- ピークに含まれるリード数
- ピーク高さが高く、バックグラウンドが低い
- シーケンス深度
- 複雑性の高いライブラリー(重複が少ない)
- コントロールにおけるターゲットの濃縮が低い
- レプリケート間で値が相似する
- 遺伝子同士が近接する
また、ChIP-seqデータを比較するパッケージも存在しますが、注意して使用する必要があります。
典型的にはChIP-seqのバッチ効果は非常に大きく、異なるラボでのデータを比較することは簡単ではありません。実際、同じ研究室であっても昔のデータや昔のシーケンスマシンで得たデータと現在のChIP-seqのデータを単純に比較できないのです。
解析に起因するバイアスを除去するためにも、比較の際はパイプライン処理をもう一度生データから実施し直すことをお勧めいたします。