異なるラボで情報処理したChIP-seqのデータを比較する際、どのような点に気を付ければよいですか?




【FAQ】異なるデータ解析を行ったChIP-seq結果の比較



解析を行う前に、ラボの担当者からデータ処理のパイプラインに何を使用したか、確認してください。論文では多くの場合何を使用したかは言及されていますが、重要なパラメータについて言及されてない場合もあるようです。

一般に、データの有効性を評価するためのいくつかのパラメータがあります。以下の観点からシーケンス品質を定量化します:

  • ピークに含まれるリード数
  • ピーク高さが高く、バックグラウンドが低い
  • シーケンス深度
  • 複雑性の高いライブラリー(重複が少ない)
  • コントロールにおけるターゲットの濃縮が低い
  • レプリケート間で値が相似する
  • 遺伝子同士が近接する

また、ChIP-seqデータを比較するパッケージも存在しますが、注意して使用する必要があります。

典型的にはChIP-seqのバッチ効果は非常に大きく、異なるラボでのデータを比較することは簡単ではありません。実際、同じ研究室であっても昔のデータや昔のシーケンスマシンで得たデータと現在のChIP-seqのデータを単純に比較できないのです。

解析に起因するバイアスを除去するためにも、比較の際はパイプライン処理をもう一度生データから実施し直すことをお勧めいたします。



おすすめ