Q&A:データ解析


c Expand All C Collapse All

データ解析 (10)



【FAQ】未知の結合部位の濃縮率を求めるには



もし、免疫沈降で濃縮したいタンパク質がどこに結合するのかについての情報がない場合、ChIP-seqで得られるNGSのピーク情報や配列情報以外の確実なアウトプットはありません。
まず確認できることとしては、既知のターゲットに対する抗体をポジティブコントロールとし、プロトコールが正常に行われているかについて確認してみることができます。この場合、抗体がおのずと異なるため、目的のタンパク質については確認できません。
また、qPCRプライマーデザインを行うために、目的タンパク質の結合モチーフの情報があればそれを利用する方法もあります。
もし実験に使用しているサンプルや類似サンプルで一度でもChIP-seqのデータが取得できた場合は、その実験結果を基にqPCRのプライマーデザインを行い、その後の同じ実験系で濃縮率を反映するか確認していくことも可能です。



【FAQ】ChIP-qPCRでCt値が得られないサンプルの場合



一つの方法としては、「測定限界外」のCt値を仮に「>40」として値に40を取ることです。

すなわち、Ct=40をPCRサイクルで増幅が得られないサンプルとして定義します。

この値に基づき、サンプルの測定値を比較Ct法などを用いて相対定量計算を行います。

ここから言えるのは、サンプル測定値 vs. IgGコントロールによる正規化は通常ChIP-qPCRでは必要ないということです。

ChIP-qPCRでは免疫沈降サンプルのCtはインプットによって正規化されるのがより実用的です。

IgGのqPCRシグナルは通常免疫沈降シグナルよりかなり低く、全く検出されない場合もあるため、Ctを用いた正規化の計算には不向きと言えます。

特異性の評価については、別にIgGをインプットによって正規化したデータを使用して示すのが適しています。



【FAQ】ChIP-qPCRとChIP-seqのデータの正規化



特に数量的データの正規化にはインプットからのリカバリー%をご利用ください。

IgGはバックグラウンドノイズがどの程度あるかについての指標にはなりますが、正規化に使用するにはインプットほど確度が高くありません。

qPCRの際は特にインプットを使用して正規化を行うことが重要です。

下のページについても併せてご覧ください。




【FAQ】ChIP-seq、RNA-seqマルチオミクス解析



ChIP-seqとRNA-seqの組み合わせによるデータ拡張は価値のあるデータセットを生成でき、マルチオミクス研究でも非常に多用されている組み合わせです。

多くのヒストンマークは遺伝子発現と関連することがわかっており、プロモーターやエンハンサーに対し活性化・poised・抑制化の3通りのコントロールを及ぼします。

特にヒストンマークについてRNA-seqのデータは貴重な追加の洞察を与えることができます。機能アノテーション分析(Functional annotation analysis)において、RNA-seqの情報を基に発現遺伝子のリストを微調整する目的にも使用できます。




【FAQ】ChIP-qPCRレプリケート間の変動の処理



一般にqPCRのプライマーと実験が適切であれば、技術的レプリケート間の変動は生物学的レプリケートと比べて十分低いため、多くの場合無視できます。

ただし、技術的レプリケート間の変動が大きくないかについては解析前に十分確認してください。変動が大きい場合、標準「誤差」と順次誤差伝播を組み合わせて適用するほうが統計的に適切なオプションとなる場合があります。




【FAQ】異なるデータ解析を行ったChIP-seq結果の比較



解析を行う前に、ラボの担当者からデータ処理のパイプラインに何を使用したか、確認してください。論文では多くの場合何を使用したかは言及されていますが、重要なパラメータについて言及されてない場合もあるようです。

一般に、データの有効性を評価するためのいくつかのパラメータがあります。以下の観点からシーケンス品質を定量化します:

  • ピークに含まれるリード数
  • ピーク高さが高く、バックグラウンドが低い
  • シーケンス深度
  • 複雑性の高いライブラリー(重複が少ない)
  • コントロールにおけるターゲットの濃縮が低い
  • レプリケート間で値が相似する
  • 遺伝子同士が近接する

また、ChIP-seqデータを比較するパッケージも存在しますが、注意して使用する必要があります。

典型的にはChIP-seqのバッチ効果は非常に大きく、異なるラボでのデータを比較することは簡単ではありません。実際、同じ研究室であっても昔のデータや昔のシーケンスマシンで得たデータと現在のChIP-seqのデータを単純に比較できないのです。

解析に起因するバイアスを除去するためにも、比較の際はパイプライン処理をもう一度生データから実施し直すことをお勧めいたします。




【FAQ】NGSデータ解析結果の統合について



ChIP-seqおよびRNA-seqデータは、2つのアッセイにおけるランク付け遺伝子及びランク外遺伝子リストの重なりを決定することにより、離散化された方法で統合できます。

近年のアプローチでは、複数の転写因子およびヒストンマークからのChIP-seqデータを、発現量のデータおよびATAC-seqなどのアクセシビリティデータと組み合わせています。

これらのメソッドを統合するために利用できるツールとパイプラインがいくつか存在しています。




【FAQ】ChIP-seqのインプットサンプルのプール



サンプル毎に1つのインプットを使用してシーケンスする方法が最もバイアスの少ないアプローチであるため、未知のサンプルにはこの方法を使用するべきでしょう。

しかしながら、サンプルのゲノム構造がレプリケート間で非常に近いと考えられる場合は、プロジェクトのコストを軽減する観点からインプットをプールすることも考慮できます。




【FAQ】インプットの希釈倍率について



多くの場合、インプットは1%濃度が最適です。

もしインプットのCt値がサンプルと比べてかなり早く立ち上がるようであれば、希釈を変更することももちろん可能です(その場合、計算時に希釈倍率を変更することをお忘れなく)。




【FAQ】レプリケートとN数について



マウスに起こる普遍的な現象を観察したい場合、マウス個体のバラツキを考慮し、複数のマウスから生物学的レプリケートを取得することを推奨します。

ある特定のマウスに生じた特定の現象の場合や、実験手法のバラツキを検証する場合は1匹のマウスから複数の技術的レプリケートを取得したり追加する場合もあります。

また、推奨するレプリケートのN数はChIP-seqで少なくとも2、ChIP-qPCRで少なくとも3です。ChIPは様々な要因から実験間のデータがばらつきやすい実験手法のため、適切なレプリケートを使用してデータを取得し、解析を行ってください。



こちらもご覧ください。