バイオインフォマティクス解析では様々なファイル形式が使用されています。ここでは、主要なファイル形式を紹介します。
- FASTAファイル: 塩基配列やアミノ酸配列を記述するための形式
- FASTQファイル: 塩基配列とそのクオリティスコアをまとめた形式
- SAM/BAMファイル: 配列をマッピングした結果を記述するための形式。
- GTF/GFFファイル: 遺伝子のアノテーション等を記述するためのファイル形式
- BEDファイル: ゲノム上に注釈をつけるための形式
- VCFファイル: 変異検出の結果を記述するための形式
⇒Sequence Alignment/Map Format Specification