擴增子分析QIIME2-2數據導入Importing data

# 激活工做環境
source activate qiime2-2017.8

# 創建工做目錄
mkdir -p qiime2-importing-tutorial
cd qiime2-importing-tutorial
導入帶質量值的測序數據
地球微生物組標準混樣單端數據 「EMP protocol」 multiplexed single-end fastq
此類數據標準包括兩個文件,擴展名均爲fastq.gz,一個是barcode文件,一個是樣品混樣測序文件。
# 建樣品目錄
mkdir -p emp-single-end-sequences

# 下載 barcode文件
wget -O emp-single-end-sequences/barcodes.fastq.gz https://data.qiime2.org/2017.8/tutorials/moving-pictures/emp-single-end-sequences/barcodes.fastq.gz

# 下載序列文件
wget -O emp-single-end-sequences/sequences.fastq.gz https://data.qiime2.org/2017.8/tutorials/moving-pictures/emp-single-end-sequences/sequences.fastq.gz

# 導入QIIME2格式
qiime tools import \
  --type EMPSingleEndSequences \
  --input-path emp-single-end-sequences \
  --output-path emp-single-end-sequences.qza
地球微生物組標準混樣雙端數據 「EMP protocol」 multiplexed paired-end fastq
此類數據標準包括三個文件,擴展名均爲fastq.gz,一個是barcode文件,兩個是樣品混樣測序文件。
# 建樣品目錄
mkdir -p emp-paired-end-sequences

# 下載序列正向和反向文件
wget -O emp-paired-end-sequences/forward.fastq.gz https://data.qiime2.org/2017.8/tutorials/atacama-soils/1p/forward.fastq.gz
wget -O "emp-paired-end-sequences/reverse.fastq.gz https://data.qiime2.org/2017.8/tutorials/atacama-soils/1p/reverse.fastq.gz
 
# 下載barcode文件
wget -O emp-paired-end-sequences/barcodes.fastq.gz https://data.qiime2.org/2017.8/tutorials/atacama-soils/1p/barcodes.fastq.gz
 
# 導入QIIME2格式
qiime tools import \
  --type EMPPairedEndSequences \
  --input-path emp-paired-end-sequences \
  --output-path emp-paired-end-sequences.qza
樣品文件清單格式 「Fastq manifest」 formats
# 下載fastq壓縮包zip文件,其中的樣品文件和清單文件mainfest
wget -O se-33.zip https://data.qiime2.org/2017.8/tutorials/importing/se-33.zip
wget -O se-33-manifest https://data.qiime2.org/2017.8/tutorials/importing/se-33-manifest
wget -O pe-64.zip https://data.qiime2.org/2017.8/tutorials/importing/pe-64.zip
wget -O pe-64-manifest https://data.qiime2.org/2017.8/tutorials/importing/pe-64-manifest
# 解壓fastq樣品文件
unzip -q se-33.zip
unzip -q pe-64.zip
樣品清單是包括樣品名、文件位置、文件方向三列的csv文件,以pe-64-manifest爲例,內容以下:
# 樣品名、文件位置、文件
sample-id,absolute-filepath,direction
sample1,$PWD/pe-64/s1-phred64-r1.fastq.gz,forward
sample1,$PWD/pe-64/s1-phred64-r2.fastq.gz,reverse
sample2,$PWD/pe-64/s2-phred64-r1.fastq.gz,forward
sample2,$PWD/pe-64/s2-phred64-r2.fastq.gz,reverse
導入質量值不一樣編碼的兩類文件Phred33/64 (通常 Phred33比較常見,只有很是老的數據纔有Phred64格式)
# 導入Phred33格式測序結果
qiime tools import \
  --type 'SampleData[SequencesWithQuality]' \
  --input-path se-33-manifest \
  --output-path single-end-demux.qza \
  --source-format SingleEndFastqManifestPhred33
# 導入Phred64格式測序結果
qiime tools import \
  --type 'SampleData[PairedEndSequencesWithQuality]' \
  --input-path pe-64-manifest \
  --output-path paired-end-demux.qza \
  --source-format PairedEndFastqManifestPhred64
導入OTU表Biom文件
BIOM v1.0.0
# 下載數據並導入爲QIIME2的qza格式
wget -O feature-table-v100.biom https://data.qiime2.org/2017.8/tutorials/importing/feature-table-v100.biom
qiime tools import \
  --input-path feature-table-v100.biom \
  --type 'FeatureTable[Frequency]' \
  --source-format BIOMV100Format \
  --output-path feature-table-1.qza
BIOM v2.1.0
wget -O feature-table-v210.biom https://data.qiime2.org/2017.7/tutorials/importing/feature-table-v210.biom
qiime tools import \
  --input-path feature-table-v210.biom \
  --type 'FeatureTable[Frequency]' \
  --source-format BIOMV210Format \
  --output-path feature-table-2.qza
表明性序列 Per-feature unaligned sequence data
wget -O sequences.fna https://data.qiime2.org/2017.8/tutorials/importing/sequences.fna
qiime tools import \
  --input-path sequences.fna \
  --output-path sequences.qza \
  --type 'FeatureData[Sequence]'
多序列比對後的表明性序列導入(多序列比對後的序列中包括減號,表示比對的gap) Per-feature unaligned sequence data
wget -O aligned-sequences.fna https://data.qiime2.org/2017.8/tutorials/importing/aligned-sequences.fna
qiime tools import \
  --input-path aligned-sequences.fna \
  --output-path aligned-sequences.qza \
  --type 'FeatureData[AlignedSequence]'
無根進化樹導入 Phylogenetic trees (unrooted)
wget -O unrooted-tree.tre https://data.qiime2.org/2017.8/tutorials/importing/unrooted-tree.tre
qiime tools import \
  --input-path unrooted-tree.tre \
  --output-path unrooted-tree.qza \
  --type 'Phylogeny[Unrooted]'
相關文章
相關標籤/搜索