4/5/2017html
linux:python
仍是跟3月份的教程是同樣的,不過學到了day2了linux
剛開始看了下fastq的格式(如今是幾乎全部的illumina測序平臺的通用格式了),而後fastq一個數據有有4行,分別是ID,序列讀長,+,和對應的測序質量。這些都是能夠在百度或者谷歌搜到的(下次準備單獨更新市面上的測序格式)編程
常見的fastq格式的命令windows
zcat filename | grep ^*** | wc -l 以***開頭的有多少行服務器
| less 查看具體的數據less
| head -n 4000 > top_1000.fastq 將前4000行截下來,而後保存(注意,因爲一個讀長數據佔的是4行,因此咱們只能得到1000個數據)函數
| tail -n 4000 > bottom_1000.fastqpost
而後學習了paste命令,最經常使用的就是學習
zcat filename.fastq.gz | paste - - - -(這裏的「-」之間是有空格的!!!!),而後就能把原來4行的fastq一個數據變成了以一個4列格式顯示。(若是不是很懂這個命令,能夠先用ls | paste - -先試試)
zcat filename.fastq.gz | paste - - - - | head -n 1000 > top_1000.txt(這裏,因爲4行變一行,因此只須要取前1000行便可)
具體的paste的用法可見,http://logo32.iteye.com/blog/1316299
而後初步地學習了linux的大殺器-awk編程
但光看那個手冊不是很懂。。。我以爲我得找本資料或者書去看看。。。。。忽然感受我要從入門到放棄了。。
暫定這個網站:http://www.zsythink.net/archives/tag/awk/
4/8/2017
linux:
學習了評估illumina數據的質量(先前已經有過一篇了,可見3月份的生物信息學-教學------ 用FastQC檢查二代測序原始數據的質量,不過那篇是轉載的)
上面提到了windows下跑很慢,由於你得鏈接到fastqc的服務器上,因此仍是linux下跑比較快。
python:
學習了字符串的轉化,初步瞭解了下元祖(tuple)
學習了python的類型轉化,int(),float(),str(),bool()--待學
瞭解了下函數,本身寫了個弱雞函數,注意def sayHello():-----()和:都不能少,下面的tab縮進!!也不能少,還有不能在定義的函數裏面再調用自身。
而後仍是決定用筆,紙記筆記了,趙奶奶貌似之前說過抄程序其實也是有幫助的。
4/10/2017
python:
學習了python的加參數
4月的事應該忙完了,應該能夠抽出時間來學習編程了,接下來要把R語言也加上了。
4/11/2017
python:
學習了函數的簡單使用,大體跟VB仍是差很少。但要注意,python的函數是要有返回值的,即return,若是沒有返回值,會獲得一個None的對象,具體也能夠見
https://www.zhihu.com/question/23765556/answer/25592016
http://www.iplaypy.com/jinjie/return.html
這兩篇綜合起來看
cross 先生最後說到:函數能夠把某個功能的代碼分離出來,在須要的時候重複使用,就像拼裝積木同樣,這會讓程序結構更清晰。讓我忽然感受其實函數跟合成生物學有點類似,都是把一類東西封裝了,想用的時候拿出來用就好了
4/13/2017
python:
學了if,else,elif。大體跟VB仍是同樣,有點明白return這個東西了。
感受最近愈來愈忙了。。。。。
4/22/2017python:
學了list相關的內容,學了索引,還學了切片。注意切片的話,開始位置包含在切片裏面,結束位置不包含。