來源:知乎—如何自學生物資訊學 在生物資訊的坑裡面呆了好幾年,發現生物資訊的定義越來越模糊了,就像我剛入行的時候一個師兄對我說的那樣,中關村賣電腦的如果賣給學生物的了,就說自己是做生物資訊的。 同樣,我現在在寫一些軟體,設計一些算法,也說自己是做生物資訊的。 資訊系一些做體系結構和GPU編程的也會做一些生物資訊的硬件加速算法,他們也說自己是做生物資訊的,畢竟文章都發到了Bioinformatics雜誌上了。 如果你想學生物資訊中的算法設計,那恭喜你,加州大學聖地牙哥分校的一系列課程正合你的胃口,Coursera - Free Online Courses From Top Universities 。這些算法包括字符串算法,圖論算法,隨機化算法等等。 你的提問中發現你想學習如何處理數據。 這也是生物資訊的另一個教派,整合已經發表的軟體處理數據,也說自己是做生物資訊的,我想你可能想點這個技能點。有點複雜,因為生物有太多研究方向了,做基因的,做蛋白的,做進化的,做結構的,做發育的。每個分支又發表了很多軟體,而且很多不好用,好用的有些又過時了,沒過時的準確率也不見得有多高。 如果你能給我一個你的研究方向,我可以給你介紹一些很好用的軟體。 用軟體有幾個挺麻煩的問題,有些軟體安裝很麻煩,依賴程序庫很多,這個東西說實在的如果你沒有編譯背景有時候碰到了很難搞定,簡單的辦法就是直接給作者發郵件,一般作者想讓自己軟件的引用率高,所以發郵件都是秒回,如果作者博士畢業了,忽略此條。所以新的軟體,作者必回郵件。 用軟體另一個問題就是參數怎麼設置,這個其實挺麻煩的,因為有時候你要理解背後的算法,可是這個對於學生物的同學來說太難了,這個其實是軟體用戶體驗不好,軟體作者閉門造車。Bioinformatics上還有很多文章說參數怎麼選的,比如基因組拼接的時候,kmer的選取。 軟體使用講完了,有些格式轉化,pipeline的,可能一個軟體做不了,就要你寫點腳本來完成這些事情,如果你只是想完成這點東西,那麼學python就足夠了,一個簡明的python教程就是dive into python。網上免費。 先寫這麼多,有時間了再補充和整理。 ———————————————————————————— 加一個彩蛋,昨晚party和一個學數學的人聊天: 大神:做什麼...
留言
張貼留言