AWK怎么提取所有基因位置信息
更新:HHH   时间:2023-1-7


这篇文章主要介绍了AWK怎么提取所有基因位置信息的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇AWK怎么提取所有基因位置信息文章都会有所收获,下面我们一起来看看吧。

从基因组注释信息GFF文件中提取所有基因位置信息

gff文件当中存储了基因组当中所有基因的注释信息,如果想得到基因组当中所有基因的位置信息可以利用awk命令批量的提取,命令如下:

$ grep -v '#' Arabidopsis_thaliana.TAIR10.41.gff3|awk -F "[\t=:;]" 'BEGIN{OFS="\t"}$3=="gene"{print $1,$4,$5,$10}' |head
1       3631    5899    AT1G01010
1       6788    9130    AT1G01020
1       11649   13714   AT1G01030
1       23121   31227   AT1G01040
1       31170   33171   AT1G01050
1       33365   37871   AT1G01060
1       38444   41017   AT1G01070
1       44970   47059   AT1G01080
1       47234   49304   AT1G01090
1       49909   51210   AT1G01100

关于“AWK怎么提取所有基因位置信息”这篇文章的内容就介绍到这里,感谢各位的阅读!相信大家对“AWK怎么提取所有基因位置信息”知识都有一定的了解,大家如果还想学习更多知识,欢迎关注天达云行业资讯频道。

返回开发技术教程...