锐单电子商城 , 一站式电子元器件采购平台!
  • 电话:400-990-0325

生物入门必须掌握的30个Linux命令

时间:2022-08-30 09:00:00 axt540224连接器

生物入门必须掌握30个Linux命令

学习生物信息,Linux是必须掌握的内容,其实是常用的Linux命令只有30个左右,这些命令都是单词的简写,不难记住。这里列出了30个常用命令。

1、cd

cd:Change directory
修改工作目录,cd和ls应该使用最多的两个命令,特别是对于Linux不熟悉目录结构的用户。

cd /  #进入根目录 cd -  #返回上次目录 cd  #返回home目录 cd ~ #返回home目录 cd ../ # 返回上一级目录 

2、ls

ls:List files

-a  列出包括.a开头的隐藏文件的所有文件 -A  通-a,但不列出"."和".." -l  列出文件的详细信息 -c  根据ctime排序显示 -t  根据文件修改时间排序 ---color[=WHEN] 用颜色识别文件类型 WHEN 可以是'never'、'always'或'auto'其中之一 

3、pwd

print working directory

$pwd /home/wangtong 

4、sh

script
操作脚本的命令,脚本是一个包含许多命令的文件,sh 例如,目录中有一个以上的文件可以运行sh可以一次运行文件。

$ sh a1.index.sh; sh a2.fasqc.sh 

5、cp

cp: Copy file
复制粘贴文件
-b 覆盖前备份
-f 如果存在不询问的情况,强制覆盖
-i 如果存在,询问是否覆盖。
-u 较新才覆盖
-t 将多个源文件移动到统一目录,目录参数在前,文件参数在后

cp a1.index.sh a2.index.sh 

6、mv

mv: Move file
相当于移动文件windows下剪切粘贴,如剪切粘贴在同一目录下,则为重命令。
-b 覆盖前备份
-f 如果存在不询问的情况,强制覆盖
-i 如果存在,询问是否覆盖。
-u 较新才覆盖
-t 将多个源文件移动到统一目录,目录参数在前,文件参数在后

mv a1.index.sh ../ 

7、rm

rm: Remove file
删除文件
-r 删除文件夹
-f 删除不提示
-i 删除提示
-v 详细显示步骤
注意!在命令行模式下删除文件是不可恢复的。

rm -rf *.fna  #删除目录下的一切.fna结尾的文件 

8、ln

ln: Link files
创建包括软连接和硬链接在内的连接文件,相当于软连接windows下面的快捷方式。
-s 建立软连接
-v 显示详细的处理过程

ln -s /ifs1/Example ./ #为/ifs1/Example目录在当前目录下创建了一个快速的方法 

9、vim

vim是Linux系统自带的文本编辑器可以理解为windows系统下的word软件。

:w filename 以指定的文件名保存文章
:wq 保存并退出
:q! 强制退出而不保存
命令行模式功能键
1)插入模式
按「i」切换到插入模式「insert mode」,按"i"进入插入模式后,从光标当前位置输入文件;
按「a」进入插入模式后,从当前光标位置的下一个位置输入文本;
按「o」进入插入模式后,插入新行,从行开始输入文本。

2)从插入模式切换到命令行模式
按「ESC」键。
3)移动光标
vi
键盘上的光标可以直接上下左右移动,但正式的vi用小写英文字母「h」、「j」、「k」、「l」,分别控制光标左、下、上、右移一格。
按「ctrl」 「b」:屏幕往"后"移动一页。
按「ctrl」 「f」:屏幕往"前"移动一页。
按「ctrl」 「u」:屏幕往"后"移动半页。
按「ctrl」 「d」:屏幕往"前"移动半页。
按数字「0」:移到文章的开头。
按「G」:移动到文章的最后。
按「$」:移动到光标所在行"行尾"。
按「^」:移动到光标所在行"行首"
按「w」:光标跳到下一个字的开头
按「e」:光标跳到字尾
按「b」:光标回到上个字的开头
按「#l」:光标移动到银行的第#位置,如:5l,56l。

4)删除文字
「x」:每次,删除光标位置"后面"一个字符。
「#x」:例如,「6x」表示删除光标所在位置"后面"6个字符。
「X」:大写的X,每次,删除光标位置"前面"一个字符。
「#X」:例如,「20X」表示删除光标所在位置"前面"20个字符。
「dd」:删除光标所在行。
「#dd」:从光标所在行开始删除#

5)复制
「yw」:将光标在字尾的字符复制到缓冲区。
「#yw」:将单词复制到缓冲区
「yy」:将光标复制到缓冲区。
「#yy」:例如,「6yy」这意味着从光标所在的银行复制"往下数"6行文字。
「p」:将缓冲区的字符粘贴到光标的位置。注:所有和"y"复制命令必须与"p"复制粘贴功能只有配合才能完成。

6)替换
「r」:更换光标所在地的字符。
「R」:更换光标到哪里的字符,直到按下「ESC」键为止。

7)回复上次操作
「u」:若误执行命令,可立即按下「u」,回到上一个操作。多次按。"u"可执行多次回复。

8)更改
「cw」:将光标所在的字改为字尾
「c#w」:例如,「c3w」换三个字

9)跳到指定的
「ctrl」 「g」列出光标所在行的行号。
「#G」:例如,「15G」,表示移动光标至文章的第15行行首。

10、mkdir

mkdir:Make directory
创建文件夹
-p 递归创建目录,如果父目录不存在,则依次创建
-m 自定义创建目录的权限
-v 显示创建目录的详细信息

mkdir rnaseq #创建一个名为rnaseq的目录 

11、cat

cat: concatenate 连接
cat一个功能是查看文件,一般是较小的文件,行数小于一个屏幕,最多不超过两个屏幕,否则会刷屏;
cat另一个功能是合并多个文件,通常将重定向合并为新文件或将一个文件的内容添加到另一个文件的结尾。

$ cat a1.index.sh  bwa index -p Homo_sapiens_assembly38 -a bwtsw Homo_sapiens_assembly38.fasta 

合并文件

cat a1.txt a2.txt >all.txt 

12、less / more

less和more都是文件查看工具,但是less更多的功能,在windows打开系统下的10G但是在Linux下面很方便,less可以打开非常大的文件,压缩格式也可以直接打开。
-m 显示类似于more命令百分比
-N 显示行号
-S 格式化显示

$ less -S nt.tar.gz 

13、head / tail

这两个命令相对简单,只取一份文件的头尾行数,默认10行,可以添加-n设置,使用管道可以文件中间线。

#取文件第21~40行 $ head -40 a.txt | tail -n 20 

14、g(un)zip/ b(un)zip2

gzip和bzip二是文件压缩工具,默认直接处理源文件,压缩比约为2/3,可设置。
加上un,为unpack意思是解压缩。

$ gzip a.txt $ gunzip a.txt.gz 

15、tar

tar:Tape archive (磁带档案)
tar这是一个复杂的命令,tar因为tar能调用gzip或者bzip2进行压缩,而打包和压缩经常如windows系统合并为一个过程,新手经常混淆两者,
-c 打包文件可以搭配 -v 查看过程中打包的档名(filename)
-t 查看包装档案的内容包含哪些档名,重点是查看『档名』就是了;
-x 可与解包或解压功能相匹配 -C (大写) 解开特定目录
辅选项:
-j 透过 bzip2 压缩/解压缩支持:此时档名最好 *.tar.bz2
-z 透过 gzip 压缩/解压缩支持:此时档名最好 *.tar.gz
-v 在压缩/解压过程中,显示正在处理的文件名!
-f filename -f 后面要立接要被处理的档名!
对于初学者,记住c是creat,创建,x是解包,z对应gzip,j对应bzip2即可,所以常用的命令如下:

$ tar -jcvf filename.tar.bz2 A B C #打包压缩为bz2结尾文件
$ tar -jxvf filename.tar.bz2 # 解压缩.tar.bz2结尾文件

$ tar -zcvf filename.tar.gz A B C #打包压缩为gz结尾文件
$ tar -zxvf filename.tar.gz # 解压缩.tar.gz 结尾文件

16、wc

wc = Word Count
统计一个文件中,行数,单词数,字符数
-l filename 报告行数
-c filename 报告字节数
-m filename 报告字符数
-w filename 报告单词数

17、sort

排序,默认按第一列排序,可以通过-k进行设置;默认排序规则为按ASCII码排序,可以通过-n进行修改;-r取相反方向;
-n 依照数值的大小排序。
-o 将排序后的结果存入指定的文件。
-r 以相反的顺序来排序。
-t 指定排序时所用的栏位分隔字符。
-k 选择以哪个区间进行排序。

18、grep

文本搜索工具,类似于正则表达式搜索,可以在一个大的文件中快速搜索到满足一定规则的内容。

#案例一:统计fasta文件中序列的条数;
grep -c ">"  gene.ffn
#案例二:输出满足条件的序列;
grep -A 2 "3 gi 29732 34486" lastz.axt
#案例三:筛选出不满足条件的内容;
ps -fx | grep -v "S"

19、sed

sed = Stream Editor
流处理器,sed有非常强大的功能.

#案例一:输出固定的行
sed -n '1307p'  seq.fna   #输出文件第1307行;
sed -n '100,200' seq.fna  #输出文件第100到200行;

#案例二:替换操作
sed -e 's/gi/GI/' seq.fna  #将文件中gi全部替换为大写GI;
sed -i 's/gi/GI/g' seq.fna   #在原文件上进行替换,并且进行全部替换;
sed -i.bak 's#GI#gi#' seq.fna  #在原文件上进行替换,并进行备份;
sed -e 's/gi/GI/2;s/ref/REF/2' seq.fna   #只将第二次出现的gi和ref进行替换;
sed -f sed.list cds.list    #根据文件中的模式进行替换,可同时进行多条件替换;
sed -n 's/gi/GI/p' seq.fna  #打印发生替换的行;

#案例三:删除空白行;
sed -e '/^\s*$/d'  seq.fna  #删除文件中的空白行;

#案例四:行寻址
sed -n '/ref/p' seq.fna   #输出文件中包含ref关键字的行;
sed  '100,2000s/GI/gi/g' seq.fa  #则只替换100行到2000行的内容;
sed  '100,2000!s/GI/gi/g' seq.fa  #加感叹号取反,在这个范围之外的执行操作;

#案例五:删除操作
sed -e '/>/d' seq.fna #删除包含ref的行;
sed -e 's/:.*//g' seq.fna   #删除冒号之后的所有内容;

#案例六:对应替换,类似于tr的功能
sed -e 'y/ATCG/atcg/' seq.fna  #修改大小写
sed -e '/>/!y/ATCG/atcg/' seq.fna  #DNA序列反向互补配对,并修改大小写

20、awk

awk也是非常强大的文本处理工具,awk本身也是一门编程语言;

#案例1:输出一个列表任意行;
awk '{print $1}' blast_m8.out  #输出blast m8 格式结果的第一行;
awk -F ":" '{print $1,$NF}' passwd.list   #通过-F修改默认分隔符为冒号,输出第一行与最后一行;

#案例2:格式转换
awk '{print"@" $1"\n"$10"\n""+\n"$11""}' all.sam  #将短序列比对上的reads输出出来,生成fastq文件;

#案例3:过滤blast结果
awk ’{if ($3>=80 && $4>=100) print $0}'  blast_m8.out  #过滤blast比对结果,将identity 大于80,并且比对长度大于100bp的结果输出;

#案例4:比较
awk '$8>$10' input.txt #输出第8列大于第10列的行。

#案例5:匹配输出
awk '$0~ /wang/{print $0}' passwd.list   #利用正则表达式,将秘密表中姓wang的账户都输出出来;

#案例6:格式化输出
awk 'BEGIN{print "The Program Begin\n"}{if ($3>=80 && $4>=100) print $0}END{print " The Program End\n"}' input.txt  #利用BEGIN和END关键字生成报告;

#案例7:修改字段和记录分隔符
awk 'BEGIN{OFS="\t"}{print $2,$4,$5}' input.txt   #在BEGIN中设定字段分隔符和记录分隔符;

#案例8:awk编程计算
awk '{x+=$3}END{print x/NR}' input.txt   #计算第三列的平均值,最后在END将其输出出来。

#案例9:awk编程比较大小
awk   'BEGIN { max=100 ;print "max=" max} {max=($1 >max ?$1:max); print $1,"Now max is "max}' input.txt  #取得文件最后一个域的最大值。 

#案例10:awk编程求和
awk '{print $0,$3+$4}' input.txt  #计算第3列和第4列的和。

#案例11:输出固定行内容
awk 'NR>=20&&NR<=80' input.txt  #输出第20到第80行内容。

#案例12:合并文件
awk 'BEGIN{while((getline<"file1")>0)l[$1]=$0}$1 in l{print $0"\t"l[$1]}' file2  #将两个文件按列合并起来,类似jion命令的功能。

#案例13:去重复
awk '!($0 in a) {a[$0];print}' input.txt  # 打印不重复的行,类似uniq的功能;
awk '!($2 in l){print;l[$2]=1}' input.txt #计算第二列内容非冗余的次数,类似于uniq的功能;

#案例14:统计字符
awk '{for(i=1;i!=NF;++i)c[$i]++}END{for (x in c) print x,c[x]}' input.txt 计算每个字符出现的次数,类似wc的功能。

#案例15:替换
awk '{sub(/test/, "no", $0);print}' input.txt 进行替换,类似sed的功能,

#案例16:fastq转换为fasta
awk '{getline seq;getline plus;getline qual;sub("@",">",$0);print $0 "\n"seq}'  test.fastq;

21、df

df: disk free
df用于查看磁盘消耗,显示磁盘可用空间数目信息及空间结点信息。一般加一个-h选项,然后接要查看的磁盘,默认所有磁盘。
-a 显示全部文件系统
-h 文件大小友好显示
-l 只显示本地文件系统
-i 显示inode信息
-T 显示文件系统类型

$ df -h 
Filesystem               Size  Used Avail Use% Mounted on
/dev/mapper/centos-root  5.5T  742G  4.7T  14% /
devtmpfs                 126G     0  126G   0% /dev

22、du

du: Disk usage
df用于查看磁盘大小,du用于查看目录所占磁盘大小,一般也加-h选项
-h 方便阅读的方式
-s 只显示总和的大小

$ du -sh wgs/
27G    wgs/

23、find

find顾名思义,主要用于查找文件。因为当文件越来越多的时候,由于Linux是文本界面,不方便可视化文件,这个时候就可以利用find快速找到需要的文件。find支持多种搜索方式。

  1. 与时间有关的选项:共有 -atime, -ctime 与 -mtime 和-amin,-cmin与-mmin,以 -mtime 说明
  2. 与使用者或组名有关的参数:
  3. 与档案权限及名称有关的参数:
  4. 额外可进行的动作:

24、which

which 可执行文件名称 | 查看可执行文件的位置,在PATH变量指定的路径中查看系统命令是否存在及其位置

#案例一:搜索Data目录下以点fna结尾的文件;
find  ../Data -name *.fna

#案例二:搜索系统中最近5分钟内编辑过的文件;
find / -amin 5

#案例三:查找大于100M的文件;
find ./ -size 100M

案例四:按照文件类型搜索;
find  ./ -type 文件类型
c 的档案
d: 目录 
b: 区块装置档案 ,
p: 具名贮列
f: 一般档案
l: 符号连结
s: socket

#案例五:搜索文件,直接处理;
find ./temp/ -name *.fna -exec rm '{}' \;

25、top

top可以动态显示系统进程使用情况,类似于windows系统的任务管理器。可以
显示当前系统正在执行的进程的相关信息,包括进程ID、内存占用率、CPU占用率等。

$ top
top - 21:57:57 up 64 days, 14:32,  4 users,  load average: 1.03, 1.03, 1.05
Tasks: 413 total,   2 running, 411 sleeping,   0 stopped,   0 zombie
%Cpu(s):  3.2 us,  0.1 sy,  0.0 ni, 96.7 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
KiB Mem : 26346684+total, 49366600 free, 10640988 used, 20345926+buff/cache
KiB Swap: 33554428 total, 31772892 free,  1781536 used. 24733774+avail Mem 

   PID USER      PR  NI    VIRT    RES    SHR S  %CPU %MEM     TIME+ COMMAND                                                  
316997 wangtong  20   0 6076392   5.7g    804 R  99.7  2.3   9074:52 dnaml                                                    
451916 root      20   0  162244   2620   1576 R   0.7  0.0   0:00.05 top                                                      
    19 root      rt   0       0      0      0 S   0.3  0.0   0:20.10 watchdog/2                                               
   754 root      20   0  159156  97984  97640 S   0.3  0.0  73:10.61 systemd-journal  

26、ps

ps: process status
ps也是系统进程管理工具,与top不同的事,top可以动态显示,而ps则是静态显示,是某一时刻的快照,静态显示的好处是便于其他程序捕获结果,进行处理。
a 显示所有的进程
-a 显示同一终端下的所有程序
e 显示环境变量
f 显示进程间的关系
-H 显示树状结构
r 显示当前终端的程序
T 显示当前终端的所有程序
-au 显示更详细的信息
-aux 显示所有包含其他使用者的行程
-u 指定用户的所有进程

$ ps -aux

27、kill

kill的作用是杀死进程,给定一个任务的ID号,可以通过top或者ps命令获得,例如当前有一个sleep进程,pid号为12000;通过kill -9可以强制杀死。

$ kill -9 12000

28、chmod

chmod: Change mode
用于修改文件权限,Linux基础怒权限可以包括ugo模式以及421模式。

'wrx’三种权限

#原始权限
$ ll a1.index.sh 
-rwxr-xr-x. 1 root root 287 Oct 16 16:05 a1.index.sh
#421模式修改
$ chmod 644 a1.index.sh 
$ ll a1.index.sh 
-rw-r--r--. 1 root root 287 Oct 16 16:05 a1.index.sh
#ugo模式修改
u:user; g:group; o:other

$ chmod ug+x a1.index.sh 
$ ll a1.index.sh 
-rwxr-xr--. 1 root root 287 Oct 16 16:05 a1.index.sh

与之类似的还有chown与chgrp;
chown: Change owner
chgrp: Change group

29、passwd

passwd 修改密码,Linux密码要求大写字母开头,包含字母与数字组合,不能过于简单。
-l 使密码失效
-u 与-l相对,用户解
-S 列出登陆用户passwd文件内的相关参数
-n 后面接天数,shadow 的第 4 字段,多久不可修改密码天数
-x 后面接天数,shadow 的第 5 字段,多久内必须要更动密码
-w 后面接天数,shadow 的第 6 字段,密码过期前的警告天数
-i 后面接『日期』,shadow 的第 7 字段,密码失效日期

$ passwd
Changing password for user wangtong.
Changing password for wangtong.
(current) UNIX password: 
New password: 
Retype new password:

30、exit

退出登录,不要小看这个exit,exit是正确退出,最好不要直接点windows关闭窗口按钮退出,也不要使用ctrl+D给定退出信号退出。

总结

以上只是学习生物信息的基本掌握的一些命令,已经可以完成绝大部分的工作了,当然,技不压身,如果掌握更多的命令可以更好的完成工作。

锐单商城拥有海量元器件数据手册IC替代型号,打造电子元器件IC百科大全!

相关文章