最近在Quora上看到一个问答题目,关于在高效率Linux用户节省时间Tips。
将该题目的回答进行学习总结,加上自己的一些经验,记录如下,方便自己和大家参考。
下面介绍的都是一些命令行工具,这些工具在几位回答者的日常工作中都很有用。
对于任何不了解的命令,请使用“man <COMMANDNAME>“查看,或者使用Google。
有些命令需要先用 yum, apt-get install 命令安装。
1 基本命令
执行方式 sh nopasswd USER REMOTE_HOST
执行此脚本前,请确认:
本机上已有 id_dsa.pub ,若无。 使用命令 ssh-keygen -t dsa 获得。
远程机上登录用户家目录下,已经有 .ssh 文件夹,若无创建之。
$ cat nopasswd #!/bin/sh scp ~/.ssh/id_dsa.pub $1@$2:~/ ssh $1@$2 " touch ~/.ssh/authorized_keys ; cat ~/id_dsa.pub >> ~/.ssh/authorized_keys; chmod 644 ~/.ssh/authorized_keys; exit"
熟悉Bash中常用的任务管理命令&,Ctrl-Z,Ctrl-C,jobs,fg,bg,kill 等。基本的文件管理命令ls, ls-l, less, head, tail, tail -f, ln, ln -s, chmod, chown, du, du -sk *, df, mount基本的网络管理命令ipconfig, ifconfig, dig熟悉正则表达式,以及 grep,egrep用到的选项-o, -A, -B软件安装命令了解apt-get 和 yumcat -n可以帮助显示行号。
2 一些表达式
3 日常使用命令
find . -name \*.py | xargs grep some_function cat hosts | xargs -l {} ssh root@{} hostname
pstree -p打用进程树的得力工具pgrep,pkill使用名字查找进程,或者直接向指定名字的进程发送信号。
了解用户能发送给进程的一些信号。比如 kill -STOP [pid] ,让pid进程挂起。
nohup,disown,screen, tmux当你需要将进程永远处在后台运行是,这两个命令很有用。lsof, netstat -lntp查询当前什么进程在监听什么端口。set在bash脚本中, 使用 set -x 获得debug输出,使用 set -e 获得错误输出。;分号用于开启一个子shell并运行至结束后关闭。 例如:
#在当前路径下执行一些命令 (cd /some/other/dir; other-command) # 工作路径仍然是当前目录
了解shell中的多种参数表达式${name:?error message}检查某个变量是否存在,若不存在输出 error message。${var%suffix}, ${var#prefix}输出var变量除前缀或者后缀外的部分。如下面的代码输出为foo.txt.
var = foo.pdf echo ${var%pdf}.txt
<,>输入输出重定向操作。some_command > logfile 2>&1将 some_command 运行过程中的标准输出和标准错误输出都输出到文件logfile中。man ascii获得一个好用的ASCII表格,包含10进制和16进制的值。screen,dtach在远程ssh绘画中,使用这两个命令可以保存你的会话,避免因为网络问题导致中断。curl, curl -l, wget在web页面调试中,这几个命令能帮你下载网页代码,很有用。lynx -dump -stdin将HTML转换为文本xmlstarlet需要处理XML时,这个命令很有用。ssh -L, ssh -D需要利用远程服务器访问网页时,这命令可以帮助你在远程服务器和你的机器之间建立ssh 隧道。ssh连接优化如下配置能帮你避免链接丢失,不需要每次都输入yes确认和远程服务器的链接,以及在链接中启用压缩。建议将它放到.ssh/config中。
TCPKeepAlive=yes ServerAliveInterval=15 ServerAliveCountMax=6 StrictHostKeyChecking=no Compression=yes ForwardAgent=yes
在正输入的命令前加#命令已经输入一半,忽然间改主意想少收运行时,
可以使用 Alt-# 在命令前加‘#’,将整个命令变成注释。这样你稍后就能在命令历史中找到该命令了。cron可以帮助你制定一些定时执行的计划任务。Ctrl-S Ctrl-C将一不小心需要大量输出文本时,依次输入这两个操作,
比单纯的频繁按Ctrl-C能更快让程序终止。
4 数据处理
如下几个命令可以快速的实现一些集合操作。
cat a b | sort | uniq > c # c is a union b cat a b | sort | uniq -d > c # c is a intersect b cat a b b | sort | uniq -u > c # c is set difference a - b
使用LC_ALL=CLinux中有关locale的设置会影响大量的命令行工具,其中包括排序工具。
多数安装的Linux系统都将LANG或者其他的locale默认设置成US English。
但这可能会导致排序及其他命令慢上好几倍。
因此export LCALL=C能避免使用i18n形式处理数据,带来性能提升。awk,sed这两个工具能实现复杂的数据替换和修改。
例如,下面的命令实现对文本文件中低三列的数据求总和。
使用shell完成此运算比用Python快3倍。
awk '{ x += $3 } END { print x }'
shuf该命令可以从将一个文件中的行混洗,或者从中随机选出一些行。sort了解sort的常用选项(-t,-k, -s)如何工作。 注意-k1,1只会排序第一列,
而-k1会根据整个行排序。 -s能实现稳定排序。
例如,先使用第二个域排序,再按照域一排序,可以用这段命令实现
cat INPUT_FILE | sort -k1,1 | sort -s -k2,2
制表符的输入在bash的命令行中,如若需要输入制表符,可以使用 Ctrl-V <tab> 或者 $’\t’ 实现hd,bvi对于二进制文件,这两个命令分别实现16进制抽取,二进制编辑操作。string,grep可以帮助在二进制文件中寻找文本。iconv,uconv可以帮助转换文本编码split,csplit分别可以实现将文件按照大小分割,以及按照特定的模式分割。
5 系统调试
这能帮你对系统正在发生的情况有个第一认识。free,vmstat如果想了解内存的状态,这两个命令很重要。
其中cached是Linux内核中文件缓存的大小。kill -3 <pid>在调试Java程序时,使用此命令,可以在stderr/logs中找到完整的stack trace,
堆信息(包含垃圾收集的细节).mtr,traceroute能够帮忙找到网络问题,前者比traceroute更好用。iftop,nethogs这两个命令可以办刚找出哪个端口或者进程占用了多少网络带宽。ab,siege这个Apache自带的工具能帮助快速检查web服务器的性能。wireshark,tshark是进行更高级的网络调试的得力工具。strace,ltrace这两个命令能帮你在一无所知的情况下,对程序运行失败,假死,崩溃等问题带来一些线索。
另外,他们还能帮忙发现一些性能问题。比如 -c选项可以做profiling;
-p选项可以挂到某个指定的进程上。ldd检查共享库的情况gdb了解如何利用GDB连接到一个正在运行的进程,并且得到其stack trace。/proc/在做现场调试的时候很有用。比如 /proc/cpuinfo, /proc/XXX/cwd, /proc/XXX/exe, /proc/XXX/fd/, /proc/XXX/smapssar在需要判断为何过去某个时间系统会出错时,这个命令能显示CPU,内存和网络的历史情况。stap, perf当需要更深的分析系统,以及性能情况时,这两个工具很有用。dmesg当系统出现一些很翻唱的现象时,比如可能是硬件或驱动问题时,这个很管用。