常見Linux面試題

一、 經常使用的Linux命令

1)文件操做

cat、vi、vim、ls、mkdir、touch 、cp、mvjavascript

查找是否存在該文件名:java

find / -name mysql

cat:一次性顯示文件內容node

2)日誌

tail -f /var/www/MOB_logs/catalina.2018-05-18.out

抓取關鍵字:mysql

cat catalina.2019-03-20.out | grep "返回respData"
grep -i "返回respData" catalina.2018-06-11.out

3)解壓

tar -zxvf filename.tar.gz

4)查找進程

ps -aux|grep java

5) 系統、內存、磁盤、網絡相關

​ top 查看內存、cpu狀況linux

​ du、df 查看磁盤、文件大小面試

du -s -h /data/

​ ping、curl 查看網絡是否正常sql

6)權限相關

chmod:修改文件的權限apache

chown:即change owner,修改文件和目錄的全部者權限vim

chattr:chmod的底層操做,鎖定文件centos

二、 系統緩慢的緣由,或者忽然很卡

  • Full GC次數過多
  • CPU 太高
  • 接口耗時、HTTP請求過多,響應慢。(比較經典)
  • 死鎖(Blocke)
  • 某個線程進入WAITTING,sleep、wait時間過長,假死。

CPU 太高、Full GC次數過多、內存使用過多、硬盤空間不足等問題,都會帶來系統忽然運行緩慢的問題,也是面試特別容易被問到的,下面針對系統運行緩慢等問題進行展開。

這又引伸出兩個問題:

CPU利用率和負載的問題。

CPU利用率顯示的是程序在運行期間實時佔用的CPU百分比;cpu使用率反映的是當前cpu的繁忙程度,忽高忽低的緣由在於佔用cpu處理時間的進程可能處於io等待狀態但卻還未釋放進入wait。

CPU負載是指某段時間內佔用cpu時間的進程和等待cpu時間的進程數,這裏等待cpu時間的進程是指等待被喚醒的進程,不包括處於wait狀態進程。

CPU利用率高,並不意味着CPU的負載大。二者之間沒有必然的關係。

CPU負載很高怎麼辦?

能夠經過 ps -axjf查看STAT這一列是否存在 D 狀態進程

好比:

[root@VM-8-8-centos proc]# ps -axjf
 PPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND
    0     2     0     0 ?           -1 D        0   0:00 [kthreadd]
    2     4     0     0 ?           -1 S<       0   0:00  \_ [kworker/0:0H]
    2     6     0     0 ?           -1 D        0   0:10  \_ [ksoftirqd/0]
    2     7     0     0 ?           -1 S        0   0:00  \_ [migration/0]
D 狀態是指不可中斷的睡眠狀態。該狀態的進程沒法被 kill,也沒法自行退出。只能經過恢復其依賴的資源或者重啓系統來解決。

負載高,比如節假日的高速公路堵車,馬路都是車,已經阻塞了,收費站外面還有不少車在等着,解決方法就是多建一條高速公路,提高服務器的硬件性能,或者找出I/O等待的任務,手動處理。

負載高常見的緣由有:

  • 磁盤讀寫請求過多
  • MySQL死鎖或者查詢返回慢
  • 硬盤故障,讀寫請求獲取不到資源

若是CPU很高,請看下面:

三、 線上 CPU 爆高 接近100%,怎麼排查?

1)使用 top 命令

而後鍵盤按 1 表示進入第1個CPU(若是是多核須要分別查看不一樣的CPU)

演示:

[root@VM-8-8-centos ~]# top
top - 23:17:16 up  7:54,  1 user,  load average: 1.73, 1.70, 1.71
Tasks:  95 total,   1 running,  94 sleeping,   0 stopped,   0 zombie
%Cpu(s): 50.0 us, 50.0 sy,  0.0 ni,  0.0 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
KiB Mem :  1882056 total,    69588 free,  1255116 used,   557352 buff/cache
KiB Swap:        0 total,        0 free,        0 used.   478816 avail Mem

  PID USER      PR  NI    VIRT    RES    SHR S %CPU %MEM     TIME+ COMMAND
 1953 root      20   0  101080   2248   1732 S  0.3  0.1   0:01.89 YDLive
 2310 root      20   0 2369316 246988  13760 S  0.3 13.1   0:22.47 java
 5082 root      20   0  154808  10500   3248 S  0.3  0.6   0:11.14 YDService
    1 root      20   0   43444   3872   2580 S  0.0  0.2   0:01.27 systemd
    2 root      20   0       0      0      0 S  0.0  0.0   0:00.00 kthreadd
    4 root       0 -20       0      0      0 S  0.0  0.0   0:00.00 kworker/0:0H
    5 root      20   0       0      0      0 S  0.0  0.0   0:00.07 kworker/u2:0
    6 root      20   0       0      0      0 S  0.0  0.0   0:00.02 ksoftirqd/0
    7 root      rt   0       0      0      0 S  0.0  0.0   0:00.00 migration/0

看到右上角:

load average: 1.73, 1.70, 1.71

load average後面的三個數分別是1分鐘、5分鐘、15分鐘的負載狀況。 指的是處於可運行狀態和不可中斷狀態的平均進程數。數字越大,CPU負載越大。

若是 小於 CPU數 * 每一個CPU的核心數 , 則表示負載是合理的,好比上面個人服務器 CPU 是1個,只有1個核心,那麼如今1.7的負載大於1,就很不合理了,證實有不少任務在等待中。

如何查CPU和CPU核心?

查看CPU數目:

cat /proc/cpuinfo | grep "model name"

查看CPU核心:

cat /proc/cpuinfo | grep "cpu cores"

演示:

[root@VM-8-8-centos ~]# cat /proc/cpuinfo | grep "model name"
model name      : AMD EPYC 7K62 48-Core Processor
[root@VM-8-8-centos ~]# cat /proc/cpuinfo | grep "cpu cores"
cpu cores       : 1

2)鍵盤按下 x

按下 x,就會把CPU使用狀況排序,找到CPU太高的pid,以pid 19505爲例,

而後看一下這個pid的線程狀況:

ps -mp 19505 -o THREAD,tid,time

演示:

[root@VM_0_12_centos ~]# ps -mp 19505 -o THREAD,tid,time   
USER     %CPU PRI SCNT WCHAN  USER SYSTEM   TID     TIME
root      0.0   -    - -         -      -     - 04:03:21
root      0.0  19    - futex_    -      - 19505 00:00:00
root      0.0  19    - futex_    -      - 19507 00:00:08
root      0.0  19    - futex_    -      - 19508 00:00:01
root      0.0  19    - futex_    -      - 19509 00:47:56
root      0.0  19    - futex_    -      - 19510 00:00:00
root      0.0  19    - futex_    -      - 19511 00:00:00
root      0.0  19    - futex_    -      - 19512 00:00:00
root      0.0  19    - futex_    -      - 19513 00:07:45
root      0.0  19    - futex_    -      - 19514 00:00:00
root      0.0  19    - futex_    -      - 19515 00:00:00
root      0.0  19    - futex_    -      - 19516 00:00:00
root      0.0  19    - futex_    -      - 19517 00:00:00
root      0.0  19    - futex_    -      - 19518 00:01:33
root      0.0  19    - futex_    -      - 19519 00:01:21
root      0.0  19    - futex_    -      - 19520 00:00:00
root      0.0  19    - futex_    -      - 19521 02:23:05
root      0.0  19    - futex_    -      - 19539 00:00:00
root      0.0  19    - futex_    -      - 19540 00:00:00
root      0.0  19    - futex_    -      - 19576 00:05:10

或者使用如下命令

top -Hp 19505 -d 1 -n 1

都是同樣的,

3)把tid (線程id )轉成 16進制

tid 19507 爲例

printf "%x\n" tid

演示:

[root@VM_0_12_centos ~]# printf "%x\n" 19507
4c33

4)查看 tid 4c31 線程堆棧狀況:

只查看前30行

jstack 19505 |grep tid -A 30

演示:

[root@VM_0_12_centos ~]# jstack 19505 |grep 4c33 -A 30 
"DestroyJavaVM" #36 prio=5 os_prio=0 tid=0x00007fbb3800a000 nid=0x4c33 waiting on condition [0x0000000000000000]
   java.lang.Thread.State: RUNNABLE

"http-nio-8848-Acceptor-0" #34 daemon prio=5 os_prio=0 tid=0x00007fbb3820e800 nid=0x4cb2 runnable [0x00007fbaff268000]
   java.lang.Thread.State: RUNNABLE
        at sun.nio.ch.ServerSocketChannelImpl.accept0(Native Method)
        at sun.nio.ch.ServerSocketChannelImpl.accept(ServerSocketChannelImpl.java:422)
        at sun.nio.ch.ServerSocketChannelImpl.accept(ServerSocketChannelImpl.java:250)
        - locked <0x00000000f2a67c30> (a java.lang.Object)
        at org.apache.tomcat.util.net.NioEndpoint.serverSocketAccept(NioEndpoint.java:448)
        at org.apache.tomcat.util.net.NioEndpoint.serverSocketAccept(NioEndpoint.java:70)
        at org.apache.tomcat.util.net.Acceptor.run(Acceptor.java:95)
        at java.lang.Thread.run(Thread.java:748)

"http-nio-8848-ClientPoller-0" #33 daemon prio=5 os_prio=0 tid=0x00007fbb38f21000 nid=0x4cb1 runnable [0x00007fbaff369000]
   java.lang.Thread.State: RUNNABLE
        at sun.nio.ch.EPollArrayWrapper.epollWait(Native Method)
        at sun.nio.ch.EPollArrayWrapper.poll(EPollArrayWrapper.java:269)
        at sun.nio.ch.EPollSelectorImpl.doSelect(EPollSelectorImpl.java:93)
        at sun.nio.ch.SelectorImpl.lockAndDoSelect(SelectorImpl.java:86)
        - locked <0x00000000f2a67e60> (a sun.nio.ch.Util$3)
        - locked <0x00000000f2a67e70> (a java.util.Collections$UnmodifiableSet)
        - locked <0x00000000f2a67e18> (a sun.nio.ch.EPollSelectorImpl)
        at sun.nio.ch.SelectorImpl.select(SelectorImpl.java:97)
        at org.apache.tomcat.util.net.NioEndpoint$Poller.run(NioEndpoint.java:743)
        at java.lang.Thread.run(Thread.java:748)

"http-nio-8848-exec-10" #32 daemon prio=5 os_prio=0 tid=0x00007fbb38229800 nid=0x4cb0 waiting on condition [0x00007fbaff46a000]
   java.lang.Thread.State: WAITING (parking)
        at sun.misc.Unsafe.park(Native Method)
        - parking to wait for  <0x00000000f2a68030> (a java.util.concurrent.locks.AbstractQueuedSynchronizer$ConditionObject)

四、 查看垃圾回收GC的狀況,包括fullGC次數和耗時

1)查看

ps -aux|grep java

假如pid是19505

2)使用jstat -gc或者 jstat -gcutil 查看空間使用狀況

[root@VM_0_12_centos ~]# jstat  -gc 19505
 S0C    S1C    S0U    S1U      EC       EU        OC         OU       MC     MU    CCSC   CCSU   YGC     YGCT    FGC    FGCT     GCT   
 0.0   1024.0  0.0   1024.0 72704.0   8192.0   57344.0    45449.8   73168.0 70119.8 8708.0 8169.9    214    7.855   0      0.000    7.855
[root@VM_0_12_centos ~]# jstat  -gcutil 19505
  S0     S1     E      O      M     CCS    YGC     YGCT    FGC    FGCT     GCT   
  0.00 100.00  12.68  79.26  95.83  93.82    214    7.855     0    0.000    7.855

參數解析

S0 — Heap上的 Survivor space 0 區已使用空間的百分比
S1 — Heap上的 Survivor space 1 區已使用空間的百分比
E — Heap上的 Eden space 區已使用空間的百分比
O — Heap上的 Old space 區已使用空間的百分比
P — Perm space 區已使用空間的百分比
YGC — 從應用程序啓動到採樣時發生 Young GC 的次數
YGCT– 從應用程序啓動到採樣時 Young GC 所用的時間(單位秒)
FGC — 從應用程序啓動到採樣時發生 Full GC 的次數
FGCT– 從應用程序啓動到採樣時 Full GC 所用的時間(單位秒)
GCT — 從應用程序啓動到採樣時用於垃圾回收的總時間(單位秒)

上下文切換

頻繁上下文,會帶來性能問題

五、查內存使用狀況

於Linux/Unix系統內存佔用的百分比,無須過於關心,通常大於90%都是屬於正常狀況~

1)使用free查看內存使用狀況

[root@VM_0_12_centos ~]#  free -h
              total        used        free      shared  buff/cache   available
Mem:           1.8G        862M         69M        600K        906M        806M
Swap:            0B          0B          0B

2)釋放內存

  • 先 執行 sync
[root@VM_0_12_centos ~]# sync

(描述:sync 命令運行 sync 子例程。若是必須中止系統,則運行sync 命令以確保文件系統的完整性。sync 命令將全部未寫的系統緩衝區寫到磁盤中,包含已修改的 i-node、已延遲的塊 I/O 和讀寫映射文件)

  • 修改drop_caches 參數

drop_caches的詳細文檔以下:

aTo free pagecache: 清空 頁面 高速緩存

echo 1 > /proc/sys/vm/drop_caches

bTo free dentries and inodes: 清空 目錄項 和 索引節點

echo 2 > /proc/sys/vm/drop_caches

cTo free pagecache, dentries and inodes: 清空以上兩項

echo 3 > /proc/sys/vm/drop_caches

我這裏演示試一下執行:

echo 3 > /proc/sys/vm/drop_caches

而後再查看內存狀況:

[root@VM_0_12_centos ~]# free -h
              total        used        free      shared  buff/cache   available
Mem:           1.8G        862M        904M        600K         71M        856M
Swap:            0B          0B          0B

結果:free 和 available 變大了,buff/cache 變小了,有效的釋放了buffer和cache。

六、 查硬盤使用狀況

df

[root@VM_0_12_centos ~]# df -hl
Filesystem      Size  Used Avail Use% Mounted on
/dev/vda1        50G   14G   34G  29% /
devtmpfs        909M     0  909M   0% /dev
tmpfs           920M     0  920M   0% /dev/shm
tmpfs           920M  620K  919M   1% /run
tmpfs           920M     0  920M   0% /sys/fs/cgroup
tmpfs           184M     0  184M   0% /run/user/0

du

[root@VM_0_12_centos ~]# du -h heap 
147M    heap

非遞歸查目錄大小,方便查看整體狀況:

[root@VM_0_12_centos ~]#  du -s -h /root
1.3G    /root

知道目錄的佔用大小,就能夠進行清理了。

七、 怎麼殺死進程?

通常狀況下,終止一個前臺進程使用 Ctrl + C 就能夠了。對於一個後臺進程就須要用 kill 命令來終止。
咱們會先使用 ps、top 等命令得到進程的 PID,而後使用 kill 命令來殺掉該進程。

例如:

ps -aux|grep java

找到 java的線程id

kill -9 3827

八、linux vm內核參數優化設置

1)CPU

使用 uptime查看CPU使用狀況

[root@VM_0_12_centos ~]# uptime
 17:03:41 up 307 days,  1:31,  3 users,  load average: 0.00, 0.01, 0.05

使用vmstat查看CPU使用狀態

[root@VM_0_12_centos ~]# vmstat 2 10     #2秒打印一次,一共10次
procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st
0  0      0 131104 199740 1341608    0    0     0     0  137  301  0  0 99  0  0
0  0      0 131104 199740 1341612    0    0     0    26  162  342  0  0 99  1  0
0  0      0 131140 199740 1341612    0    0     0     0  135  301  0  0 99  0  0
0  0      0 130892 199740 1341616    0    0     0     0  188  463  1  1 99  0  0
0  0      0 130912 199740 1341620    0    0     0    68  145  284  1  0 99  0  0

解釋:

procs列

r: 運行隊列長度和正在運行的線程數;

b: 表示睡眠進程的數量,即阻塞的進程數;

swpd: 虛擬內存已使用的大小,若是大於0,表示你的機器物理內存不足了,若是不是程序內存泄露的緣由,那麼你該升級內存了或者把耗內存的任務遷移到其餘機器;

memory列

free:空閒的物理內存的大小;

buff: 存儲,目錄裏面的內容、權限等的緩存大小;

cache: 緩衝大小,值越大,命中緩衝概率越大,就不會常常讀寫磁盤;

swap列

si: 每秒從磁盤讀入虛擬內存的大小,若是這個值大於0,表示物理內存不夠用或者內存泄露了,要查找耗內存進程解決掉。個人機器內存充裕,一切正常。

so: 每秒虛擬內存寫入磁盤的大小,同上;

io列

bi: 塊設備每秒接收的塊數量,這裏的塊設備是指系統上全部的磁盤和其餘塊設備,默認塊大小是1024byte;

bo: 塊設備每秒發送的塊數量,例如咱們讀取文件,bo就要大於0。bi和bo通常都要接近0,否則就是IO過於頻繁,IO等待時間也長,須要調整;

system列

in: 每秒CPU的中斷次數,包括時間中斷;

cs: 每秒上下文切換次數 ;

這兩個值越大,內核消耗的CPU時間會越大

CPU列

us: 用戶進程執行時間(user time),us的值比較高時,說明用戶進程消耗的CPU時間多,長期高應檢查程序

sy: 系統進程執行時間(system time),sy的值高時,說明系統內核消耗的CPU資源多,長期高因檢查系統

id: 空閒時間(包括IO等待時間),中央處理器的空閒時間 。以百分比表示。

wa: 等待CPU的進程佔用百分比

st: cpu在虛擬化環境上在其餘佔用的開銷,能夠理解爲被抽走了多少cpu資源

2) 端口

只用關心TIME_WAIT的個數,Linux下可用端口的數量只有65535個,佔用一個少一個,咱們能夠調整Linux的TCP內核參數,讓系統更快的釋放TIME_WAIT鏈接。

[root@VM_0_12_centos ~]# netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}'
CLOSE_WAIT 1
ESTABLISHED 5

修改:

vim /etc/sysctl.conf

修改3個參數:

1) net.ipv4.tcp_syncookies = 1 表示開啓SYN Cookies,當出現SYN等待隊列溢出時,啓用cookies來處理,可防範少許SYN攻擊;默認爲0,表示關閉

2) net.ipv4.tcp_tw_reuse = 1 表示開啓重用,容許將TIME-WAIT sockets從新用於新的TCP鏈接,默認爲0,表示關閉

3) net.ipv4.tcp_tw_recycle = 1 表示開啓TCP鏈接中TIME-WAIT sockets的快速回收,默認爲0,表示關閉

查看可用端口範圍:

[root@VM_0_12_centos ~]# cat /proc/sys/net/ipv4/ip_local_port_range
32768   60999

修改 sysctl.conf 文件修改範圍:

net.ipv4.ip_local_port_range = 1024 65535

3)定時任務清理臨時目錄垃圾文件,日誌歸檔

4)鎖定關鍵系統文件,防止被提權篡改

5)清除多餘的系統虛擬帳號

九、如何合理查找

換句話說就是 合理使用find參命令

1)在 /software 目錄下找出大小超過 10MB 的文件

find /software -type f -size +10240k

[root@VM_0_12_centos /]# find /software -type f -size +10240k
/software/mysql-5.6.33-linux-glibc2.5-x86_64.tar.gz
/software/mysql/lib/libmysqlclient.a
/software/mysql/lib/libmysqld-debug.a
/software/mysql/lib/libmysqld.a

2)目錄下找出 365 天以內未被訪問過的文件

find /software \! -atime -365

[root@VM_0_12_centos /]# find /software \! -atime -365
/software
/software/mysql-5.7.20-linux-glibc2.12-x86_64.tar.gz

3) 目錄下找出 365 天以前被修改過的文件

find /home -mtime +365

[root@VM-8-8-centos ~]# find /home -mtime +365
/home
/home/HaC
/home/HaC/HaC.pub
/home/HaC/HaC

十、Linux的目錄結構

常見的:

  • /bin
    bin 是 Binaries (二進制文件) 的縮寫, 這個目錄存放着最常用的命令。
  • /boot:
    這裏存放的是啓動 Linux 時使用的一些核心文件,包括一些鏈接文件以及鏡像文件。
  • /dev :
    dev 是 Device(設備) 的縮寫, 該目錄下存放的是 Linux 的外部設備,在 Linux 中訪問設備的方式和訪問文件的方式是相同的。
  • /etc:
    etc 是 Etcetera(等等) 的縮寫,這個目錄用來存放全部的系統管理所須要的配置文件和子目錄。
  • /home
    用戶的主目錄,在 Linux 中,每一個用戶都有一個本身的目錄,通常該目錄名是以用戶的帳號命名的,如上圖中的 alice、bob 和 eve。
  • /lib:lib 是 Library(庫) 的縮寫這個目錄裏存放着系統最基本的動態鏈接共享庫,其做用相似於 Windows 裏的 DLL 文件。幾乎全部的應用程序都須要用到這些共享庫。
相關文章
相關標籤/搜索