linux服务监控命令 linux监控服务器

如何设置nagios实现对Linux服务器的监控(只在监控服务器上进行设置,不需在被控端上做配置),急需求解!

说明:

创新互联专注于南丹企业网站建设,响应式网站开发,商城网站建设。南丹网站建设公司,为南丹等地区提供建站服务。全流程按需策划,专业设计,全程项目跟踪,创新互联专业和态度为您提供的服务

● 主机名 host_name,必须是主机配置文件hosts.cfg中定义的主机。

● 检查用的命令check_command,在命令配置文件中定义或在nrpe配置文件中有定义。

● 最大重试次数max_check_attempts 一般设置为3-4次比较好,这样不会因为网络闪断片刻而发生误报。

● 检查间隔和重试检查间隔的单位是分钟。

● 通知间隔指探测到故障以后,每隔多少时间发送一次报警信息。 它的单位是分钟。

● 通知选项跟服务定义配置文件相同。

● 联系组contact_groups由配置文件contactgroup.cfg定义。

● 检查主机资源需要安装和配置nrpe,这个过程在后面完成。

Linux里面vmstat命令作用是什么?

11.5 vmstat:虚拟内存统计

11.5.1  命令详解

【命令星级】                                                 ★★★★☆

【功能说明】

vmstat是Virtual Memory Statistics(虚拟内存统计)的缩写,利用vmstat命令可以对操作系统的内存信息、进程状态和CPU活动等进行监视。但是只能对系统的整体情况进行统计,无法对某个进程进行深入分析。

【语法格式】

vmstat  [option]  [delay [ count]]

vmstat  [选项]     [时间间隔[次数]]

说明:

1)在vmstat命令及后面的选项里,每个元素之间都至少有一个空格。

2)delay表示两次输出之间的间隔时间。

3)count表示按照delay指定的时间间隔统计的次数。

【选项说明】

表11-4针对该命令的参数选项进行了说明。

11.5.2  使用范例

范例11-12:显示虚拟内存使用情况。

[root@oldboy ~]# vmstat   #==如果省略“间隔时间”和“次数”参数,则仅显示一次报告后就退出

procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu-----

r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st

0  0      0 71756  38600 279084    0    0    24     6   15   18  0  0 100  0  0

[root@oldboyedu ~]# vmstat 5  #==表示每5秒钟更新一次输出信息,循环输出,按Ctrl+C组合键停止输出。

procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu-----

r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st

0  0      0  71804  38600 279084    0    0     2     1    9    9  0  0 100  0  0

0  0      0  71756  38600 279084    0    0     0     0    8    8  0  0 100  0  0

0  0      0  71756  38600 279084    0    0     0     0    9    9  0  0 100  0  0

^C

[root@oldboyedu ~]# vmstat 5 6  #==表示每5秒更新一次输出信息,统计6次后停止输出。

procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu-----

r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st

0  0      0  71804  38600 279084    0    0     2     1    9    9  0  0 100  0  0

0  0      0  71756  38600 279084    0    0     0     0    9    8  0  0 100  0  0

0  0      0  71756  38600 279084    0    0     0     0    8    9  0  0 100  0  0

0  0      0  71756  38600 279084    0    0     0     0    9    8  0  0 100  0  0

0  0      0  71756  38600 279084    0    0     0     0    9    8  0  0 100  0  0

0  0      0  71756  38600 279084    0    0     0     0    9    8  0  0 100  0  0

[root@oldboy ~]#

以下是命令结果说明。

第1列:procs。

q  r列表示运行和等待CPU时间片的进程数。

q  b列表示在等待资源的进程数。

第2列:memory。

q  swpd列表示使用虚拟内存大小。

q  free列表示当前空闲的物理内存数量。

q  buff列表示buffers 的内存数量。

q  cache列表示cache的内存数量。

第3列:swap。

q  si(swap in)列表示由磁盘调入内存,也就是内存进入内存交换区的数量。

q  so(swap out)列表示由内存调入磁盘,也就是内存交换区进入内存的数量。

第4列:I/O项显示磁盘读写状况。

q  bi列表示从块设备读入数据的总量(即读磁盘)(块/s)。

q  bo列表示写入到块设备的数据总量(即写磁盘)(块/s)。

第5列:system显示采集间隔内发生的中断数。

q  in列表示在某一时间间隔中观测到的每秒设备中断数。

q  cs列表示每秒产生的上下文切换次数。

第6列:CPU项显示了CPU的使用状态。

q  us列显示了用户进程消耗的CPU时间百分比。

q  sy列显示了系统(内核)进程消耗的CPU时间百分比。

q  id列显示了CPU处在空闲状态的时间百分比。

q  wa列显示了IO等待所占用的CPU时间百分比。

q  st列显示了虚拟机占用的CPU时间的百分比。

范例11-13:显示活跃和非活跃内存。

[root@oldboy ~]# vmstat -a 2 5

procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu-----

r  b   swpd   free  inact active   si   so    bi    bo   in   cs us sy id wa st

0  0      0  71804 160408 165848    0    0     2     1    9    9  0  0 100  0  0

0  0      0  71756 160408 165844    0    0     0     0   11   11  0  0 100  0  0

0  0      0  71756 160408 165844    0    0     0     0   12    9  0  0 100  0  0

0  0      0  71608 160412 165672    0    0     0  1302  218  341 12  9 80  0  0

0  0      0  71608 160412 165672    0    0     0     0   10    9  0  0 100  0  0

使用-a选项显示活跃和非活跃内存时,所显示的内容除增加了inact和active外,其他显示内容与范例11-12相同。

在Memory列增加的inact和active两列,说明如下。

q  inact: 非活跃内存大小(当使用-a选项时显示)。

q  active: 活跃的内存大小(当使用-a选项时显示)。

范例11-14:查看内存使用的详细信息。

[root@oldboy ~]# vmstat -s

486640  total memory

414572  used memory

165656  active memory

160420  inactive memory

72068  free memory

……

这些信息的分别来自于/proc/meminfo,/proc/stat和/proc/vmstat。

范例11-15:查看磁盘的读/写。

[root@oldboy ~]# vmstat -d

disk- ------------reads------------ ------------writes----------- -----IO------

total merged sectors      ms  total merged sectors      ms    cur    sec

ram0       0      0       0       0      0      0       0       0      0      0

ram1       0      0       0       0      0      0       0       0      0      0

……

sr0        0      0       0       0      0      0       0       0      0      0

sda    14667   3623  594388    6737  12864  32806  365372   44250      0     30

这些信息主要来自于/proc/diskstats。其中的merged表示一次来自于合并的写/读请求,一般系统会把多个连接/邻近的读/写请求合并到一起来操作。

范例11-16:查看/dev/sda1磁盘的读写统计信息。

[root@oldboy ~]# vmstat -p /dev/sda1

sda1          reads   read sectors  writes    requested writes

502       4162         14         68

这些信息主要来自于/proc/diskstats。各列的说明如下。

q  reads:来自于这个分区的读的次数。

q  read sectors:来自于这个分区的读扇区的次数。

q  writes:来自于这个分区的写的次数。

q  requested writes:来自于这个分区的写请求次数。

摘自:

跟老男孩学Linux运维:核心系统命令实战 第11章 版权归原作者所有

zabbix怎么监控linux服务器硬件信息

HP的服务器在硬件管理方面提供了自己管理工具hpacucli,通过该工具可以查看HP服务器的RAID信息,服务器硬盘等信息。

1)安装hpacucli工具(下载地址:HP hpacucli管理工具)

[root@monitor ~]#rpm -ivh hpacucli-9.40-12.0.x86_64.rpm

2)查看服务器RAID信息,硬盘是否正常。

[root@monitor~]# hpacucli ctrl all show config Smart Array P410i in Slot 0 (Embedded) (sn: 5001438018042FF0) array A (SAS, Unused Space: 0 MB) logicaldrive 1 (279.4 GB, RAID 1, OK) physicaldrive 1I:1:1 (port 1I:box 1:bay 1, SAS, 300 GB, OK) physicaldrive 1I:1:2 (port 1I:box 1:bay 2, SAS, 300 GB, OK)

3)通过hpacucli ctrl all show config detail命令可以详细地查看RAID和硬盘的信息。

[root@monitor ~]# hpacucli ctrl all show config detail Smart Array P410i in Slot 0 (Embedded) Bus Interface: PCI Slot: 0 Serial Number: 5001438018042FF0 Cache Serial Number: PBCDH0CRH1FH62 RAID 6 (ADG) Status: Disabled Controller Status: OK Chassis Slot: Hardware Revision: Rev C Firmware Version: 5.14 Rebuild Priority: Medium Expand Priority: Medium Surface Scan Delay: 15 secs Monitor and Performance Delay: 60 min Elevator Sort: Enabled Degraded Performance Optimization: Disabled Inconsistency Repair Policy: Disabled Post Prompt Timeout: 0 secs Cache Board Present: True Cache Status: OK Accelerator Ratio: 25% Read / 75% Write Drive Write Cache: Disabled Total Cache Size: 512 MB No-Battery Write Cache: Disabled Cache Backup Power Source: Capacitors Battery/Capacitor Count: 1 Battery/Capacitor Status: OK SATA NCQ Supported: True Array: A Interface Type: SAS Unused Space: 0 MB Status: OK Logical Drive: 1 Size: 279.4 GB Fault Tolerance: RAID 1 Heads: 255 Sectors Per Track: 32 Cylinders: 65535 Stripe Size: 128 KB Status: OK Array Accelerator: Enabled Unique Identifier: 600508B1001034373220202020200002 Disk Name: /dev/cciss/c0d0 Mount Points: /boot 99 MB Logical Drive Label: A00ADBD9PR7AMU1472 898D Mirror Group 0: physicaldrive 1I:1:1 (port 1I:box 1:bay 1, SAS, 300 GB, OK) Mirror Group 1: physicaldrive 1I:1:2 (port 1I:box 1:bay 2, SAS, 300 GB, OK) physicaldrive 1I:1:1 Port: 1I Box: 1 Bay: 1 Status: OK Drive Type: Data Drive Interface Type: SAS Size: 300 GB Rotational Speed: 10000 Firmware Revision: HPD4 Serial Number: ECA1PC80GTS31234 Model: HP EG0300FBDSP PHY Count: 2 PHY Transfer Rate: 6.0GBPS, Unknown physicaldrive 1I:1:2 Port: 1I Box: 1 Bay: 2 Status: OK Drive Type: Data Drive Interface Type: SAS Size: 300 GB Rotational Speed: 10000 Firmware Revision: HPD7 Serial Number: PMX6902D Model: HP EG0300FBDBR PHY Count: 2 PHY Transfer Rate: 6.0GBPS, Unknown

HP官方还有一个hpasmcli管理工具,可以很详细查看服务器CPU,内存,处理器,电源等的温度信息。

Linux监控系统http,ftp,telnet服务的状态

监视本机,可以使用netstat -an命令来查看相应的LISTEN是否存在。

如果是监视别的机器,那只有直接连接一下看是否成功,LINUX可能有专门测试网络连接的应用程序,不过我一般都是自己用PERL来写,连接一个TCP端口,检测是否成功,然后断开,是很简单的。


网站名称:linux服务监控命令 linux监控服务器
分享路径:http://scjbc.cn/article/dopehcj.html

其他资讯