硬件及操作系统监控#

  1. 方法: 检查操作系统,网络以及磁盘状态,以及磁盘剩余空间。

  2. 推荐频率 : 每隔30分钟

  3. 发现问题解决方法

如果发现操作系统,网络及磁盘出现异常,需要修复问题,然后重新加入该节点。

如果磁盘剩余空间不足30%的话,需要准备系统扩容。否则容易出现磁盘空间不足情况。因为有些SQL在运行过程中需要使用临时存储空间来存放中间结果。

如果发现性能问题,建议运行oushudb checkperf命令来查看性能问题。例如下面的硬件配置,

  • 12 15K RPM SAS盘,2 RAID卡, RAID 0

  • 2 dual-port 10Gb NICs (NIC bonding)

正常情况下,有如下性能指标:

  • I/O 读写: 2GB/s

  • 网络性能:2GB/s