

Zabbix一手應用問答
Q1 Zabbix支持集成scom,splunk等其他的監(jiān)控系統(tǒng)的告警和性能數(shù)據(jù)嗎?
A1 Zabbix支持通過API或者數(shù)據(jù)庫ETL集成其他系統(tǒng)或者平臺。除此之外,當SCOM、SPLUNK等數(shù)據(jù)收集上來時,也可以通過調(diào)用Zabbix_sender的方式集成到zabbix中。
Q2 跟BMC相比的話 ,除了價格,Zabbix有一些什么其它的優(yōu)勢呢?
A2 Zabbix有很多優(yōu)勢,如可擴展,接口豐富,易于同其他平臺集成。支持各種平臺的Agent使其在深度和廣度上超越了大多數(shù)的監(jiān)控工具。
Q3 支持基于動態(tài)基線的閾值告警嗎?
A3 不支持,但在最新的版本中支持預測。
Q4 一臺機器上有多個進程或者多個端口等監(jiān)控也是通過LLD去實現(xiàn)嗎?
A4 可以自定義發(fā)現(xiàn)原型來實現(xiàn)LLD。
Q5 如果長時間沒采集到值,是否可以告警通知出來?
A5 可以,Zabbix支持nodata報警,即當沒收到值的時候,將報警發(fā)出。
Q6 Zabbix可以實現(xiàn)apm的監(jiān)控嗎?
A6 根據(jù)需求可以部分或者全部實現(xiàn),Zabbix支持原生的JMX監(jiān)控。
Q7 agent端和server端需要開通哪些端口?
A7 Zabbix本身只需要開通10050,10051端口(主動、被動監(jiān)控)。如需要監(jiān)控Agent端其他服務(如80,443等),則需要額外開通。
Q8 我們遇到一個問題,通過ZabbixAPI創(chuàng)建監(jiān)控項,然后通過pyzabbixSender推送數(shù)值到Zabbix,但是不能即可成功,這是什么原因呢,必須要等到一段時候后才能成功。
A8 Zabbix Server和Proxy同步時定期的,在早期版本默認時3600s,需要修改conf文件以加快同步周期。
Q9 我們的系統(tǒng)內(nèi)部的主機也高達1.1w,但是我們遇到了很多隊列積壓的問題,修改了很多Cache的大小,還是效果不佳。
A9 是否需要修改cache大小取決于Zabbix
internal check中的busy或者free的百分比,與queue沒有直接關(guān)系。queue的堆積可能是網(wǎng)絡延遲、agent端的響應緩慢造成的,需要具體分析。
Q10 Zabbix的自動發(fā)現(xiàn)是基于安裝客戶端的主機么?
A10 Zabbix的自動發(fā)現(xiàn)功能可以基于客戶端,也可以基于協(xié)議(如http,ftp),按指定的規(guī)則將符合規(guī)則的主機加入監(jiān)控。
Q11 Zabbix加載更多的面板會影響性能嗎?
A11 加載更多的面板會導致Zabbix數(shù)據(jù)庫的讀壓力增加。如果可以進行合理調(diào)優(yōu),那么影響不大。
Q12 現(xiàn)在推薦哪個版本呢?
A12 最新的版本是3.4,如果是開源使用建議使用這個版本。如果需要商業(yè)支持,可以考慮3.0LTS,以獲得更多的商業(yè)支持生命周期。
Q13 什么樣的規(guī)則(通過什么方式)可以區(qū)分自動發(fā)現(xiàn)的機器是windows還是linux的主機?
A13 首先網(wǎng)絡發(fā)現(xiàn)的網(wǎng)段的操作系統(tǒng)需要安裝Zabbix
Agent,可以通過網(wǎng)絡發(fā)現(xiàn),并配置獲得的key為system.uname。Windows系統(tǒng),key的返回會包含Windows這個字符串;同樣的linux系統(tǒng)也會包含“Linux”這個字符串。根據(jù)返回值配置后面的動作(加組、套用模版等)。
Q14 一般多少數(shù)量的主機才需要用到proxy?
A14 這個問題沒有固定的答案,看具體的業(yè)務場景和需求。建議安裝網(wǎng)絡區(qū)域部署Proxy以減少防火墻需要打通的端口。
Q15 主機性能,每秒刷新值達到100這個值是不是很大了?
A15 可以說非常小了,官方的最大部署中,nvps可以達到幾十萬。
Q16 自動化發(fā)現(xiàn)后,可以修改監(jiān)控項么?
A16 可以修改,如果修改原型的監(jiān)控項,會更改所有關(guān)聯(lián)該模版的主機。如有個性化需求,可以在單個host上單獨添加。
Q17 帶外怎么自動監(jiān)控ipmi
A17 可以通過Share上的模版,結(jié)合網(wǎng)絡發(fā)現(xiàn)功能,自動為帶外網(wǎng)絡發(fā)現(xiàn)到的Host關(guān)聯(lián)并添加監(jiān)控。
Q18 我們現(xiàn)在使用Zabbix監(jiān)控,服務器數(shù)量1000不到,但是查看監(jiān)控圖形時,圖形會出現(xiàn)斷裂,如何解決呢?
A18 出現(xiàn)斷裂可能是數(shù)據(jù)庫沒有數(shù)據(jù),或者Agent端根本沒有收集到數(shù)據(jù)。前者可以通過數(shù)據(jù)庫調(diào)優(yōu)解決,后者可以在Agent本機觀察負載情況,以定位問題。
Q19 自動發(fā)現(xiàn)里面怎么修改模板來排除特定的名字的監(jiān)控項,只留下同類型的需要的監(jiān)控項,因為我在部分網(wǎng)絡設備上的發(fā)現(xiàn)會出現(xiàn)很多虛的用戶接口也被抓進監(jiān)控項,數(shù)量很大,怎么排除。
A19 可通過常規(guī)中的正則表達式功能,為自動發(fā)現(xiàn)排除不需要的Item。
Q20 Appliance版本 VMware Workstation Pro可以用嗎?
A20 可以,下載vmdk文件,并掛載到VM中就可以使用。
Q21 最近經(jīng)常出現(xiàn)Zabbix server無法獲取proxy數(shù)據(jù)的情況,每次都需要禁用部分proxy,然后重啟Zabbix server,再逐一將proxy分別啟用才能恢復。請問這個是配置參數(shù)原因?qū)е碌模€是Zabbix的bug。
A21 Server和Proxy同步有周期,早起版本3600s,在conf文件中修改配置以縮短同步時間。