Prometheus is een monitoringsysteem dat sinds 2012 in ontwikkeling is.
Het project is gestart door een stel ex-Googlers die bij hun nieuwe werkgever, SoundCloud, zochten naar een vervanger voor Google's Borgmon. Waar Prometheus verschilt van traditionele monitoringsystemen zoals Icinga/Nagios is dat het een duidelijke scheiding heeft tussen gegevens en alerting-beleid. Dit maakt Prometheus ook een vervanger voor Munin, RRDTool, etc.
In hoofdlijnen ga ik in deze presentatie twee onderwerpen bespreken. Ten eerste zal ik uitleggen wat de gedachtegang achter Prometheus is. Hierbij zullen de volgende vragen beantwoord worden:
- Wat is het datamodel van Prometheus?
- Hoe komt Prometheus aan zijn data?
- Hoe raadpleeg ik de data (lees: hoe werkt de querytaal)?
- Hoe genereert Prometheus alerts?
Ten tweede zal ik bespreken hoe wij binnen Kumina Prometheus gebruiken voor ons Linux-cluster. Het laatste halfjaar hebben wij een groot aantal modules voor Prometheus ontwikkeld, waarvan het overgrote deel óf geïntegreerd is in de Prometheus-code, óf beschikbaar is op onze eigen GitHub-pagina. Het gebruik en de implementatie hiervan zal uitgebreid aan bod komen.