]> arthur.barton.de Git - netdata.git/blob - python.d/postgres.chart.py
Support optionally disabling the table and index charts.
[netdata.git] / python.d / postgres.chart.py
1 # -*- coding: utf-8 -*-
2 # Description: example netdata python.d module
3 # Authors: facetoe, dangtranhoang
4
5 import re
6 from copy import deepcopy
7
8 import psycopg2
9 from psycopg2 import extensions
10 from psycopg2.extras import DictCursor
11
12 from base import SimpleService
13
14 # default module values
15 update_every = 1
16 priority = 90000
17 retries = 60
18
19 # Default Config options.
20 # {
21 #    'database': None,
22 #    'user': 'postgres',
23 #    'password': None,
24 #    'host': 'localhost',
25 #    'port': 5432
26 # }
27
28 ARCHIVE = """
29 SELECT
30     CAST(COUNT(*) AS INT) AS file_count,
31     CAST(COALESCE(SUM(CAST(archive_file ~ $r$\.ready$$r$ as INT)), 0) AS INT) AS ready_count,
32     CAST(COALESCE(SUM(CAST(archive_file ~ $r$\.done$$r$ AS INT)), 0) AS INT) AS done_count
33 FROM
34     pg_catalog.pg_ls_dir('pg_xlog/archive_status') AS archive_files (archive_file);
35 """
36
37 BACKENDS = """
38 SELECT
39     count(*) - (SELECT count(*) FROM pg_stat_activity WHERE state = 'idle') AS backends_active,
40     (SELECT count(*) FROM pg_stat_activity WHERE state = 'idle' ) AS backends_idle
41 FROM
42     pg_stat_activity;
43 """
44
45 TABLE_STATS = """
46 SELECT
47   ((sum(relpages) * 8) * 1024) AS size_relations,
48   count(1)                     AS relations
49 FROM pg_class
50 WHERE relkind IN ('r', 't');
51 """
52
53 INDEX_STATS = """
54 SELECT
55   ((sum(relpages) * 8) * 1024) AS size_indexes,
56   count(1)                     AS indexes
57 FROM pg_class
58 WHERE relkind = 'i';"""
59
60 DATABASE = """
61 SELECT
62   datname AS database_name,
63   sum(numbackends) AS connections,
64   sum(xact_commit) AS xact_commit,
65   sum(xact_rollback) AS xact_rollback,
66   sum(blks_read) AS blks_read,
67   sum(blks_hit) AS blks_hit,
68   sum(tup_returned) AS tup_returned,
69   sum(tup_fetched) AS tup_fetched,
70   sum(tup_inserted) AS tup_inserted,
71   sum(tup_updated) AS tup_updated,
72   sum(tup_deleted) AS tup_deleted,
73   sum(conflicts) AS conflicts
74 FROM pg_stat_database
75 WHERE NOT datname ~* '^template\d+'
76 GROUP BY database_name;
77 """
78
79 BGWRITER = 'SELECT * FROM pg_stat_bgwriter;'
80 DATABASE_LOCKS = """
81 SELECT
82   pg_database.datname as database_name,
83   mode,
84   count(mode) AS count
85 FROM pg_locks
86   INNER JOIN pg_database ON pg_database.oid = pg_locks.database
87 GROUP BY datname, mode
88 ORDER BY datname, mode;
89 """
90 REPLICATION = """
91 SELECT
92     client_hostname,
93     client_addr,
94     state,
95     sent_offset - (
96         replay_offset - (sent_xlog - replay_xlog) * 255 * 16 ^ 6 ) AS byte_lag
97 FROM (
98     SELECT
99         client_addr, client_hostname, state,
100         ('x' || lpad(split_part(sent_location,   '/', 1), 8, '0'))::bit(32)::bigint AS sent_xlog,
101         ('x' || lpad(split_part(replay_location, '/', 1), 8, '0'))::bit(32)::bigint AS replay_xlog,
102         ('x' || lpad(split_part(sent_location,   '/', 2), 8, '0'))::bit(32)::bigint AS sent_offset,
103         ('x' || lpad(split_part(replay_location, '/', 2), 8, '0'))::bit(32)::bigint AS replay_offset
104     FROM pg_stat_replication
105 ) AS s;
106 """
107
108 LOCK_TYPES = [
109     'ExclusiveLock',
110     'RowShareLock',
111     'SIReadLock',
112     'ShareUpdateExclusiveLock',
113     'AccessExclusiveLock',
114     'AccessShareLock',
115     'ShareRowExclusiveLock',
116     'ShareLock',
117     'RowExclusiveLock'
118 ]
119
120 ORDER = ['db_stat_transactions', 'db_stat_tuple_read', 'db_stat_tuple_returned', 'db_stat_tuple_write',
121          'backend_process', 'index_count', 'index_size', 'table_count', 'table_size', 'wal', 'background_writer']
122
123 CHARTS = {
124     'db_stat_transactions': {
125         'options': [None, ' Transactions', 'Count', ' database statistics', '.db_stat_transactions', 'line'],
126         'lines': [
127             ['db_stat_xact_commit', 'Committed', 'absolute'],
128             ['db_stat_xact_rollback', 'Rolled Back', 'absolute']
129         ]},
130     'db_stat_connections': {
131         'options': [None, ' Connections', 'Count', ' database statistics', '.db_stat_connections', 'line'],
132         'lines': [
133             ['db_stat_connections', 'Connections', 'absolute']
134         ]},
135     'db_stat_tuple_read': {
136         'options': [None, ' Tuple read', 'Count', ' database statistics', '.db_stat_tuple_read', 'line'],
137         'lines': [
138             ['db_stat_blks_read', 'Disk', 'absolute'],
139             ['db_stat_blks_hit', 'Cache', 'absolute']
140         ]},
141     'db_stat_tuple_returned': {
142         'options': [None, ' Tuple returned', 'Count', ' database statistics', '.db_stat_tuple_returned', 'line'],
143         'lines': [
144             ['db_stat_tup_returned', 'Sequential', 'absolute'],
145             ['db_stat_tup_fetched', 'Bitmap', 'absolute']
146         ]},
147     'db_stat_tuple_write': {
148         'options': [None, ' Tuple write', 'Count', ' database statistics', '.db_stat_tuple_write', 'line'],
149         'lines': [
150             ['db_stat_tup_inserted', 'Inserted', 'absolute'],
151             ['db_stat_tup_updated', 'Updated', 'absolute'],
152             ['db_stat_tup_deleted', 'Deleted', 'absolute'],
153             ['db_stat_conflicts', 'Conflicts', 'absolute']
154         ]},
155     'backend_process': {
156         'options': [None, 'Backend processes', 'Count', 'Backend processes', 'postgres.backend_process', 'line'],
157         'lines': [
158             ['backend_process_active', 'Active', 'absolute'],
159             ['backend_process_idle', 'Idle', 'absolute']
160         ]},
161     'index_count': {
162         'options': [None, 'Total index', 'Count', 'Index', 'postgres.index_count', 'line'],
163         'lines': [
164             ['index_count', 'Total index', 'absolute']
165         ]},
166     'index_size': {
167         'options': [None, 'Index size', 'MB', 'Index', 'postgres.index_size', 'line'],
168         'lines': [
169             ['index_size', 'Size', 'absolute', 1, 1024 * 1024]
170         ]},
171     'table_count': {
172         'options': [None, 'Total table', 'Count', 'Table', 'postgres.table_count', 'line'],
173         'lines': [
174             ['table_count', 'Total table', 'absolute']
175         ]},
176     'table_size': {
177         'options': [None, 'Table size', 'MB', 'Table', 'postgres.table_size', 'line'],
178         'lines': [
179             ['table_size', 'Size', 'absolute', 1, 1024 * 1024]
180         ]},
181     'wal': {
182         'options': [None, 'WAL stats', 'Files', 'WAL', 'postgres.wal', 'line'],
183         'lines': [
184             ['wal_total', 'Total', 'absolute'],
185             ['wal_ready', 'Ready', 'absolute'],
186             ['wal_done', 'Done', 'absolute']
187         ]},
188     'background_writer': {
189         'options': [None, 'Checkpoints', 'Count', 'Background Writer', 'postgres.background_writer', 'line'],
190         'lines': [
191             ['background_writer_scheduled', 'Scheduled', 'absolute'],
192             ['background_writer_requested', 'Requested', 'absolute']
193         ]}
194 }
195
196
197 class Service(SimpleService):
198     def __init__(self, configuration=None, name=None):
199         super(self.__class__, self).__init__(configuration=configuration, name=name)
200         self.order = ORDER
201         self.definitions = CHARTS
202         self.table_stats = configuration.pop('table_stats', True)
203         self.index_stats = configuration.pop('index_stats', True)
204         self.configuration = configuration
205         self.connection = None
206         self.data = {}
207         self.old_data = {}
208         self.databases = set()
209
210     def _connect(self):
211         params = dict(user='postgres',
212                       database=None,
213                       password=None,
214                       host='localhost',
215                       port=5432)
216         params.update(self.configuration)
217
218         if not self.connection:
219             self.connection = psycopg2.connect(**params)
220             self.connection.set_isolation_level(extensions.ISOLATION_LEVEL_AUTOCOMMIT)
221             self.connection.set_session(readonly=True)
222
223     def check(self):
224         try:
225             self._connect()
226             self._discover_databases()
227             self._create_definitions()
228             return True
229         except Exception as e:
230             self.error(e)
231             return False
232
233     def _discover_databases(self):
234         cursor = self.connection.cursor()
235         cursor.execute("""
236             SELECT datname
237             FROM pg_stat_database
238             WHERE NOT datname ~* '^template\d+'
239         """)
240         self.databases = set(r[0] for r in cursor)
241         cursor.close()
242
243     def _create_definitions(self):
244         for database_name in self.databases:
245             self.databases.add(database_name)
246             for chart_template_name in list(CHARTS):
247                 if chart_template_name.startswith('db_stat'):
248                     self._add_database_stat_chart(chart_template_name, database_name)
249             self._add_database_lock_chart(database_name)
250
251     def _add_database_stat_chart(self, chart_template_name, database_name):
252         chart_template = CHARTS[chart_template_name]
253         chart_name = "{}_{}".format(database_name, chart_template_name)
254         if chart_name not in self.order:
255             self.order.insert(0, chart_name)
256             name, title, units, family, context, chart_type = chart_template['options']
257             self.definitions[chart_name] = {
258                 'options': [
259                     name,
260                     database_name + title,
261                     units,
262                     database_name + family,
263                     database_name + context,
264                     chart_type
265                 ]
266             }
267
268             self.definitions[chart_name]['lines'] = []
269             for line in deepcopy(chart_template['lines']):
270                 line[0] = "{}_{}".format(database_name, line[0])
271                 self.definitions[chart_name]['lines'].append(line)
272
273     def _add_database_lock_chart(self, database_name):
274         chart_name = "{}_locks".format(database_name)
275         if chart_name not in self.order:
276             self.order.insert(0, chart_name)
277             self.definitions[chart_name] = dict(
278                 options=
279                 [
280                     None,
281                     database_name + ' locks',
282                     'Count',
283                     database_name + ' database statistics',
284                     database_name + '.locks',
285                     'line'
286                 ],
287                 lines=[]
288             )
289
290             for lock_type in LOCK_TYPES:
291                 lock_id = "{}_{}".format(database_name, lock_type.lower())
292                 label = re.sub("([a-z])([A-Z])", "\g<1> \g<2>", lock_type)
293                 self.definitions[chart_name]['lines'].append([lock_id, label, 'absolute'])
294
295     def _get_data(self):
296         self._connect()
297
298         cursor = self.connection.cursor(cursor_factory=DictCursor)
299         self.add_stats(cursor)
300
301         cursor.close()
302         return self.data
303
304     def add_stats(self, cursor):
305         self.add_database_stats(cursor)
306         self.add_backend_stats(cursor)
307         if self.index_stats:
308             self.add_index_stats(cursor)
309         if self.table_stats:
310             self.add_table_stats(cursor)
311         self.add_lock_stats(cursor)
312         self.add_bgwriter_stats(cursor)
313
314         # self.add_replication_stats(cursor)
315
316         # add_wal_metrics needs superuser to get directory listings
317         # if self.config.get('superuser', True):
318         # self.add_wal_stats(cursor)
319
320     def add_database_stats(self, cursor):
321         cursor.execute(DATABASE)
322         for row in cursor:
323             database_name = row.get('database_name')
324             self.add_derive_value('db_stat_xact_commit', prefix=database_name, value=int(row.get('xact_commit', 0)))
325             self.add_derive_value('db_stat_xact_rollback', prefix=database_name, value=int(row.get('xact_rollback', 0)))
326             self.add_derive_value('db_stat_blks_read', prefix=database_name, value=int(row.get('blks_read', 0)))
327             self.add_derive_value('db_stat_blks_hit', prefix=database_name, value=int(row.get('blks_hit', 0)))
328             self.add_derive_value('db_stat_tup_returned', prefix=database_name, value=int(row.get('tup_returned', 0)))
329             self.add_derive_value('db_stat_tup_fetched', prefix=database_name, value=int(row.get('tup_fetched', 0)))
330             self.add_derive_value('db_stat_tup_inserted', prefix=database_name, value=int(row.get('tup_inserted', 0)))
331             self.add_derive_value('db_stat_tup_updated', prefix=database_name, value=int(row.get('tup_updated', 0)))
332             self.add_derive_value('db_stat_tup_deleted', prefix=database_name, value=int(row.get('tup_deleted', 0)))
333             self.add_derive_value('db_stat_conflicts', prefix=database_name, value=int(row.get('conflicts', 0)))
334             conn_key = "{}_{}".format(database_name, 'db_stat_connections')
335             self.data[conn_key] = int(row.get('connections', 0))
336
337     def add_backend_stats(self, cursor):
338         cursor.execute(BACKENDS)
339         temp = cursor.fetchone()
340
341         self.data['backend_process_active'] = int(temp.get('backends_active', 0))
342         self.data['backend_process_idle'] = int(temp.get('backends_idle', 0))
343
344     def add_index_stats(self, cursor):
345         cursor.execute(INDEX_STATS)
346         temp = cursor.fetchone()
347         self.data['index_count'] = int(temp.get('indexes', 0))
348         self.data['index_size'] = int(temp.get('size_indexes', 0))
349
350     def add_table_stats(self, cursor):
351         cursor.execute(TABLE_STATS)
352         temp = cursor.fetchone()
353         self.data['table_count'] = int(temp.get('relations', 0))
354         self.data['table_size'] = int(temp.get('size_relations', 0))
355
356     def add_lock_stats(self, cursor):
357         cursor.execute(DATABASE_LOCKS)
358         # First zero out all current lock values.
359         for database_name in self.databases:
360             for lock_type in LOCK_TYPES:
361                 lock_id = "{}_{}".format(database_name, lock_type.lower())
362                 self.data[lock_id] = 0
363
364         # Now populate those that have current locks
365         for row in cursor:
366             database_name, lock_type, lock_count = row
367             lock_id = "{}_{}".format(database_name, lock_type.lower())
368             self.data[lock_id] = lock_count
369
370     def add_wal_stats(self, cursor):
371         cursor.execute(ARCHIVE)
372         temp = cursor.fetchone()
373         self.add_derive_value('wal_total', int(temp.get('file_count', 0)))
374         self.add_derive_value('wal_ready', int(temp.get('ready_count', 0)))
375         self.add_derive_value('wal_done', int(temp.get('done_count', 0)))
376
377     def add_bgwriter_stats(self, cursor):
378         cursor.execute(BGWRITER)
379         temp = cursor.fetchone()
380
381         self.add_derive_value('background_writer_scheduled', temp.get('checkpoints_timed', 0))
382         self.add_derive_value('background_writer_requested', temp.get('checkpoints_requests', 0))
383
384     def add_derive_value(self, key, value, prefix=None):
385         if prefix:
386             key = "{}_{}".format(prefix, key)
387         if key not in self.old_data.keys():
388             self.data[key] = 0
389         else:
390             self.data[key] = value - self.old_data[key]
391
392         self.old_data[key] = value
393
394
395 '''
396     def add_replication_stats(self, cursor):
397         cursor.execute(REPLICATION)
398         temp = cursor.fetchall()
399         for row in temp:
400             self.add_gauge_value('Replication/%s' % row.get('client_addr', 'Unknown'),
401                                  'byte_lag',
402                                  int(row.get('byte_lag', 0)))
403 '''