]> arthur.barton.de Git - bup.git/blob - cmd/split-cmd.py
rbackup-cmd: we can now backup a *remote* machine to a *local* server.
[bup.git] / cmd / split-cmd.py
1 #!/usr/bin/env python
2 import sys, time, struct
3 from bup import hashsplit, git, options, client
4 from bup.helpers import *
5 from subprocess import PIPE
6
7
8 optspec = """
9 bup split [-tcb] [-n name] [--bench] [filenames...]
10 --
11 r,remote=  remote repository path
12 b,blobs    output a series of blob ids
13 t,tree     output a tree id
14 c,commit   output a commit id
15 n,name=    name of backup set to update (if any)
16 N,noop     don't actually save the data anywhere
17 q,quiet    don't print progress messages
18 v,verbose  increase log output (can be used more than once)
19 copy       just copy input to output, hashsplitting along the way
20 bench      print benchmark timings to stderr
21 max-pack-size=  maximum bytes in a single pack
22 max-pack-objects=  maximum number of objects in a single pack
23 fanout=  maximum number of blobs in a single tree
24 """
25 o = options.Options('bup split', optspec)
26 (opt, flags, extra) = o.parse(sys.argv[1:])
27
28 git.check_repo_or_die()
29 if not (opt.blobs or opt.tree or opt.commit or opt.name or
30         opt.noop or opt.copy):
31     o.fatal("use one or more of -b, -t, -c, -n, -N, --copy")
32 if (opt.noop or opt.copy) and (opt.blobs or opt.tree or 
33                                opt.commit or opt.name):
34     o.fatal('-N is incompatible with -b, -t, -c, -n')
35
36 if opt.verbose >= 2:
37     git.verbose = opt.verbose - 1
38     opt.bench = 1
39 if opt.max_pack_size:
40     hashsplit.max_pack_size = parse_num(opt.max_pack_size)
41 if opt.max_pack_objects:
42     hashsplit.max_pack_objects = parse_num(opt.max_pack_objects)
43 if opt.fanout:
44     hashsplit.fanout = parse_num(opt.fanout)
45 if opt.blobs:
46     hashsplit.fanout = 0
47
48 is_reverse = os.environ.get('BUP_SERVER_REVERSE')
49 if is_reverse and opt.remote:
50     o.fatal("don't use -r in reverse mode; it's automatic")
51 start_time = time.time()
52
53 refname = opt.name and 'refs/heads/%s' % opt.name or None
54 if opt.noop or opt.copy:
55     cli = w = oldref = None
56 elif opt.remote or is_reverse:
57     cli = client.Client(opt.remote)
58     oldref = refname and cli.read_ref(refname) or None
59     w = cli.new_packwriter()
60 else:
61     cli = None
62     oldref = refname and git.read_ref(refname) or None
63     w = git.PackWriter()
64
65 files = extra and (open(fn) for fn in extra) or [sys.stdin]
66 if w:
67     shalist = hashsplit.split_to_shalist(w, files)
68     tree = w.new_tree(shalist)
69 else:
70     last = 0
71     for (blob, bits) in hashsplit.hashsplit_iter(files):
72         hashsplit.total_split += len(blob)
73         if opt.copy:
74             sys.stdout.write(str(blob))
75         megs = hashsplit.total_split/1024/1024
76         if not opt.quiet and last != megs:
77             progress('%d Mbytes read\r' % megs)
78             last = megs
79     progress('%d Mbytes read, done.\n' % megs)
80
81 if opt.verbose:
82     log('\n')
83 if opt.blobs:
84     for (mode,name,bin) in shalist:
85         print bin.encode('hex')
86 if opt.tree:
87     print tree.encode('hex')
88 if opt.commit or opt.name:
89     msg = 'bup split\n\nGenerated by command:\n%r' % sys.argv
90     ref = opt.name and ('refs/heads/%s' % opt.name) or None
91     commit = w.new_commit(oldref, tree, msg)
92     if opt.commit:
93         print commit.encode('hex')
94
95 if w:
96     w.close()  # must close before we can update the ref
97         
98 if opt.name:
99     if cli:
100         cli.update_ref(refname, commit, oldref)
101     else:
102         git.update_ref(refname, commit, oldref)
103
104 if cli:
105     cli.close()
106
107 secs = time.time() - start_time
108 size = hashsplit.total_split
109 if opt.bench:
110     log('\nbup: %.2fkbytes in %.2f secs = %.2f kbytes/sec\n'
111         % (size/1024., secs, size/1024./secs))