vfs: remove dead cache_get_revlist_item()

[bup.git] / lib / bup / vfs.py
diff --git a/lib/bup/vfs.py b/lib/bup/vfs.py

index 1c67577f000b6c458c781edd7086e050fe1d57e5..8b4789c02e151e508082684131e66229f8c34352 100644 (file)
--- a/lib/bup/vfs.py
+++ b/lib/bup/vfs.py
@@ -16,7 +16,6 @@ case.  Any item.meta Metadata instances must not be modified directly.
  Make a copy to modify via item.meta.copy() if needed, or call
  copy_item().
  
-
  The want_meta argument is advisory for calls that accept it, and it
  may not be honored.  Callers must be able to handle an item.meta value
  that is either an instance of Metadata or an integer mode, perhaps
@@ -48,27 +47,59 @@ item.coid.
  """
  
  from __future__ import absolute_import, print_function
+from binascii import hexlify, unhexlify
  from collections import namedtuple
-from errno import ELOOP, ENOENT, ENOTDIR
-from itertools import chain, dropwhile, groupby, izip, tee
+from errno import EINVAL, ELOOP, ENOENT, ENOTDIR
+from itertools import chain, dropwhile, groupby, tee
  from random import randrange
  from stat import S_IFDIR, S_IFLNK, S_IFREG, S_ISDIR, S_ISLNK, S_ISREG
  from time import localtime, strftime
-import exceptions, re, sys
+import re, sys
  
-from bup import client, git, metadata
-from bup.compat import range
+from bup import git, metadata, vint
+from bup.compat import hexstr, range
  from bup.git import BUP_CHUNKED, cp, get_commit_items, parse_commit, tree_decode
  from bup.helpers import debug2, last
+from bup.io import path_msg
  from bup.metadata import Metadata
-from bup.repo import LocalRepo, RemoteRepo
+from bup.vint import read_bvec, write_bvec
+from bup.vint import read_vint, write_vint
+from bup.vint import read_vuint, write_vuint
+
+if sys.version_info[0] < 3:
+    from exceptions import IOError as py_IOError
+else:
+    py_IOError = IOError
  
+# We currently assume that it's always appropriate to just forward IOErrors
+# to a remote client.
  
-class IOError(exceptions.IOError):
+class IOError(py_IOError):
      def __init__(self, errno, message, terminus=None):
-        exceptions.IOError.__init__(self, errno, message)
+        py_IOError.__init__(self, errno, message)
          self.terminus = terminus
  
+def write_ioerror(port, ex):
+    assert isinstance(ex, IOError)
+    write_vuint(port,
+                (1 if ex.errno is not None else 0)
+                | (2 if ex.strerror is not None else 0)
+                | (4 if ex.terminus is not None else 0))
+    if ex.errno is not None:
+        write_vint(port, ex.errno)
+    if ex.strerror is not None:
+        write_bvec(port, ex.strerror.encode('utf-8'))
+    if ex.terminus is not None:
+        write_resolution(port, ex.terminus)
+
+def read_ioerror(port):
+    mask = read_vuint(port)
+    no = read_vint(port) if 1 & mask else None
+    msg = read_bvec(port).decode('utf-8') if 2 & mask else None
+    term = read_resolution(port) if 4 & mask else None
+    return IOError(errno=no, message=msg, terminus=term)
+
+
  default_file_mode = S_IFREG | 0o644
  default_dir_mode = S_IFDIR | 0o755
  default_symlink_mode = S_IFLNK | 0o755
@@ -85,43 +116,56 @@ def _default_mode_for_gitmode(gitmode):
  def _normal_or_chunked_file_size(repo, oid):
      """Return the size of the normal or chunked file indicated by oid."""
      # FIXME: --batch-format CatPipe?
-    it = repo.cat(oid.encode('hex'))
+    it = repo.cat(hexlify(oid))
      _, obj_t, size = next(it)
      ofs = 0
-    while obj_t == 'tree':
-        mode, name, last_oid = last(tree_decode(''.join(it)))
+    while obj_t == b'tree':
+        mode, name, last_oid = last(tree_decode(b''.join(it)))
          ofs += int(name, 16)
-        it = repo.cat(last_oid.encode('hex'))
+        it = repo.cat(hexlify(last_oid))
          _, obj_t, size = next(it)
      return ofs + sum(len(b) for b in it)
  
+def _skip_chunks_before_offset(tree, offset):
+    prev_ent = next(tree, None)
+    if not prev_ent:
+        return tree
+    ent = None
+    for ent in tree:
+        ent_ofs = int(ent[1], 16)
+        if ent_ofs > offset:
+            return chain([prev_ent, ent], tree)
+        if ent_ofs == offset:
+            return chain([ent], tree)
+        prev_ent = ent
+    return [prev_ent]
+
  def _tree_chunks(repo, tree, startofs):
      "Tree should be a sequence of (name, mode, hash) as per tree_decode()."
      assert(startofs >= 0)
      # name is the chunk's hex offset in the original file
-    tree = dropwhile(lambda (_1, name, _2): int(name, 16) < startofs, tree)
-    for mode, name, oid in tree:
+    for mode, name, oid in _skip_chunks_before_offset(tree, startofs):
          ofs = int(name, 16)
          skipmore = startofs - ofs
          if skipmore < 0:
              skipmore = 0
-        it = repo.cat(oid.encode('hex'))
+        it = repo.cat(hexlify(oid))
          _, obj_t, size = next(it)
-        data = ''.join(it)            
+        data = b''.join(it)
          if S_ISDIR(mode):
-            assert obj_t == 'tree'
+            assert obj_t == b'tree'
              for b in _tree_chunks(repo, tree_decode(data), skipmore):
                  yield b
          else:
-            assert obj_t == 'blob'
+            assert obj_t == b'blob'
              yield data[skipmore:]
  
  class _ChunkReader:
      def __init__(self, repo, oid, startofs):
-        it = repo.cat(oid.encode('hex'))
+        it = repo.cat(hexlify(oid))
          _, obj_t, size = next(it)
-        isdir = obj_t == 'tree'
-        data = ''.join(it)
+        isdir = obj_t == b'tree'
+        data = b''.join(it)
          if isdir:
              self.it = _tree_chunks(repo, tree_decode(data), startofs)
              self.blob = None
@@ -131,11 +175,11 @@ class _ChunkReader:
          self.ofs = startofs
  
      def next(self, size):
-        out = ''
+        out = b''
          while len(out) < size:
              if self.it and not self.blob:
                  try:
-                    self.blob = self.it.next()
+                    self.blob = next(self.it)
                  except StopIteration:
                      self.it = None
              if self.blob:
@@ -163,18 +207,19 @@ class _FileReader(object):
          return self._size
          
      def seek(self, ofs):
-        if ofs < 0:
-            raise IOError(errno.EINVAL, 'Invalid argument')
-        if ofs > self._compute_size():
-            raise IOError(errno.EINVAL, 'Invalid argument')
+        if ofs < 0 or ofs > self._compute_size():
+            raise IOError(EINVAL, 'Invalid seek offset: %d' % ofs)
          self.ofs = ofs
  
      def tell(self):
          return self.ofs
  
      def read(self, count=-1):
+        size = self._compute_size()
+        if self.ofs >= size:
+            return b''
          if count < 0:
-            count = self._compute_size() - self.ofs
+            count = size - self.ofs
          if not self.reader or self.reader.ofs != self.ofs:
              self.reader = _ChunkReader(self._repo, self.oid, self.ofs)
          try:
@@ -194,7 +239,7 @@ class _FileReader(object):
          self.close()
          return False
  
-_multiple_slashes_rx = re.compile(r'//+')
+_multiple_slashes_rx = re.compile(br'//+')
  
  def _decompose_path(path):
      """Return a boolean indicating whether the path is absolute, and a
@@ -203,18 +248,18 @@ def _decompose_path(path):
      effectively '/' or '.', return an empty list.
  
      """
-    path = re.sub(_multiple_slashes_rx, '/', path)
-    if path == '/':
+    path = re.sub(_multiple_slashes_rx, b'/', path)
+    if path == b'/':
          return True, True, []
      is_absolute = must_be_dir = False
-    if path.startswith('/'):
+    if path.startswith(b'/'):
          is_absolute = True
          path = path[1:]
-    for suffix in ('/', '/.'):
+    for suffix in (b'/', b'/.'):
          if path.endswith(suffix):
              must_be_dir = True
              path = path[:-len(suffix)]
-    parts = [x for x in path.split('/') if x != '.']
+    parts = [x for x in path.split(b'/') if x != b'.']
      parts.reverse()
      if not parts:
          must_be_dir = True  # e.g. path was effectively '.' or '/', etc.
@@ -223,6 +268,7 @@ def _decompose_path(path):
  
  Item = namedtuple('Item', ('meta', 'oid'))
  Chunky = namedtuple('Chunky', ('meta', 'oid'))
+FakeLink = namedtuple('FakeLink', ('meta', 'target'))
  Root = namedtuple('Root', ('meta'))
  Tags = namedtuple('Tags', ('meta'))
  RevList = namedtuple('RevList', ('meta', 'oid'))
@@ -231,6 +277,93 @@ Commit = namedtuple('Commit', ('meta', 'oid', 'coid'))
  item_types = frozenset((Item, Chunky, Root, Tags, RevList, Commit))
  real_tree_types = frozenset((Item, Commit))
  
+def write_item(port, item):
+    kind = type(item)
+    name = bytes(kind.__name__.encode('ascii'))
+    meta = item.meta
+    has_meta = 1 if isinstance(meta, Metadata) else 0
+    if kind in (Item, Chunky, RevList):
+        assert len(item.oid) == 20
+        if has_meta:
+            vint.send(port, 'sVs', name, has_meta, item.oid)
+            Metadata.write(meta, port, include_path=False)
+        else:
+            vint.send(port, 'sVsV', name, has_meta, item.oid, item.meta)
+    elif kind in (Root, Tags):
+        if has_meta:
+            vint.send(port, 'sV', name, has_meta)
+            Metadata.write(meta, port, include_path=False)
+        else:
+            vint.send(port, 'sVV', name, has_meta, item.meta)
+    elif kind == Commit:
+        assert len(item.oid) == 20
+        assert len(item.coid) == 20
+        if has_meta:
+            vint.send(port, 'sVss', name, has_meta, item.oid, item.coid)
+            Metadata.write(meta, port, include_path=False)
+        else:
+            vint.send(port, 'sVssV', name, has_meta, item.oid, item.coid,
+                      item.meta)
+    elif kind == FakeLink:
+        if has_meta:
+            vint.send(port, 'sVs', name, has_meta, item.target)
+            Metadata.write(meta, port, include_path=False)
+        else:
+            vint.send(port, 'sVsV', name, has_meta, item.target, item.meta)
+    else:
+        assert False
+
+def read_item(port):
+    def read_m(port, has_meta):
+        if has_meta:
+            m = Metadata.read(port)
+            return m
+        return read_vuint(port)
+    kind, has_meta = vint.recv(port, 'sV')
+    if kind == b'Item':
+        oid, meta = read_bvec(port), read_m(port, has_meta)
+        return Item(oid=oid, meta=meta)
+    if kind == b'Chunky':
+        oid, meta = read_bvec(port), read_m(port, has_meta)
+        return Chunky(oid=oid, meta=meta)
+    if kind == b'RevList':
+        oid, meta = read_bvec(port), read_m(port, has_meta)
+        return RevList(oid=oid, meta=meta)
+    if kind == b'Root':
+        return Root(meta=read_m(port, has_meta))
+    if kind == b'Tags':
+        return Tags(meta=read_m(port, has_meta))
+    if kind == b'Commit':
+        oid, coid = vint.recv(port, 'ss')
+        meta = read_m(port, has_meta)
+        return Commit(oid=oid, coid=coid, meta=meta)
+    if kind == b'FakeLink':
+        target, meta = read_bvec(port), read_m(port, has_meta)
+        return FakeLink(target=target, meta=meta)
+    assert False
+
+def write_resolution(port, resolution):
+    write_vuint(port, len(resolution))
+    for name, item in resolution:
+        write_bvec(port, name)
+        if item:
+            port.write(b'\x01')
+            write_item(port, item)
+        else:
+            port.write(b'\x00')
+
+def read_resolution(port):
+    n = read_vuint(port)
+    result = []
+    for i in range(n):
+        name = read_bvec(port)
+        have_item = ord(port.read(1))
+        assert have_item in (0, 1)
+        item = read_item(port) if have_item else None
+        result.append((name, item))
+    return tuple(result)
+
+
  _root = Root(meta=default_dir_mode)
  _tags = Tags(meta=default_dir_mode)
  
@@ -238,8 +371,8 @@ _tags = Tags(meta=default_dir_mode)
  ### vfs cache
  
  ### A general purpose shared cache with (currently) cheap random
-### eviction.  There is currently no weighting so a single commit item
-### is just as likely to be evicted as an entire "rev-list".  See
+### eviction.  At the moment there is no weighting so a single commit
+### item is just as likely to be evicted as an entire "rev-list".  See
  ### is_valid_cache_key for a description of the expected content.
  
  _cache = {}
@@ -254,26 +387,29 @@ def clear_cache():
  def is_valid_cache_key(x):
      """Return logically true if x looks like it could be a valid cache key
      (with respect to structure).  Current valid cache entries:
-      commit_oid -> commit
-      commit_oid + ':r' -> rev-list
-         i.e. rev-list -> {'.', commit, '2012...', next_commit, ...}
+      res:... -> resolution
+      itm:OID -> Commit
+      rvl:OID -> {'.', commit, '2012...', next_commit, ...}
      """
      # Suspect we may eventually add "(container_oid, name) -> ...", and others.
      x_t = type(x)
      if x_t is bytes:
-        if len(x) == 20:
+        tag = x[:4]
+        if tag in (b'itm:', b'rvl:') and len(x) == 24:
              return True
-        if len(x) == 22 and x.endswith(b':r'):
+        if tag == b'res:':
              return True
  
  def cache_get(key):
      global _cache
-    assert is_valid_cache_key(key)
+    if not is_valid_cache_key(key):
+        raise Exception('invalid cache key: ' + repr(key))
      return _cache.get(key)
  
  def cache_notice(key, value):
      global _cache, _cache_keys, _cache_max_items
-    assert is_valid_cache_key(key)
+    if not is_valid_cache_key(key):
+        raise Exception('invalid cache key: ' + repr(key))
      if key in _cache:
          return
      if len(_cache) < _cache_max_items:
@@ -286,27 +422,21 @@ def cache_notice(key, value):
      _cache_keys[victim_i] = key
      _cache[key] = value
  
-
  def cache_get_commit_item(oid, need_meta=True):
      """Return the requested tree item if it can be found in the cache.
      When need_meta is true don't return a cached item that only has a
      mode."""
      # tree might be stored independently, or as '.' with its entries.
-    item = cache_get(oid)
+    commit_key = b'itm:' + oid
+    item = cache_get(commit_key)
      if item:
          if not need_meta:
              return item
          if isinstance(item.meta, Metadata):
              return item
-    entries = cache_get(oid + b':r')
+    entries = cache_get(b'rvl:' + oid)
      if entries:
-        return entries['.']
-
-def cache_get_revlist_item(oid, need_meta=True):
-    commit = cache_get_commit_item(oid, need_meta=need_meta)
-    if commit:
-        return RevList(oid=oid, meta=commit.meta)
-
+        return entries[b'.']
  
  def copy_item(item):
      """Return a completely independent copy of item, such that
@@ -342,21 +472,21 @@ def tree_data_and_bupm(repo, oid):
  
      """    
      assert len(oid) == 20
-    it = repo.cat(oid.encode('hex'))
+    it = repo.cat(hexlify(oid))
      _, item_t, size = next(it)
-    data = ''.join(it)
-    if item_t == 'commit':
+    data = b''.join(it)
+    if item_t == b'commit':
          commit = parse_commit(data)
          it = repo.cat(commit.tree)
          _, item_t, size = next(it)
-        data = ''.join(it)
-        assert item_t == 'tree'
-    elif item_t != 'tree':
-        raise Exception('%r is not a tree or commit' % oid.encode('hex'))
+        data = b''.join(it)
+        assert item_t == b'tree'
+    elif item_t != b'tree':
+        raise Exception('%s is not a tree or commit' % hexstr(oid))
      for _, mangled_name, sub_oid in tree_decode(data):
-        if mangled_name == '.bupm':
+        if mangled_name == b'.bupm':
              return data, sub_oid
-        if mangled_name > '.bupm':
+        if mangled_name > b'.bupm':
              break
      return data, None
  
@@ -372,13 +502,15 @@ def _find_treeish_oid_metadata(repo, oid):
      return None
  
  def _readlink(repo, oid):
-    return ''.join(repo.join(oid.encode('hex')))
+    return b''.join(repo.join(hexlify(oid)))
  
  def readlink(repo, item):
      """Return the link target of item, which must be a symlink.  Reads the
      target from the repository if necessary."""
      assert repo
      assert S_ISLNK(item_mode(item))
+    if isinstance(item, FakeLink):
+        return item.target
      if isinstance(item.meta, Metadata):
          target = item.meta.symlink_target
          if target:
@@ -391,6 +523,8 @@ def _compute_item_size(repo, item):
          size = _normal_or_chunked_file_size(repo, item.oid)
          return size
      if S_ISLNK(mode):
+        if isinstance(item, FakeLink):
+            return len(item.target)
          return len(_readlink(repo, item.oid))
      return 0
  
@@ -414,22 +548,23 @@ def fopen(repo, item):
  def _commit_item_from_data(oid, data):
      info = parse_commit(data)
      return Commit(meta=default_dir_mode,
-                  oid=info.tree.decode('hex'),
+                  oid=unhexlify(info.tree),
                    coid=oid)
  
  def _commit_item_from_oid(repo, oid, require_meta):
      commit = cache_get_commit_item(oid, need_meta=require_meta)
      if commit and ((not require_meta) or isinstance(commit.meta, Metadata)):
          return commit
-    it = repo.cat(oid.encode('hex'))
+    it = repo.cat(hexlify(oid))
      _, typ, size = next(it)
-    assert typ == 'commit'
-    commit = _commit_item_from_data(oid, ''.join(it))
+    assert typ == b'commit'
+    commit = _commit_item_from_data(oid, b''.join(it))
      if require_meta:
          meta = _find_treeish_oid_metadata(repo, commit.oid)
          if meta:
              commit = commit._replace(meta=meta)
-    cache_notice(oid, commit)
+    commit_key = b'itm:' + oid
+    cache_notice(commit_key, commit)
      return commit
  
  def _revlist_item_from_oid(repo, oid, require_meta):
@@ -446,31 +581,31 @@ def root_items(repo, names=None, want_meta=True):
  
      global _root, _tags
      if not names:
-        yield '.', _root
-        yield '.tag', _tags
+        yield b'.', _root
+        yield b'.tag', _tags
          # FIXME: maybe eventually support repo.clone() or something
          # and pass in two repos, so we can drop the tuple() and stream
          # in parallel (i.e. meta vs refs).
          for name, oid in tuple(repo.refs([], limit_to_heads=True)):
-            assert(name.startswith('refs/heads/'))
+            assert(name.startswith(b'refs/heads/'))
              yield name[11:], _revlist_item_from_oid(repo, oid, want_meta)
          return
  
-    if '.' in names:
-        yield '.', _root
-    if '.tag' in names:
-        yield '.tag', _tags
+    if b'.' in names:
+        yield b'.', _root
+    if b'.tag' in names:
+        yield b'.tag', _tags
      for ref in names:
-        if ref in ('.', '.tag'):
+        if ref in (b'.', b'.tag'):
              continue
-        it = repo.cat('refs/heads/' + ref)
+        it = repo.cat(b'refs/heads/' + ref)
          oidx, typ, size = next(it)
          if not oidx:
              for _ in it: pass
              continue
-        assert typ == 'commit'
-        commit = parse_commit(''.join(it))
-        yield ref, _revlist_item_from_oid(repo, oidx.decode('hex'), want_meta)
+        assert typ == b'commit'
+        commit = parse_commit(b''.join(it))
+        yield ref, _revlist_item_from_oid(repo, unhexlify(oidx), want_meta)
  
  def ordered_tree_entries(tree_data, bupm=None):
      """Yields (name, mangled_name, kind, gitmode, oid) for each item in
@@ -478,10 +613,12 @@ def ordered_tree_entries(tree_data, bupm=None):
  
      """
      # Sadly, the .bupm entries currently aren't in git tree order,
-    # i.e. they don't account for the fact that git sorts trees
-    # (including our chunked trees) as if their names ended with "/",
-    # so "fo" sorts after "fo." iff fo is a directory.  This makes
-    # streaming impossible when we need the metadata.
+    # but in unmangled name order. They _do_ account for the fact
+    # that git sorts trees (including chunked trees) as if their
+    # names ended with "/" (so "fo" sorts after "fo." iff fo is a
+    # directory), but we apply this on the unmangled names in save
+    # rather than on the mangled names.
+    # This makes streaming impossible when we need the metadata.
      def result_from_tree_entry(tree_entry):
          gitmode, mangled_name, oid = tree_entry
          name, kind = git.demangle_name(mangled_name, gitmode)
@@ -504,19 +641,22 @@ def tree_items(oid, tree_data, names=frozenset(), bupm=None):
              # No metadata here (accessable via '.' inside ent_oid).
              return Item(meta=default_dir_mode, oid=ent_oid)
  
-        return Item(oid=ent_oid,
-                    meta=(Metadata.read(bupm) if bupm \
-                          else _default_mode_for_gitmode(gitmode)))
+        meta = Metadata.read(bupm) if bupm else None
+        # handle the case of metadata being empty/missing in bupm
+        # (or there not being bupm at all)
+        if meta is None:
+            meta = _default_mode_for_gitmode(gitmode)
+        return Item(oid=ent_oid, meta=meta)
  
      assert len(oid) == 20
      if not names:
          dot_meta = _read_dir_meta(bupm) if bupm else default_dir_mode
-        yield '.', Item(oid=oid, meta=dot_meta)
+        yield b'.', Item(oid=oid, meta=dot_meta)
          tree_entries = ordered_tree_entries(tree_data, bupm)
          for name, mangled_name, kind, gitmode, ent_oid in tree_entries:
-            if mangled_name == '.bupm':
+            if mangled_name == b'.bupm':
                  continue
-            assert name != '.'
+            assert name != b'.'
              yield name, tree_item(ent_oid, kind, gitmode)
          return
  
@@ -527,20 +667,20 @@ def tree_items(oid, tree_data, names=frozenset(), bupm=None):
      remaining = len(names)
  
      # Account for the bupm sort order issue (cf. ordered_tree_entries above)
-    last_name = max(names) if bupm else max(names) + '/'
+    last_name = max(names) if bupm else max(names) + b'/'
  
-    if '.' in names:
+    if b'.' in names:
          dot_meta = _read_dir_meta(bupm) if bupm else default_dir_mode
-        yield '.', Item(oid=oid, meta=dot_meta)
+        yield b'.', Item(oid=oid, meta=dot_meta)
          if remaining == 1:
              return
          remaining -= 1
  
      tree_entries = ordered_tree_entries(tree_data, bupm)
      for name, mangled_name, kind, gitmode, ent_oid in tree_entries:
-        if mangled_name == '.bupm':
+        if mangled_name == b'.bupm':
              continue
-        assert name != '.'
+        assert name != b'.'
          if name not in names:
              if name > last_name:
                  break  # given bupm sort order, we're finished
@@ -559,15 +699,15 @@ def tree_items_with_meta(repo, oid, tree_data, names):
      assert len(oid) == 20
      bupm = None
      for _, mangled_name, sub_oid in tree_decode(tree_data):
-        if mangled_name == '.bupm':
+        if mangled_name == b'.bupm':
              bupm = _FileReader(repo, sub_oid)
              break
-        if mangled_name > '.bupm':
+        if mangled_name > b'.bupm':
              break
      for item in tree_items(oid, tree_data, names, bupm):
          yield item
  
-_save_name_rx = re.compile(r'^\d\d\d\d-\d\d-\d\d-\d{6}(-\d+)?$')
+_save_name_rx = re.compile(br'^\d\d\d\d-\d\d-\d\d-\d{6}(-\d+)?$')
          
  def _reverse_suffix_duplicates(strs):
      """Yields the elements of strs, with any runs of duplicate values
@@ -581,7 +721,7 @@ def _reverse_suffix_duplicates(strs):
              yield name
          else:
              ndig = len(str(ndup - 1))
-            fmt = '%s-' + '%0' + str(ndig) + 'd'
+            fmt = b'%s-' + b'%0' + (b'%d' % ndig) + b'd'
              for i in range(ndup - 1, -1, -1):
                  yield fmt % (name, i)
  
@@ -589,20 +729,21 @@ def parse_rev(f):
      items = f.readline().split(None)
      assert len(items) == 2
      tree, auth_sec = items
-    return tree.decode('hex'), int(auth_sec)
+    return unhexlify(tree), int(auth_sec)
  
  def _name_for_rev(rev):
      commit_oidx, (tree_oid, utc) = rev
-    return strftime('%Y-%m-%d-%H%M%S', localtime(utc))
+    return strftime('%Y-%m-%d-%H%M%S', localtime(utc)).encode('ascii')
  
  def _item_for_rev(rev):
      commit_oidx, (tree_oid, utc) = rev
-    coid = commit_oidx.decode('hex')
+    coid = unhexlify(commit_oidx)
      item = cache_get_commit_item(coid, need_meta=False)
      if item:
          return item
      item = Commit(meta=default_dir_mode, oid=tree_oid, coid=coid)
-    cache_notice(item.coid, item)
+    commit_key = b'itm:' + coid
+    cache_notice(commit_key, item)
      return item
  
  def cache_commit(repo, oid):
@@ -612,20 +753,21 @@ def cache_commit(repo, oid):
      """
      # For now, always cache with full metadata
      entries = {}
-    entries['.'] = _revlist_item_from_oid(repo, oid, True)
-    revs = repo.rev_list((oid.encode('hex'),), format='%T %at',
+    entries[b'.'] = _revlist_item_from_oid(repo, oid, True)
+    revs = repo.rev_list((hexlify(oid),), format=b'%T %at',
                           parse=parse_rev)
      rev_items, rev_names = tee(revs)
      revs = None  # Don't disturb the tees
      rev_names = _reverse_suffix_duplicates(_name_for_rev(x) for x in rev_names)
      rev_items = (_item_for_rev(x) for x in rev_items)
-    latest = None
+    tip = None
      for item in rev_items:
-        latest = latest or item
          name = next(rev_names)
+        tip = tip or (name, item)
          entries[name] = item
-    entries['latest'] = latest
-    cache_notice(latest.coid + b':r', entries)
+    entries[b'latest'] = FakeLink(meta=default_symlink_mode, target=tip[0])
+    revlist_key = b'rvl:' + tip[1].coid
+    cache_notice(revlist_key, entries)
      return entries
  
  def revlist_items(repo, oid, names):
@@ -633,13 +775,14 @@ def revlist_items(repo, oid, names):
  
      # Special case '.' instead of caching the whole history since it's
      # the only way to get the metadata for the commit.
-    if names and all(x == '.' for x in names):
-        yield '.', _revlist_item_from_oid(repo, oid, True)
+    if names and all(x == b'.' for x in names):
+        yield b'.', _revlist_item_from_oid(repo, oid, True)
          return
  
      # For now, don't worry about the possibility of the contents being
      # "too big" for the cache.
-    entries = cache_get(oid + b':r')
+    revlist_key = b'rvl:' + oid
+    entries = cache_get(revlist_key)
      if not entries:
          entries = cache_commit(repo, oid)
  
@@ -649,11 +792,11 @@ def revlist_items(repo, oid, names):
          return
  
      names = frozenset(name for name in names
-                      if _save_name_rx.match(name) or name in ('.', 'latest'))
+                      if _save_name_rx.match(name) or name in (b'.', b'latest'))
  
-    if '.' in names:
-        yield '.', entries['.']
-    for name in (n for n in names if n != '.'):
+    if b'.' in names:
+        yield b'.', entries[b'.']
+    for name in (n for n in names if n != b'.'):
          commit = entries.get(name)
          if commit:
              yield name, commit
@@ -663,24 +806,25 @@ def tags_items(repo, names):
  
      def tag_item(oid):
          assert len(oid) == 20
-        oidx = oid.encode('hex')
+        oidx = hexlify(oid)
          it = repo.cat(oidx)
          _, typ, size = next(it)
-        if typ == 'commit':
+        if typ == b'commit':
              return cache_get_commit_item(oid, need_meta=False) \
-                or _commit_item_from_data(oid, ''.join(it))
+                or _commit_item_from_data(oid, b''.join(it))
          for _ in it: pass
-        if typ == 'blob':
+        if typ == b'blob':
              return Item(meta=default_file_mode, oid=oid)
-        elif typ == 'tree':
+        elif typ == b'tree':
              return Item(meta=default_dir_mode, oid=oid)
-        raise Exception('unexpected tag type ' + typ + ' for tag ' + name)
+        raise Exception('unexpected tag type ' + typ.decode('ascii')
+                        + ' for tag ' + path_msg(name))
  
      if not names:
-        yield '.', _tags
+        yield b'.', _tags
          # We have to pull these all into ram because tag_item calls cat()
          for name, oid in tuple(repo.refs(names, limit_to_tags=True)):
-            assert(name.startswith('refs/tags/'))
+            assert(name.startswith(b'refs/tags/'))
              name = name[10:]
              yield name, tag_item(oid)
          return
@@ -690,14 +834,14 @@ def tags_items(repo, names):
          names = frozenset(names)
      remaining = len(names)
      last_name = max(names)
-    if '.' in names:
-        yield '.', _tags
+    if b'.' in names:
+        yield b'.', _tags
          if remaining == 1:
              return
          remaining -= 1
  
      for name, oid in repo.refs(names, limit_to_tags=True):
-        assert(name.startswith('refs/tags/'))
+        assert(name.startswith(b'refs/tags/'))
          name = name[10:]
          if name > last_name:
              return
@@ -734,24 +878,19 @@ def contents(repo, item, names=None, want_meta=True):
      assert repo
      assert S_ISDIR(item_mode(item))
      item_t = type(item)
-
      if item_t in real_tree_types:
-        it = repo.cat(item.oid.encode('hex'))
-        _, obj_type, size = next(it)
-        data = ''.join(it)
-        if obj_type == 'tree':
-            if want_meta:
-                item_gen = tree_items_with_meta(repo, item.oid, data, names)
-            else:
-                item_gen = tree_items(item.oid, data, names)
-        elif obj_type == 'commit':
-            if want_meta:
-                item_gen = tree_items_with_meta(repo, item.oid, tree_data, names)
-            else:
-                item_gen = tree_items(item.oid, tree_data, names)
-        else:
+        it = repo.cat(hexlify(item.oid))
+        _, obj_t, size = next(it)
+        data = b''.join(it)
+        if obj_t != b'tree':
              for _ in it: pass
-            raise Exception('unexpected git ' + obj_type)
+            # Note: it shouldn't be possible to see an Item with type
+            # 'commit' since a 'commit' should always produce a Commit.
+            raise Exception('unexpected git ' + obj_t.decode('ascii'))
+        if want_meta:
+            item_gen = tree_items_with_meta(repo, item.oid, data, names)
+        else:
+            item_gen = tree_items(item.oid, data, names)
      elif item_t == RevList:
          item_gen = revlist_items(repo, item.oid, names)
      elif item_t == Root:
@@ -763,10 +902,22 @@ def contents(repo, item, names=None, want_meta=True):
      for x in item_gen:
          yield x
  
-def _resolve_path(repo, path, parent=None, want_meta=True, deref=False):
+def _resolve_path(repo, path, parent=None, want_meta=True, follow=True):
+    cache_key = b'res:%d%d%d:%s\0%s' \
+                % (bool(want_meta), bool(follow), repo.id(),
+                   (b'/'.join(x[0] for x in parent) if parent else b''),
+                   path)
+    resolution = cache_get(cache_key)
+    if resolution:
+        return resolution
+
+    def notice_resolution(r):
+        cache_notice(cache_key, r)
+        return r
+
      def raise_dir_required_but_not_dir(path, parent, past):
          raise IOError(ENOTDIR,
-                      "path %r%s resolves to non-directory %r"
+                      "path %s%s resolves to non-directory %r"
                        % (path,
                           ' (relative to %r)' % parent if parent else '',
                           past),
@@ -786,32 +937,32 @@ def _resolve_path(repo, path, parent=None, want_meta=True, deref=False):
                            % (parent,))
      is_absolute, must_be_dir, future = _decompose_path(path)
      if must_be_dir:
-        deref = True
+        follow = True
      if not future:  # path was effectively '.' or '/'
          if is_absolute:
-            return (('', _root),)
+            return notice_resolution(((b'', _root),))
          if parent:
-            return tuple(parent)
-        return [('', _root)]
+            return notice_resolution(tuple(parent))
+        return notice_resolution(((b'', _root),))
      if is_absolute:
-        past = [('', _root)]
+        past = [(b'', _root)]
      else:
-        past = list(parent) if parent else [('', _root)]
+        past = list(parent) if parent else [(b'', _root)]
      hops = 0
      while True:
          if not future:
              if must_be_dir and not S_ISDIR(item_mode(past[-1][1])):
                  raise_dir_required_but_not_dir(path, parent, past)
-            return tuple(past)
+            return notice_resolution(tuple(past))
          segment = future.pop()
-        if segment == '..':
+        if segment == b'..':
              assert len(past) > 0
              if len(past) > 1:  # .. from / is /
                  assert S_ISDIR(item_mode(past[-1][1]))
                  past.pop()
          else:
              parent_name, parent_item = past[-1]
-            wanted = (segment,) if not want_meta else ('.', segment)
+            wanted = (segment,) if not want_meta else (b'.', segment)
              items = tuple(contents(repo, parent_item, names=wanted,
                                     want_meta=want_meta))
              if not want_meta:
@@ -819,11 +970,11 @@ def _resolve_path(repo, path, parent=None, want_meta=True, deref=False):
              else:  # First item will be '.' and have the metadata
                  item = items[1][1] if len(items) == 2 else None
                  dot, dot_item = items[0]
-                assert dot == '.'
+                assert dot == b'.'
                  past[-1] = parent_name, parent_item
              if not item:
                  past.append((segment, None),)
-                return tuple(past)
+                return notice_resolution(tuple(past))
              mode = item_mode(item)
              if not S_ISLNK(mode):
                  if not S_ISDIR(mode):
@@ -837,7 +988,7 @@ def _resolve_path(repo, path, parent=None, want_meta=True, deref=False):
                                        terminus=past)
                      if must_be_dir:
                          raise_dir_required_but_not_dir(path, parent, past)
-                    return tuple(past)
+                    return notice_resolution(tuple(past))
                  # It's treeish
                  if want_meta and type(item) in real_tree_types:
                      dir_meta = _find_treeish_oid_metadata(repo, item.oid)
@@ -845,7 +996,7 @@ def _resolve_path(repo, path, parent=None, want_meta=True, deref=False):
                          item = item._replace(meta=dir_meta)
                  past.append((segment, item))
              else:  # symlink
-                if not future and not deref:
+                if not future and not follow:
                      past.append((segment, item),)
                      continue
                  if hops > 100:
@@ -857,28 +1008,22 @@ def _resolve_path(repo, path, parent=None, want_meta=True, deref=False):
                  is_absolute, _, target_future = _decompose_path(target)
                  if is_absolute:
                      if not target_future:  # path was effectively '/'
-                        return (('', _root),)
-                    past = [('', _root)]
+                        return notice_resolution(((b'', _root),))
+                    past = [(b'', _root)]
                      future = target_future
                  else:
                      future.extend(target_future)
                  hops += 1
                  
-def lresolve(repo, path, parent=None, want_meta=True):
-    """Perform exactly the same function as resolve(), except if the final
-    path element is a symbolic link, don't follow it, just return it
-    in the result.
-
-    """
-    return _resolve_path(repo, path, parent=parent, want_meta=want_meta,
-                         deref=False)
-
-def resolve(repo, path, parent=None, want_meta=True):
+def resolve(repo, path, parent=None, want_meta=True, follow=True):
      """Follow the path in the virtual filesystem and return a tuple
      representing the location, if any, denoted by the path.  Each
      element in the result tuple will be (name, info), where info will
      be a VFS item that can be passed to functions like item_mode().
  
+    If follow is false, and if the final path element is a symbolic
+    link, don't follow it, just return it in the result.
+
      If a path segment that does not exist is encountered during
      resolution, the result will represent the location of the missing
      item, and that item in the result will be None.
@@ -918,29 +1063,34 @@ def resolve(repo, path, parent=None, want_meta=True):
      needed, make a copy via item.meta.copy() and modify that instead.
  
      """
+    if repo.is_remote():
+        # Redirect to the more efficient remote version
+        return repo.resolve(path, parent=parent, want_meta=want_meta,
+                            follow=follow)
      result = _resolve_path(repo, path, parent=parent, want_meta=want_meta,
-                           deref=True)
+                           follow=follow)
      _, leaf_item = result[-1]
-    if leaf_item:
+    if leaf_item and follow:
          assert not S_ISLNK(item_mode(leaf_item))
      return result
  
  def try_resolve(repo, path, parent=None, want_meta=True):
      """If path does not refer to a symlink, does not exist, or refers to a
-    valid symlink, behave exactly like resolve().  If path refers to
-    an invalid symlink, behave like lresolve.
+    valid symlink, behave exactly like resolve(..., follow=True).  If
+    path refers to an invalid symlink, behave like resolve(...,
+    follow=False).
  
      """
-    res = lresolve(repo, path, parent=parent, want_meta=want_meta)
+    res = resolve(repo, path, parent=parent, want_meta=want_meta, follow=False)
      leaf_name, leaf_item = res[-1]
      if not leaf_item:
          return res
      if not S_ISLNK(item_mode(leaf_item)):
          return res
-    deref = resolve(repo, leaf_name, parent=res[:-1], want_meta=want_meta)
-    deref_name, deref_item = deref[-1]
-    if deref_item:
-        return deref
+    follow = resolve(repo, leaf_name, parent=res[:-1], want_meta=want_meta)
+    follow_name, follow_item = follow[-1]
+    if follow_item:
+        return follow
      return res
  
  def augment_item_meta(repo, item, include_size=False):
@@ -964,7 +1114,10 @@ def augment_item_meta(repo, item, include_size=False):
      meta.mode = m
      meta.uid = meta.gid = meta.atime = meta.mtime = meta.ctime = 0
      if S_ISLNK(m):
-        target = _readlink(repo, item.oid)
+        if isinstance(item, FakeLink):
+            target = item.target
+        else:
+            target = _readlink(repo, item.oid)
          meta.symlink_target = target
          meta.size = len(target)
      elif include_size:
@@ -979,9 +1132,9 @@ def fill_in_metadata_if_dir(repo, item):
  
      """
      if S_ISDIR(item_mode(item)) and not isinstance(item.meta, Metadata):
-        items = tuple(contents(repo, item, ('.',), want_meta=True))
+        items = tuple(contents(repo, item, (b'.',), want_meta=True))
          assert len(items) == 1
-        assert items[0][0] == '.'
+        assert items[0][0] == b'.'
          item = items[0][1]
      return item