离线实战宝典

Jake Archibald
Jake Archibald

对于 Service Worker,我们放弃了尝试解决离线问题,并为开发者提供了灵活组件让他们自行解决此问题。借助 Cloud Storage,您可以控制缓存和请求的处理方式。 这意味着您可以创建自己的模式。我们看一下隔离环境中的几个可行模式,但在实践中,您可能会根据网址和上下文以串联方式使用其中的多个模式。

如需查看其中部分模式的运行演示,请参阅 Trained-to-thrill,以及展示性能影响的此视频

缓存计算机 - 何时存储资源

您可以通过服务工件独立地从缓存处理请求,因此我将分别演示这两种方式。首先是缓存,应在何时进行?

安装时 - 以依赖项形式

安装时 - 以依赖项形式。
安装时 - 以依赖项形式。

Service Worker 为您提供 install 事件。您可以使用该事件做好准备,即处理其他事件之前必须完成的操作。在进行这些操作时,任何以前版本的 Service Worker 仍在运行和提供页面,因此您在此处进行的操作一定不能干扰它们。

适合于:CSS、图像、字体、JS、模板等,基本上囊括了您视为网站“版本”的静态内容的任何对象。

如果未能抓取这些元素,您的网站将完全无法运行,而特定于平台的等效应用会在初始下载中包含这些内容。

self.addEventListener('install', function (event) {
  event.waitUntil(
    caches.open('mysite-static-v3').then(function (cache) {
      return cache.addAll([
        '/css/whatever-v3.css',
        '/css/imgs/sprites-v6.png',
        '/css/fonts/whatever-v8.woff',
        '/js/all-min-v4.js',
        // etc.
      ]);
    }),
  );
});

event.waitUntil 选取一个 promise 以定义安装时长和安装是否成功。如果 promise 拒绝,则安装被视为失败,并舍弃此 Service Worker(如果运行较旧版本,它将保持不变)。caches.open()cache.addAll() 会返回 promise。如果其中有任一资源获取失败,则 cache.addAll() 调用将拒绝。

trained-to-thrill 上,我使用此方法缓存静态资源

安装时 - 非依赖项形式

安装时 - 而不是作为依赖项使用。
安装时 - 非依赖项形式。

这与上述内容类似,但如果缓存失败,既不会延迟安装,也不会导致安装失败。

适合场景:并非即刻需要的大型资源,例如用于游戏较高关卡的资源。

self.addEventListener('install', function (event) {
  event.waitUntil(
    caches.open('mygame-core-v1').then(function (cache) {
      cache
        .addAll
        // levels 11–20
        ();
      return cache
        .addAll
        // core assets and levels 1–10
        ();
    }),
  );
});

上述示例不会将级别 11-20 的 cache.addAll promise 传递回 event.waitUntil,因此,即使失败,游戏在离线状态下仍然可用。当然,您必须考虑到可能缺少这些级别的情况,并且如果缺少,则重新尝试进行缓存。

当级别 11-20 进行下载时,Service Worker 可能会终止,因为它已完成处理事件,意味着它们将不会被缓存。将来,Web Periodic Background Synchronization API 将处理此类情况和较大文件下载,如电影。该 API 目前仅在 Chromium 分支上受支持。

激活时

激活后。
激活时。

适合于:清理和迁移。

一旦安装了新的 Service Worker,并且不再使用之前的版本,则会激活新的 Service Worker,并且您会收到 activate 事件。由于旧版本已退出,此时非常适合处理 IndexedDB 中的架构迁移和删除未使用的缓存。

self.addEventListener('activate', function (event) {
  event.waitUntil(
    caches.keys().then(function (cacheNames) {
      return Promise.all(
        cacheNames
          .filter(function (cacheName) {
            // Return true if you want to remove this cache,
            // but remember that caches are shared across
            // the whole origin
          })
          .map(function (cacheName) {
            return caches.delete(cacheName);
          }),
      );
    }),
  );
});

在激活期间,fetch 等其他事件会放置在一个队列中,因此长时间激活可能会阻止页面加载。请尽可能使激活流程保持精简,仅将其用于旧版本活跃期间无法执行的操作。

trained-to-thrill 上,我使用此方法移除旧缓存

用户互动时

用户互动时。
用户互动时。

适合于:当整个网站无法离线工作,并且您选择允许用户选择其需要离线可用的内容时。例如,YouTube 上的某个视频、维基百科上的某篇文章、Flickr 上的某个特定图库。

为用户提供“Read later”或“Save for offline”按钮。在点击该按钮后,从网络获取您需要的内容并将其置于缓存中。

document.querySelector('.cache-article').addEventListener('click', function (event) {
  event.preventDefault();

  var id = this.dataset.articleId;
  caches.open('mysite-article-' + id).then(function (cache) {
    fetch('/get-article-urls?id=' + id)
      .then(function (response) {
        // /get-article-urls returns a JSON-encoded array of
        // resource URLs that a given article depends on
        return response.json();
      })
      .then(function (urls) {
        cache.addAll(urls);
      });
  });
});

caches API 可以从页面和 Service Worker 获取,这意味着您可以直接从页面添加到缓存中。

网络响应时

网络响应时。
网络响应时。

适合于:频繁更新诸如用户收件箱或文章内容等资源。同时适用于不重要的资源,如头像,但需要谨慎处理。

如果请求的资源与缓存中的任何资源均不匹配,则从网络中获取,将其发送到页面同时添加到缓存中。

如果您针对一系列网址执行此操作,如头像,那么您需要谨慎,不要使源的存储变得臃肿。如果用户需要回收磁盘空间,您不会想成为主要候选对象。请确保将缓存中不再需要的项目删除。

self.addEventListener('fetch', function (event) {
  event.respondWith(
    caches.open('mysite-dynamic').then(function (cache) {
      return cache.match(event.request).then(function (response) {
        return (
          response ||
          fetch(event.request).then(function (response) {
            cache.put(event.request, response.clone());
            return response;
          })
        );
      });
    }),
  );
});

为了高效利用内存,您只能读取一次响应/请求的正文。上面的代码使用 .clone() 创建可单独读取的额外副本。

trained-to-thrill 上,我使用此方法缓存 Flickr 图片

Stale-while-revalidate

Stale-while-revalidate。
Stale-while-revalidate

适合于:频繁更新最新版本并非必需的资源。 头像可能属于此类别。

如果有可用的缓存版本,请使用该版本,但会提取更新供下次使用。

self.addEventListener('fetch', function (event) {
  event.respondWith(
    caches.open('mysite-dynamic').then(function (cache) {
      return cache.match(event.request).then(function (response) {
        var fetchPromise = fetch(event.request).then(function (networkResponse) {
          cache.put(event.request, networkResponse.clone());
          return networkResponse;
        });
        return response || fetchPromise;
      });
    }),
  );
});

这与 HTTP 的 stale-while-revalidate 非常相似。

推送消息时

推送消息时。
推送消息时。

Push API 是基于 Service Worker 构建的另一项功能。该 API 允许唤醒 Service Worker 以响应来自操作系统消息传递服务的消息。即使用户没有为您的网站打开标签页,也会如此。只有 Service Worker 会被唤醒。您从页面请求执行此操作的权限,用户将收到提示。

适合于:与通知相关的内容,如聊天消息、突发新闻或电子邮件。同时可用于频繁更改受益于立即同步的内容,如待办事项更新或日历更改。

常见的最终结果是显示一条通知,点按该通知会打开/聚焦一个相关页面,但在此之前更新缓存尤为重要。很明显,用户在收到推送通知时处于在线状态,但是,当他们最终与通知交互时可能已经离线,因此,允许离线访问此内容非常重要。

在显示通知之前,以下代码将更新缓存:

self.addEventListener('push', function (event) {
  if (event.data.text() == 'new-email') {
    event.waitUntil(
      caches
        .open('mysite-dynamic')
        .then(function (cache) {
          return fetch('/inbox.json').then(function (response) {
            cache.put('/inbox.json', response.clone());
            return response.json();
          });
        })
        .then(function (emails) {
          registration.showNotification('New email', {
            body: 'From ' + emails[0].from.name,
            tag: 'new-email',
          });
        }),
    );
  }
});

self.addEventListener('notificationclick', function (event) {
  if (event.notification.tag == 'new-email') {
    // Assume that all of the resources needed to render
    // /inbox/ have previously been cached, e.g. as part
    // of the install handler.
    new WindowClient('/inbox/');
  }
});

后台同步时

后台同步时。
后台同步时。

后台同步是基于 Service Worker 构建的另一项功能。该功能允许您一次性或按(非常具有启发性的)间隔请求后台数据同步。即使用户没有为您的网站打开标签,也会如此。仅唤醒 Service Worker。您从页面请求执行此操作的权限,用户将收到提示。

适合于:非紧急更新,特别是定期进行的更新,每次更新都发送推送通知会显得太频繁,如社交时间表或新闻文章。

self.addEventListener('sync', function (event) {
  if (event.id == 'update-leaderboard') {
    event.waitUntil(
      caches.open('mygame-dynamic').then(function (cache) {
        return cache.add('/leaderboard.json');
      }),
    );
  }
});

缓存持久化

系统为您的源提供了一定量的可用空间以执行所需的操作。该可用空间可在以下所有源存储之间共享:(本地)存储IndexedDB文件系统访问,当然还有缓存

你获得的金额未指定。具体容量因设备和存储条件而异。您可以通过以下代码了解您已获得多少空间容量:

if (navigator.storage && navigator.storage.estimate) {
  const quota = await navigator.storage.estimate();
  // quota.usage -> Number of bytes used.
  // quota.quota -> Maximum number of bytes available.
  const percentageUsed = (quota.usage / quota.quota) * 100;
  console.log(`You've used ${percentageUsed}% of the available storage.`);
  const remaining = quota.quota - quota.usage;
  console.log(`You can write up to ${remaining} more bytes.`);
}

不过,与所有浏览器存储一样,如果设备出现存储压力,浏览器将随时舍弃您的数据。遗憾的是,浏览器无法区分您想要不惜任何代价保留的电影和您不太关心的游戏之间有什么不同。

如需解决此问题,请使用 StorageManager 接口:

// From a page:
navigator.storage.persist()
.then(function(persisted) {
  if (persisted) {
    // Hurrah, your data is here to stay!
  } else {
   // So sad, your data may get chucked. Sorry.
});

当然,用户必须授予权限。为此,请使用 Permissions API。

让用户参与此流程非常重要,因为现在我们可以预期用户会控制删除。如果用户的设备面临存储压力,而清除不重要的数据无法解决问题,用户需要判断要保留和移除哪些项。

为实现此目的,需要操作系统将“持久化”源等同于其存储使用空间细分中的平台专用应用,而不是作为单个项目报告给浏览器。

提供建议 - 响应请求

无论您缓存多少内容,服务工作器都不会使用缓存,除非您指示其在何时使用缓存以及如何使用。以下是用于处理请求的几个模式:

仅缓存

仅限缓存。
仅缓存。

适合于:您认为是网站特定“版本”静态内容的任何内容。您应在安装事件中缓存这些资源,以便到时加以使用。

self.addEventListener('fetch', function (event) {
  // If a match isn't found in the cache, the response
  // will look like a connection error
  event.respondWith(caches.match(event.request));
});

...尽管您通常不需要专门处理这种情况,但缓存、回退到网络涵盖了这种情况。

仅限网络

仅限网络。
仅限网络。

适合于:没有相应离线资源的对象,如分析 ping、非 GET 请求。

self.addEventListener('fetch', function (event) {
  event.respondWith(fetch(event.request));
  // or simply don't call event.respondWith, which
  // will result in default browser behavior
});

...尽管您通常不需要专门处理这种情况,但缓存、回退到网络涵盖了这种情况。

缓存,回退到网络

缓存,回退到网络。
缓存,回退到网络。

适合场景:以离线优先的方式进行构建。在这种情况下,您将以这种方式处理大多数请求。根据传入请求而定,其他模式会有例外。

self.addEventListener('fetch', function (event) {
  event.respondWith(
    caches.match(event.request).then(function (response) {
      return response || fetch(event.request);
    }),
  );
});

其针对缓存中的资源为您提供“仅缓存”行为,而对于未缓存的资源则提供“仅网络”行为(其包含所有非 GET 请求,因为无法对其进行缓存)。

缓存和网络竞态

缓存和网络竞态。
缓存和网络竞态。

适合于:小型资源,可用于改善磁盘访问缓慢的设备的性能。

在硬盘较旧、具有病毒扫描程序且互联网连接很快这几种情形相结合的情况下,从网络获取资源比访问磁盘更快。不过,如果在用户设备上具有相关内容时访问网络会浪费流量,请记住这一点。

// Promise.race is no good to us because it rejects if
// a promise rejects before fulfilling. Let's make a proper
// race function:
function promiseAny(promises) {
  return new Promise((resolve, reject) => {
    // make sure promises are all promises
    promises = promises.map((p) => Promise.resolve(p));
    // resolve this promise as soon as one resolves
    promises.forEach((p) => p.then(resolve));
    // reject if all promises reject
    promises.reduce((a, b) => a.catch(() => b)).catch(() => reject(Error('All failed')));
  });
}

self.addEventListener('fetch', function (event) {
  event.respondWith(promiseAny([caches.match(event.request), fetch(event.request)]));
});

网络回退到缓存

网络回退到缓存。
网络回退到缓存。

适合于:快速修复(网站“版本”以外)频繁更新的资源。例如,文章、头像、社交媒体时间表和游戏排行榜。

这意味着您为在线用户提供最新内容,但离线用户获得的缓存版本较旧。如果网络请求成功,您很可能需要更新缓存条目

不过,此方法存在缺陷。如果用户的网络时断时续或很慢,他们只有在网络出现故障后才能获得已存在于设备上的完全可接受的内容。这需要花很长的时间,并且会导致令人失望的用户体验。请查看下一个模式,缓存然后访问网络,以获得更好的解决方案。

self.addEventListener('fetch', function (event) {
  event.respondWith(
    fetch(event.request).catch(function () {
      return caches.match(event.request);
    }),
  );
});

缓存,然后访问网络

缓存,然后访问网络。
先缓存,然后访问网络。

适合于:频繁更新的内容。例如文章、社交媒体时间表和游戏。

这需要页面发起两次请求,一次是请求缓存,另一次是请求访问网络。该想法是首先显示缓存的数据,然后在网络数据到达时更新页面。

有时候,当新数据(例如,游戏排行榜)到达时,您可以只替换当前数据,但是具有较大的内容时将导致数据中断。从根本上讲,不要使用户正在读取或交互的内容“消失”。

Twitter 在旧内容上方添加新内容,并调整滚动位置,确保用户不会受到干扰。这是可能的,因为 Twitter 通常会保持使内容最具线性特性的顺序。我为 trained-to-thrill 复制了此模式,以尽快获取屏幕上的内容,同时在有最新内容时立即显示。

页面中的代码

var networkDataReceived = false;

startSpinner();

// fetch fresh data
var networkUpdate = fetch('/data.json')
  .then(function (response) {
    return response.json();
  })
  .then(function (data) {
    networkDataReceived = true;
    updatePage(data);
  });

// fetch cached data
caches
  .match('/data.json')
  .then(function (response) {
    if (!response) throw Error('No data');
    return response.json();
  })
  .then(function (data) {
    // don't overwrite newer network data
    if (!networkDataReceived) {
      updatePage(data);
    }
  })
  .catch(function () {
    // we didn't get cached data, the network is our last hope:
    return networkUpdate;
  })
  .catch(showErrorMessage)
  .then(stopSpinner);

Service Worker 中的代码

您应该始终连接到网络并随时更新缓存。

self.addEventListener('fetch', function (event) {
  event.respondWith(
    caches.open('mysite-dynamic').then(function (cache) {
      return fetch(event.request).then(function (response) {
        cache.put(event.request, response.clone());
        return response;
      });
    }),
  );
});

trained-to-thrill 中,我使用 XHR 而非提取,并滥用 Accept 标头告知 Service Worker 从何处获取结果(页面代码Service Worker 代码),解决了此问题。

通用后备

通用后备。
常规回退。

如果您未能从缓存和/或网络提供资源,您可能需要提供常规回退。

适合场景:次要图像,例如头像、失败的 POST 请求和“离线时不可用”页面。

self.addEventListener('fetch', function (event) {
  event.respondWith(
    // Try the cache
    caches
      .match(event.request)
      .then(function (response) {
        // Fall back to network
        return response || fetch(event.request);
      })
      .catch(function () {
        // If both fail, show a generic fallback:
        return caches.match('/offline.html');
        // However, in reality you'd have many different
        // fallbacks, depending on URL and headers.
        // Eg, a fallback silhouette image for avatars.
      }),
  );
});

您回退到的项目可能属于安装依赖项

如果您的网页正在发布电子邮件,您的服务工作器可能会回退以在 IndexedDB 的发件箱中存储电子邮件,并进行响应,让网页知道发送失败,但数据已成功保存。

Service Worker 端模板

ServiceWorker 端模板化。
ServiceWorker 端模板。

适合于:无法缓存其服务器响应的页面。

在服务器上渲染网页可以加快网页加载速度,但这可能意味着要在缓存中包含可能没有意义的状态数据,例如“登录身份...”。如果您的网页由服务工件控制,您可能会改为请求 JSON 数据和模板,并进行渲染。

importScripts('templating-engine.js');

self.addEventListener('fetch', function (event) {
  var requestURL = new URL(event.request.url);

  event.respondWith(
    Promise.all([
      caches.match('/article-template.html').then(function (response) {
        return response.text();
      }),
      caches.match(requestURL.path + '.json').then(function (response) {
        return response.json();
      }),
    ]).then(function (responses) {
      var template = responses[0];
      var data = responses[1];

      return new Response(renderTemplate(template, data), {
        headers: {
          'Content-Type': 'text/html',
        },
      });
    }),
  );
});

归纳总结

您可以同时使用这两种方法。实际上,您可能会根据请求网址使用其中的多个方法。例如,trained-to-thrill 使用:

只需看一下请求并决定要执行的操作即可:

self.addEventListener('fetch', function (event) {
  // Parse the URL:
  var requestURL = new URL(event.request.url);

  // Handle requests to a particular host specifically
  if (requestURL.hostname == 'api.example.com') {
    event.respondWith(/* some combination of patterns */);
    return;
  }
  // Routing for local URLs
  if (requestURL.origin == location.origin) {
    // Handle article URLs
    if (/^\/article\//.test(requestURL.pathname)) {
      event.respondWith(/* some other combination of patterns */);
      return;
    }
    if (/\.webp$/.test(requestURL.pathname)) {
      event.respondWith(/* some other combination of patterns */);
      return;
    }
    if (request.method == 'POST') {
      event.respondWith(/* some other combination of patterns */);
      return;
    }
    if (/cheese/.test(requestURL.pathname)) {
      event.respondWith(
        new Response('Flagrant cheese error', {
          status: 512,
        }),
      );
      return;
    }
  }

  // A sensible default pattern
  event.respondWith(
    caches.match(event.request).then(function (response) {
      return response || fetch(event.request);
    }),
  );
});

...您会获得图片。

赠金

…精致的图标:

  • 代码(由 buzzyrobot 提供)
  • 日历,作者:Scott Lewis
  • 网络:Ben Rizzo
  • 标清,由 Thomas Le Bas 提供
  • CPU(由 iconmind.com 提供)
  • 回收站,由 trasnik 提供
  • 通知,由 @daosme 提供
  • 布局,由 Mister Pixel 提供
  • Cloud,作者:P.J. Onori

同时感谢 Jeff Posnick 在我发布之前找出了许多明显的错误。

深入阅读