Cache
There are only two hard things in Computer Science: cache invalidation and naming things.
– Phil Karlton
概要
優れたキャッシュシステムはユーザー体験の本質的な質を向上させ、資源利用コストと環境負荷を下げます。 BEAR.Sundayは従来のTTLによる単純なキャッシュに加えて、以下のキャッシュ機能をサポートします。
- イベント駆動のキャッシュ無効化
- キャッシュの依存解決
- ドーナッツキャッシュとドーナッツの穴キャッシュ
- CDNコントロール
- 条件付きリクエスト
分散キャッシュフレームワーク
REST制約に従った分散キャッシュシステムは、計算資源だけでなくネットワーク資源も節約します。
PHPが直接扱うRedisやAPCなどのサーバーサイドキャッシュ、コンテンツ配信ネットワーク(CDN)として知られる共有キャッシュ、WebブラウザやAPIクライアントでキャッシュされるクライアントサイドキャッシュ、BEAR.SundayはこれらのキャッシュとモダンCDNを統合したキャッシングフレームワークを提供します。
タグベースでのキャッシュ無効化
コンテンツキャッシュには依存性の問題があります。コンテンツAがコンテンツBに依存し、BがCに依存している場合、Cが更新されるとCのキャッシュとETagだけでなく、Cに依存するBのキャッシュとETag、Bに依存するAのキャッシュとETagも更新されなければなりません。
BEAR.Sundayはそれぞれのリソースが依存リソースのURIをタグとして保持する事でこの問題を解決します。#[Embed]
で埋め込まれたリソースに変更があると、関係する全てのリソースのキャッシュとETagが無効化され、次のリクエストのためにキャッシュの再生性が行われます。
ドーナッツキャッシュ
ドーナツキャッシュはキャッシュの最適化のための部分キャッシュ技術の1つです。コンテンツをキャッシュ可能な箇所とそうでない箇所に分けて合成します。
例えば”Welcome to $name
“というキャッシュできないリソースが含まれるコンテンツを考えてみてください。キャッシュできない(do-not cache)部分と、その他のキャッシュ可能な部分と合成して出力します。
この場合コンテンツ全体としては動的なので、ドーナッツ全体はキャッシュされません。そのためETagも出力されません。
ドーナッツの穴キャッシュ
ドーナッツの穴部分がキャッシュ可能の時もドーナッツキャッシュと同じように扱えます。
上記の例では、1時間に一度変更される天気予報のリソースがキャッシュされニュースリソースに含まれます。この場合、ドーナツ全体(ニュース)としてのコンテンツは静的なので全体もキャッシュされETagも付与されます。
この時にキャッシュの依存性が発生します。 ドーナッツの穴部分のコンテンツが更新された時に、キャッシュされたドーナッツ全体も再生成される必要があります。
素晴らしい事にこの依存解決は自動で行われます。その時に計算資源を最小化するためにドーナツ部分の計算は再利用されます。穴の部分(天気リソース)が更新されると全体のコンテンツのキャッシュとETagも自動で更新されます。
リカーシブ・ドーナッツ
ドーナッツ構造は再起され適用されます。 例えば、AがBを含みBがCを含むコンテンツのCが変更された時に、変更されたCの部分を除いてAのキャッシュとBのキャッシュは再利用されます。AとBのキャッシュ、ETagは再生成されますが、A、Bのコンテンツ取得のためのDBアクセスやビューのレンダリングは行われません。 例えば、AがBを含み、BがCを含むコンテンツの場合に、Cが変更された時に、変更されたCの部分を除いてAのキャッシュとBのキャッシュは再利用されます。AやBのコンテンツ取得のためのDBアクセスやビューのレンダリングは行われません。新しく部分合成されたAとBのキャッシュ、ETagは再生成されます。
最適化された構造の部分キャッシュが、最小のコストでコンテンツ再生成を行います。クライアントはコンテンツのキャッシュ構造について知る必要がありません。
イベントドリブン型コンテンツ
従来、CDNはアプリケーションロジックを必要とするコンテンツは「動的」であり、したがってCDNではキャッシュはできないと考えられてきました。しかしFastlyやAkamaiなどの一部のCDNは即時または数秒以内でのタグベースでのキャッシュ無効化が可能になり、この考えは過去のものになろうとしています。
BEAR.Sundayの依存解決はサーバーサイドだけでなく共有キャッシュでも行われます。AOPが変更を検知し共有キャッシュにPURGEリクエストを行うことで、サーバーサイドと同じように共有キャッシュ上の関連キャッシュの無効化が行われます。
条件付きリクエスト
コンテンツの変更はAOPで管理され、コンテンツのエンティティタグ(ETag)は自動で更新されます。ETagを使ったHTTPの条件付きリクエストは計算資源の利用を最小化するだけでなく、304 Not Modified
を返すだけの応答はネットワーク資源の利用も最小化します。
利用法
キャッシュ対象のクラスにドーナッツキャッシュの場合(埋め込みコンテンツがキャッシュ不可能な場合)は#[DonutCache]
、それ以外の場合は#[CacheableResponse]
とアトリビュートを付与します。
use BEAR\RepositoryModule\Annotation\CacheableResponse;
#[CacheableResponse]
class BlogPosting extends ResourceObject
{
public $headers = [
RequestHeader::CACHE_CONTROL => CacheControl::NO_CACHE
];
#[Embed(rel: "comment", src: "page://self/html/comment")]
public function onGet(int $id = 0): static
{
$this->body['article'] = 'hello world';
return $this;
}
public function onDelete(int $id = 0): static
{
return $this;
}
}
キャッシュ対象メソッドを選択したい場合はクラスに属性を指定しないで、メソッドに指定します。その場合はキャッシュ変更メソッドに#[RefreshCache]
という属性を付与します。
class Todo extends ResourceObject
{
#[CacheableResponse]
public function onPut(int $id = 0, string $todo): static
{
}
#[RefreshCache]
public function onDelete(int $id = 0): static
{
}
}
どちらかの方法でアトリビュートを付与すると、概要で紹介した全ての機能が適用されます。 イベントドリブン型コンテンツを想定してデフォルトでは時間(TTL)によるキャッシュの無効化は行われません
#[DonutCache]
の場合はコンテンツ全体はキャッシュされず、 #[CacheableResponse]
の場合はされる事に注意してください。
TTL
TTLの指定はDonutRepositoryInterface::put()
で行います。
ttl
はドーナツの穴以外のキャッシュ時間、sMaxAge
はCDNのキャッシュ時間です。
use BEAR\RepositoryModule\Annotation\CacheableResponse;
#[CacheableResponse]
class BlogPosting extends ResourceObject
{
public function __construct(private DonutRepositoryInterface $repository)
{}
#[Embed(rel: "comment", src: "page://self/html/comment")]
public function onGet(): static
{
// process ...
$this->repository->put($this, ttl:10, sMaxAge:100);
return $this;
}
}
TTLの既定値
イベントドリブン型コンテンツでは、コンテンツが変更されたらキャッシュにすぐに反映されなければなりません。そのため、既定値のTTLはCDNのモジュールのインストールによって変わります。CDNがタグベースでのキャッシュ化を無効化をサポートしていればTTLは無期限(1年間)で、サポートの無い場合には10秒です。
キャッシュ反映時間は、Fastlyなら即時、Akamaiなら数秒、それ以外なら10秒が期待される時間です。
カスタマイズするにはCdnCacheControlHeader
を参考にCdnCacheControlHeaderSetterInterface
を実装して束縛します。
キャッシュ無効化
手動でキャッシュを無効化するにはDonutRepositoryInterface
のメソッドを用います。
指定されたキャッシュだけでなく、そのETag、依存にしている他のリソースののキャッシュとそのETagがサーバーサイド、及び可能な場合はCDN上のキャッシュも共に無効化されます。
interface DonutRepositoryInterface
{
public function purge(AbstractUri $uri): void;
public function invalidateTags(array $tags): void;
}
URIによる無効化
// example
$this->repository->purge(new Uri('app://self/blog/comment'));
タグによる無効化
$this->repository->invalidateTags(['template_a', 'campaign_b']);
CDNでタグの無効化
CDNでタグベースでのキャッシュ無効化を有効にするためにはPurgerInterface
を実装して束縛する必要があります。
use BEAR\QueryRepository\PurgerInterface;
interface PurgerInterface
{
public function __invoke(string $tag): void;
}
依存タグの指定
PURGE用のキーを指定するためにはSURROGATE_KEY
ヘッダーで指定します。複数文字列の時はスペースをセパレータに使います。
use BEAR\QueryRepository\Header;
class Foo
{
public $headers = [
Header::SURROGATE_KEY => 'template_a campaign_b'
];
template_a
またはcampaign_b
のタグによるキャッシュの無効化が行われた場合、FooのキャッシュとFooのETagはサーバーサイド、CDN共に無効になります。
リソースの依存
UriTagInterface
を使ってURIを依存タグ文字列に変換します。
public function __construct(private UriTagInterface $uriTag)
{}
$this->headers[Header::SURROGATE_KEY] = ($this->uriTag)(new Uri('app://self/foo'));
app://self/foo
に変更があった場合にこのキャッシュはサーバーサイド、CDN共に無効化されます。
連想配列をリソースの依存に
// bodyの内容
[
['id' => '1', 'name' => 'a'],
['id' => '2', 'name' => 'b'],
]
上記のようなbody
連想配列から、依存するURIタグリストを生成する場合はfromAssoc()
メソッドでURIテンプレートを指定します。
$this->headers[Header::SURROGATE_KEY] = $this->uriTag->fromAssoc(
uriTemplate: 'app://self/item{?id}',
assoc: $this->body
);
上記の場合、app://self/item?id=1
及びapp://self/item?id=2
に変更があった場合に、このキャッシュはサーバーサイド、CDN共に無効化されます。
CDN
特定CDN対応のモジュールをインストールするとベンダー固有のヘッダーが出力されます。
$this->install(new FastlyModule())
$this->install(new AkamaiModule())
マルチCDN
CDNを多段構成にして、役割に応じたTTLを設定することもできます。例えばこの図では上流に多機能なCDNを配置して、下流にはコンベンショナルなCDNを配置しています。コンテンツのインバリデーションなどは上流のCDNに対して行い、下流のCDNはそれを利用するようにします。
レスポンスヘッダー
CDNのキャッシュコントロールについてはBEAR.Sundayが自動で行いCDN用のヘッダーを出力します。クライアントのキャッシュコントロールはコンテンツに応じてResourceObjectの$header
に記述します。
セキュリティやメンテナンスの観点からこのセクションは重要です。
全てのResourceObjectでCache-Control
を指定するようにしましょう。
キャッシュ不可
キャッシュができないコンテンツは必ず指定しましょう。
ResponseHeader::CACHE_CONTROL => CacheControl::NO_STORE
条件付きリクエスト
サーバーにコンテンツ変更がないかを確認してから、キャッシュを利用します。サーバーサイドのコンテンツの変更は検知され反映されます。
ResponseHeader::CACHE_CONTROL => CacheControl::NO_CACHE
クライアントキャッシュ時間の指定
クライントでキャッシュされます。最も効率的なキャッシュですが、サーバーサイドでコンテンツが変更されても指定した時間に反映されません。
またブラウザのリロード動作ではこのキャッシュは利用されません。<a>
タグで遷移、またはURL入力した場合にキャッシュが利用されます。
ResponseHeader::CACHE_CONTROL => 'max-age=60'
レスポンス速度を重視する場合には、SWRの指定も検討しましょう。
ResponseHeader::CACHE_CONTROL => 'max-age=30 stale-while-revalidate=10'
この場合、max-ageの30秒を超えた時にオリジンサーバーからフレッシュなレスポンス取得が完了するまで、SWRで指定された最大10秒間はそれまでの古いキャッシュ(stale)レスポンスを返します。つまりキャッシュが更新されるのは最後のキャッシュ更新から30秒から40秒間の間のいずれかになりますが、どのリクエストもキャッシュからの応答になり高速です。
RFC7234対応クライアント
APIでクライアントキャッシュを利用する場合にはRFC7234対応APIクライアントを利用します。
- iOS NSURLCache
- Android HttpResponseCache
- PHP guzzle-cache-middleware
- JavaScript(Node) cacheable-request
- Go lox/httpcache
- Ruby faraday-http-cache
- Python requests-cache
プライベート
キャッシュを他のクライアントと共有しない時にはprivate
を指定します。クライアントサイドのみキャッシュ保存されます。この場合サーバーサイドではキャッシュ指定をしないようにします。
ResponseHeader::CACHE_CONTROL => 'private, max-age=30'
共用キャッシュを利用する場合でもほとんどの場合において
public
を指定する必要はありません。
キャッシュ設計
API(またはコンテンツ)は情報API (Information API)、計算API (Computation API)は2つに分けることができます。計算APIは再現が難しく真に動的でキャッシュに不適なコンテンツです。一方の情報APIはDBから読み出され、PHPで加工されたとしても本質的には静的なコンテンツのAPIです。
適切なキャシュを適用するためにコンテンツを分析します。
- 情報APIか計算APIか
- 依存関係は
- 内包関係は
- 無効化はイベントがトリガーか、それともTTLか
- イベントはアプリケーションが検知可能か、監視が必要か
- TTLは予測可能か不可能か
キャッシュ設計をアプリケーション設計プロセスの一部にして、仕様にする事も検討しましょう。 ライフサイクルを通してプロジェクトの安全性にも寄与するはずです。
アダプティブ TTL
コンテンツの生存期間が予測可能で、その期間にイベントによる更新が行われない時はそれをクライントやCDNに正しく伝えます。例えば株価のAPIを扱う時、現在が金曜日の夜だとすると月曜の取引開始時間までは情報更新が行われない事が分かっています。その時間までの秒数を計算してTTLとして指定し、取引時間の時には適切なTTLを指定します。
クライアントは更新がないと分かっているリソースにリクエストする必要はありません。
#[Cacheable]
従来の#[Cacheable]によるTTLキャッシュもサポートされます。
例)サーバーサイドで30秒キャシュ、クライアントでも30秒キャシュ。
サーバーサイドで指定してるのでクライアントサイドでも同じ秒数でキャッシュされます。
use BEAR\RepositoryModule\Annotation\Cacheable;
#[Cacheable(expirySecond: 30)]
class CachedResource extends ResourceObject
{
例)指定した有効期限($body['expiry_at']
の日付)までサーバー、クライアント供にキャッシュ
use BEAR\RepositoryModule\Annotation\Cacheable;
#[Cacheable(expiryAt: 'expiry_at')]
class CachedResource extends ResourceObject
{
その他はHTTPキャッシュページをご覧ください。
結論
Webのコンテンツは情報(データ)型のものと計算(プロセス)型のものがあります。前者は本質的には静的ですが、コンテンツの変更や依存性の管理の問題で完全に静的コンテンツとして扱うのが難しく、コンテンツの変更が発生していないのにTTLによるキャッシュの無効化が行われていました。 BEAR.Sundayのキャッシングフレームワークは情報型のコンテンツを可能な限り静的に扱い、キャッシュの力を最大化します。