Redis核心技术18-Redis缓冲是如何工作的
# Redis核心技术18-Redis缓冲是如何工作的
Redis提供了高性能的数据存取功能,所以广泛应用在缓冲场景中,既能有效地提升业务应用的响应速度,还可以避免把高并发大压力的请求发送到数据库层。
但是如果Redis做缓冲时出现了问题,大量请求就会直接积压到数据库层,必然会给数据库带来巨大的压力,很可能会导致数据库宕机或是故障,那么,业务应用就没有办法存取数据、响应用户请求了。
# 缓冲的特征
一个系统中的不同层之间的访问速度不一样,所以我们才需要缓冲,这样就可以把一些需要频繁访问的数据放在缓冲中,来加快它们的访问速度。
如果每次CPU处理数据时,都要从ms级别的慢速磁盘中获取数据,然后再进行处理,CPU 只能等磁盘的数据传输完成。这样一来,高速的 CPU 就被慢速的磁盘拖累了,整个计算机系统的运行速度会变得非常慢。
计算机系统中,默认有两种缓冲:
- CPU 里面的末级缓存,即 LLC,用来缓存内存中的数据,避免每次从内存中存取数据
- 内存中的高速页缓存,即 page cache,用来缓存磁盘中的数据,避免每次从磁盘中存取数据。
跟内存相比,LLC 的访问速度更快,而跟磁盘相比,内存的访问是更快的。所以,我们可以看出来缓存的第一个特征:在一个层次化的系统中,缓存一定是一个快速子系统,数据存在缓存中时,能避免每次从慢速子系统中存取数据。对应到互联网应用来说,Redis 就是快速子系统,而数据库就是慢速子系统了。
同时除了速度,我们再从存储大小来看包含了缓存的第二个特征:缓存系统的容量大小总是小于后端慢速系统的,我们不可能把所有数据都放在缓存系统中。
所以缓存和后端慢速系统之间,必然存在数据写回和再读取的交互过程。简单来说,缓存中的数据需要按一定规则淘汰出去,写回后端系统,而新的数据又要从后端系统中读取进来,写入缓存。
# Redis缓冲处理请求的两种情况
通常我们会把Redis部署在数据库前端,业务应用访问数据时,会先查询Redis中是否保存了相应的数据,此时根据数据是否存在缓冲,会有两种情况。
- 缓存命中:Redis 中有相应数据,就直接读取 Redis,性能非常快。
- 缓存缺失:Redis 中没有保存相应数据,就从后端数据库中读取数据,性能就会变慢。而且,一旦发生缓存缺失,为了让后续请求能从缓存中读取到数据,我们需要把缺失的数据写入 Redis,这个过程叫作缓存更新。
使用Redis缓冲时,有三个基本操作:
应用读取数据时,需要先读取 Redis
发生缓存缺失时,需要从数据库读取数据
发生缓存缺失时,还需要更新缓存。
# Redis作为旁路缓冲的使用操作
部署之后的Redis实例,只会被动地等待客户端发送请求,然后再进行处理。如果应用程序想要使用Redis缓存,就要在程序中增加相应的缓存操作代码。我们把 Redis 称为旁路缓存,也就是说,读取缓存、读取数据库和更新缓存的操作都需要在应用程序中来完成。
- 当应用程序需要读取数据时,我们需要在代码中显式调用 Redis 的 GET 操作接口,进行查询;
- 如果缓存缺失了,应用程序需要再和数据库连接,从数据库中读取数据;
- 当缓存中的数据需要更新时,我们也需要在应用程序中显式地调用 SET 操作接口,把更新的数据写入缓存。
除了从Redis 缓存中查询、读取数据以外,应用程序还可能会对数据进行修改,这时,我们既可以在缓存中修改,也可以在后端数据库中进行修改,这就涉及到了 Redis 缓存的两种类型:只读缓存和读写缓存。
# 缓存的类型
按照Redis 缓存是否接受写请求,我们可以把它分成只读缓存和读写缓存。
# 只读缓存
当 Redis 用作只读缓存时,应用要读取数据的话,会先调用 Redis GET 接口,查询数据是否存在。而所有的数据写请求,会直接发往后端的数据库,在数据库中增删改。对于删改的数据来说,如果 Redis 已经缓存了相应的数据,应用需要把这些缓存的数据删除,Redis 中就没有这些数据了。
当应用再次读取这些数据时,会发生缓存缺失,应用会把这些数据从数据库中读出来,并写到缓存中。这样一来,这些数据后续再被读取时,就可以直接从缓存中获取了,能起到加速访问的效果。
只读缓存直接在数据库中更新数据的好处是,所有最新的数据都在数据库中,而数据库是提供数据可靠性保障的,这些数据不会有丢失的风险。当我们需要缓存图片、短视频这些用户只读的数据时,就可以使用只读缓存这个类型了。
# 读写缓存
对于读写缓存来说,除了读请求会发送到缓存进行处理(直接在缓存中查询数据是否存在),所有的写请求也会发送到缓存,在缓存中直接对数据进行增删改操作。此时,得益于 Redis 的高性能访问特性,数据的增删改操作可以在缓存中快速完成,处理结果也会快速返回给业务应用,这就可以提升业务应用的响应速度。
但是由于最新的数据是在Redis中,而Redis是内存数据库,一旦出现宕机,内存中的数据就会丢失,这也就是说应用的最新数据可能会丢失,给应用业务带来风险。所以根据业务应用对数据可靠性和缓存性能的不同要求,我们会有同步直写
和异步写回
两种策略。其中,同步直写策略优先保证数据可靠性,而异步写回策略优先提供快速响应。
- 同步直写是指,写请求发给缓存的同时,也会发给后端数据库进行处理,等到缓存和数据库都写完数据,才给客户端返回。这样,即使缓存宕机或发生故障,最新的数据仍然保存在数据库中,这就提供了数据可靠性保证。但是需要等待数据库处理才能给应用返回结果,增加了缓存的响应延迟。
- 异步写回策略,则是优先考虑了响应延迟。此时,所有写请求都先在缓存中处理。等到这些增改的数据要被从缓存中淘汰出来时,缓存将它们写回后端数据库。这样一来,处理这些数据的操作是在缓存中进行的,很快就能完成。只不过,如果发生了掉电,而它们还没有被写回数据库,就会有丢失的风险了。
两者的选取如下:
- 如果需要对写请求进行加速,我们选择读写缓存;
- 如果写请求很少,或者是只需要提升读请求的响应速度的话,我们选择只读缓存。