缓存穿透 : DB 承受了没有必要的查询流量,意思就是查到空值的时候没有做缓存处理,再次查询的时候继续读库了
比如:一般情况请求直接从缓存中取数据,如果缓存中没有,则从DB中加载数据并回设到缓存。假如前端传一个后端数据库中没有的数据,那么缓存中肯定也是没有的,则会直接读DB,这就是缓存穿透。
解决方法:
方法一:是布隆过滤器。它是一种空间效率极高的概率型算法和数据结构,用于判断一个元素是否在集合中(类似Hashset)。它的核心是一个很长的二进制向量和一系列的hash函数。使用谷歌的guava实现布隆过滤器。
- 存在误算率,随着存入的元素数量增加,误算率也随着增加
- 一般情况下不能从布隆过滤器删除元素
- 数组长度以及hash函数个数确定过程复杂
布隆过滤器的使用场景?
- 垃圾邮件地址过滤(地址数量很庞大)
- 爬虫URL地址去重
- 解决缓存击穿问题
布隆过滤器介绍与实现
参考链接:http://imhuchao.com/1271.html
方法二:存储空结果,并设置空结果的时间
缓存击穿:热点 Key,大量并发读请求引起的小雪崩, 就是缓存在某个时间点过期的时候,恰好在这个时间点对这个 Key 有大量的并发请求过来,这些请求发现缓存过期一般都会从后端 DB 加载数据并回设到缓存,这个时候大并发的请求可能会瞬间把后端 DB 压垮
解决方法:
方法一:1.使用分布是缓存支持的互斥锁(mutex key),去set一个mutex key,当操作返回成功时,再进行load db的操作并回设缓存,也就是load DB 只会一个线程处理。
方法二:提前”使用互斥锁(mutex key):在value内部设置1个超时值(timeout1), timeout1比实际的memcache timeout(timeout2)小。当从cache读取到timeout1发现它已经过期时候,马上延长timeout1并重新设置到cache。然后再从数据库加载数据并设置到cache中。增加了业务代码的侵入过多,以及增加了编码复杂性
方法三: “永远不过期”: 从redis上看,确实没有设置过期时间,这就保证了,不会出现热点key过期问题,也就是“物理”不过期。从功能上看,如果不过期,那不就成静态的了吗?所以我们把过期时间存在key对应的value里,如果发现要过期了,通过一个后台的异步线程进行缓存的构建,也就是“逻辑”过期
缓存雪崩:缓存设置同一过期时间,引发的大量的读取数据库操作
解决方法:
方法一:大多数系统设计者考虑用加锁或者队列的方式保证缓存的单线程(进程)写,从而避免失效时大量的并发请求落到底层存储系统上
方法二:失效时间随机值