自然醒的博客

什么是 LFU 算法?

· shenfq

上次的文章介绍了 LRU 算法,今天打算来介绍一下 LFU 算法。在上篇文章中有提到, LFU(Least frequently used:最少使用)算法与 LRU 算法只是在淘汰策略上有所不同,LRU 倾向于保留最近有使用的数据,而 LFU 倾向于保留使用频率较高的数据。

举一个简单的🌰:缓存中有 A、B 两个数据,且已达到上限,如果 数据 A 先被访问了 10 次,然后 数据 B 被访问 1 次,当存入新的 数据 C 时,如果当前是 LRU 算法,会将 数据 A 淘汰,而如果是 LFU 算法,则会淘汰 数据 B

简单来说,就是在 LRU 算法中,不管访问的频率,只要最近访问过,就不会将这个数据淘汰,而在 LFU 算法中,将访问的频率作为权重,只要访问频率越高,该数据就越不会被淘汰,即使该数据很久没有被访问过。

算法实现§

我们还是通过一段 JavaScript 代码来实现这个逻辑。

class LFUCache {
	freqs = {} // 用于标记访问频率
	cache = {} // 用于缓存所有数据
	capacity = 0 // 缓存的最大容量
	constructor (capacity) {
    // 存储 LFU 可缓存的最大容量
		this.capacity = capacity
	}
}

与 LRU 算法一样,LFU 算法也需要实现 getput 两个方法,用于获取缓存和设置缓存。

class LFUCache {
  // 获取缓存
	get (key) { }
  // 设置缓存
	put (key, value) { }
}

老规矩,先看设置缓存的部分。如果该缓存的 key 之前存在,需要更新其值。

class LFUCache {
  // cache 作为缓存的存储对象
  // 其解构为: { key: { freq: 0, value: '' } }
  // freq 表示该数据读取的频率;
  // value 表示缓存的数据;
	cache = {}
  // fregs 用于存储缓存数据的频率
  // 其解构为: { 0: [a], 1: [b, c], 2: [d] }
  // 表示 a 还没被读取,b/c 各被读取1次,d被读取2次
  freqs = {}
  // 设置缓存
  put (key, value) {
    // 先判断缓存是否存在
    const cache = this.cache[key]
    if (cache) {
      // 如果存在,则重置缓存的值
      cache.value = value
      // 更新使用频率
      let { freq } = cache
      // 从 freqs 中获取对应 key 的数组
      const keys = this.freqs[freq]
      const index = keys.indexOf(key)
      // 从频率数组中,删除对应的 key
      keys.splice(index, 1)
      if (keys.length === 0) {
        // 如果当前频率已经不存在 key
        // 将 key 删除
        delete this.freqs[freq]
      }
      // 更新频率加 1
      freq = (cache.freq += 1)
      // 更新频率数组
      const freqMap =
            this.freqs[freq] ||
            (this.freqs[freq] = [])
      freqMap.push(key)
      return
    }
  }
}

如果该缓存不存在,要先判断缓存是否超过容量,如果超过,需要淘汰掉使用频率最低的数据。

class LFUCache {
  // 更新频率
  active (key, cache) {
    // 更新使用频率
    let { freq } = cache
    // 从 freqs 中获取对应 key 的数组
    const keys = this.freqs[freq]
    const index = keys.indexOf(key)
    // 从频率数组中,删除对应的 key
    keys.splice(index, 1)
    if (keys.length === 0) {
      // 如果当前频率已经不存在 key
      // 将 key 删除
      delete this.freqs[freq]
    }
    // 更新频率加 1
    freq = (cache.freq += 1)
    // 更新读取频率数组
    const freqMap = this.freqs[freq] || (this.freqs[freq] = [])
    freqMap.push(key)
  }
  // 设置缓存
  put (key, value) {
    // 先判断缓存是否存在
    const cache = this.cache[key]
    if (cache) {
      // 如果存在,则重置缓存的值
      cache.value = value
      this.active(key, cache)
      return
    }
    // 判断缓存是否超过容量
    const list = Object.keys(this.cache)
    if (list.length >= this.capacity) {
      // 超过存储大小,删除访问频率最低的数据
      const [first] = Object.keys(this.freqs)
      const keys = this.freqs[first]
      const latest = keys.shift()
      delete this.cache[latest]
      if (keys.length === 0) delete this.freqs[latest]
    }
    // 写入缓存,默认频率为0,表示还未使用过
    this.cache[key] = { value, freq: 0 }
    // 写入读取频率数组
    const freqMap = this.freqs[0] || (this.freqs[0] = [])
    freqMap.push(key)
  }
}

实现了设置缓存的方法后,再实现获取缓存就很容易了。

class LRUCache {
  // 获取数据
	get (key) {
		if (this.cache[key] !== undefined) {
    	// 如果 key 对应的缓存存在,更新其读取频率
      // 之前已经实现过,可以直接复用
			this.active(key)
			return this.cache[key]
		}
		return undefined
  }
}

关于 LFU 缓存算法实现就到这里了,当然该算法一般使用双链表的形式来实现,这里的实现方式,只是为了方便理解其原理,感兴趣的话可以在网上搜索下更加高效的实现方式。