文章都会有个阅读量,那这个阅读量是怎么计数的呢?
有同学说,很简单啊,这不就是文章表里加个 views 的字段,然后每次刷新页面都加一么?
这样是可以,但有两个问题:
每次刷新阅读量都加一,其实还是同一个人看的这篇文章,这样统计出来的阅读量是不准的,我们想要的阅读量是有多少人看过这篇文章
阅读是个很高频的操作,直接存到数据库,数据库压力会太大
这两个问题分别都怎么解决呢?
其实我们学完 Redis 就应该能想到解决方案了:
在 redis 中存储 user 和 article 的关系,比如 user_111_article_222 为 key,10 分钟后删除,如果存在这个 key,就说明该用户看过这篇文章,就不更新阅读量,否则才更新
10 分钟后,这个人再看这篇文章,就可以算是新的一次阅读量了。
访问文章时把阅读量加载到 redis,之后的阅读量计数只更新 redis,不更新数据库,等业务低峰期再把最新的阅读量写入数据库
这里在业务低峰期,比如凌晨 4 点的时候写入数据库,可以用定时任务来做。
思路理清了,我们来实现一下:
nest new article-views -p npm
创建个 nest 项目。
安装 typeorm 相关的包:
npm install --save @nestjs/typeorm typeorm mysql2
在 AppModule 引入 TypeOrmModule:
import { Module } from '@nestjs/common';
import { TypeOrmModule } from '@nestjs/typeorm';
import { AppController } from './app.controller';
import { AppService } from './app.service';
@Module({
imports: [
TypeOrmModule.forRoot({
type: "mysql",
host: "localhost",
port: 3306,
username: "root",
password: "guang",
database: "article_views",
synchronize: true,
logging: true,
entities: [],
poolSize: 10,
connectorPackage: 'mysql2',
extra: {
authPlugin: 'sha256_password',
}
}),
],
controllers: [AppController],
providers: [AppService],
})
export class AppModule {}
在 mysql workbench 里创建这个 database
CREATE DATABASE article-views DEFAULT CHARACTER SET utf8mb4;
刷新可以看到这个 database
然后建个文章和用户的模块:
nest g resource user --no-spec
nest g resource article --no-spec
添加 user 和 article 的 entity
import { Column, PrimaryGeneratedColumn, Entity } from "typeorm";
@Entity()
export class User {
@PrimaryGeneratedColumn()
id: number;
@Column({
comment: '用户名'
})
username: string;
@Column({
comment: '密码'
})
password: string;
}
import { Column, Entity, PrimaryGeneratedColumn } from "typeorm";
@Entity()
export class Article {
@PrimaryGeneratedColumn()
id: number;
@Column({
comment: '文章名字',
length: 50
})
title: string;
@Column({
comment: '内容',
type: 'text'
})
content: string;
@Column({
comment: '阅读量',
default: 0
})
viewCount: number;
@Column({
comment: '点赞量',
default: 0
})
likeCount: number;
@Column({
comment: '收藏量',
default: 0
})
collectCount: number;
}
在 entities 引入:
可以看到 typeorm 自动创建了这两个表:
然后插入一些数据:
在 AppController 创建 init-data 的路由,然后注入 EntityManager:
@InjectEntityManager()
private entityManager: EntityManager;
@Get('init-data')
async initData() {
await this.entityManager.save(User, {
username: 'dong',
password: '111111'
});
await this.entityManager.save(User, {
username: 'guang',
password: '222222'
});
await this.entityManager.save(Article, {
title: '基于 Axios 封装一个完美的双 token 无感刷新',
content: `用户登录之后,会返回一个用户的标识,之后带上这个标识请求别的接口,就能识别出该用户。
标识登录状态的方案有两种: session 和 jwt。
`
});
await this.entityManager.save(Article, {
title: 'Three.js 手写跳一跳小游戏',
content: `前几年,跳一跳小游戏火过一段时间。
玩家从一个方块跳到下一个方块,如果没跳过去就算失败,跳过去了就会再出现下一个方块。`
});
return 'done';
}
两个 entity 分别插入 2 条数据。
浏览器访问下:
可以看到 4 条 insert 语句:
在 mysql workbench 里也可以看到两个表都插入了数据:
然后先实现登录:
这次用 session 的方案:
安装相关的包:
npm install express-session @types/express-session
在 main.ts 里启用:
import { NestFactory } from '@nestjs/core';
import { AppModule } from './app.module';
import * as session from 'express-session';
async function bootstrap() {
const app = await NestFactory.create(AppModule);
app.use(session({
secret: 'guang',
resave: false,
saveUninitialized: false
}));
await app.listen(3000);
}
bootstrap();
然后实现下登录:
在 UserController 添加 login 的路由:
@Post('login')
async login(@Body() loginUserDto: LoginUserDto) {
console.log(loginUserDto);
return 'success';
}
新建 src/user/dto/login-user.dto.ts
export class LoginUserDto {
username: string;
password: string;
}
测试下:
然后在 UserService 实现登录逻辑:
@InjectEntityManager()
private entityManager: EntityManager;
async login(loginUser: LoginUserDto) {
const user = await this.entityManager.findOne(User, {
where: {
username: loginUser.username
}
});
if(!user) {
throw new BadRequestException('用户不存在');
}
if(user.password !== loginUser.password) {
throw new BadRequestException('密码错误');
}
return user;
}
在 UserController 调用下:
@Post('login')
async login(@Body() loginUserDto: LoginUserDto, @Session() session) {
const user = await this.userService.login(loginUserDto);
session.user = {
id: user.id,
username: user.username
}
return 'success';
}
调用 userService 的 login 方法,实现登录验证,然后把用户信息存入 session。
当用户不存在时:
当密码错误时:
登录成功时:
然后在 ArticleController 添加一个查询文章的接口:
@Get(':id')
async findOne(@Param('id') id: string) {
return await this.articleService.findOne(+id);
}
实现 articleService.findOne 方法:
@InjectEntityManager()
private entityManager: EntityManager;
async findOne(id: number) {
return await this.entityManager.findOneBy(Article, {
id
});
}
测试下:
然后我们在 ArticleController 加一个阅读的接口:
@Get(':id/view')
async view(@Param('id') id: string) {
return await this.articleService.view(+id);
}
然后在 ArticleService 里实现具体的逻辑:
async view(id: number) {
const article = await this.findOne(id);
article.viewCount ++;
await this.entityManager.save(article);
return article.viewCount;
}
测试下:
数据库里阅读量确实更新了:
再次查询出来的就是新的阅读量:
这样是能实现功能,但有前面我们讲到的两个问题:
每次刷新阅读量都加一,其实还是同一个人看的这篇文章,这样统计出来的阅读量是不准的,我们想要的阅读量是有多少人看过这篇文章
阅读是个很高频的操作,直接存到数据库,数据库压力会太大
所以,我们要引入 redis。
安装 redis 的包:
npm install --save redis
然后创建个 redis 模块:
nest g module redis
nest g service redis
在 RedisModule 创建连接 redis 的 provider,导出 RedisService,并把这个模块标记为 @Global 模块
import { Global, Module } from '@nestjs/common';
import { createClient } from 'redis';
import { RedisService } from './redis.service';
@Global()
@Module({
providers: [
RedisService,
{
provide: 'REDIS_CLIENT',
async useFactory() {
const client = createClient({
socket: {
host: 'localhost',
port: 6379
}
});
await client.connect();
return client;
}
}
],
exports: [RedisService]
})
export class RedisModule {}
然后在 RedisService 里注入 REDIS_CLIENT,并封装一些方法:
import { Inject, Injectable } from '@nestjs/common';
import { RedisClientType } from 'redis';
@Injectable()
export class RedisService {
@Inject('REDIS_CLIENT')
private redisClient: RedisClientType;
async get(key: string) {
return await this.redisClient.get(key);
}
async set(key: string, value: string | number, ttl?: number) {
await this.redisClient.set(key, value);
if(ttl) {
await this.redisClient.expire(key, ttl);
}
}
async hashGet(key: string) {
return await this.redisClient.hGetAll(key);
}
async hashSet(key: string, obj: Record<string, any>, ttl?: number) {
for(let name in obj) {
await this.redisClient.hSet(key, name, obj[name]);
}
if(ttl) {
await this.redisClient.expire(key, ttl);
}
}
}
我们封装了 get、set、hashGet、hashSet 方法,分别是对 redis 的 string、hash 数据结构的读取。
然后在 view 方法里引入 redis:
@Inject(RedisService)
private redisService: RedisService;
async view(id: number) {
const res = await this.redisService.hashGet(`article_${id}`);
if(res.viewCount === undefined) {
const article = await this.findOne(id);
article.viewCount ++;
await this.entityManager.save(article);
await this.redisService.hashSet(`article_${id}`, {
viewCount: article.viewCount,
likeCount: article.likeCount,
collectCount: article.collectCount
});
return article.viewCount;
} else {
await this.redisService.hashSet(`article_${id}`, {
...res,
viewCount: +res.viewCount + 1
});
return +res.viewCount + 1;
}
}
先查询 redis,如果没查到就从数据库里查出来返回,并存到 redis 里。
查到了就更新 redis 的 viewCount,直接返回 viewCount + 1
测试下:
服务端打印了 3 条 sql:
redis 里也有了这个 hash 的结构:
为什么是 3 条呢?
因为 findOne 发一条 select,save 会先发一条 select,再发一条 update。
我们可以优化一下,把 save 换成 update:
await this.entityManager.update(Article, { id }, {
viewCount: article.viewCount
});
然后把 redis 那条数据删掉:
重新跑一下:
现在就只有一条 select、一条 update 了。
然后多刷新几次:
没发送 sql,还是之前那两条:
因为这时候查的是 redis。
redis 里数据更新了:
但是数据库里的 viewCount 还是 8
这样一重启 redis 数据就没了。
所以还要同步到数据库。
同步倒是不用很频繁,可以放在凌晨 4 点,访问量少的时候通过定时任务同步数据库。
我们需要引入定时任务包 @nestjs/schedule
npm install --save @nestjs/schedule
在 AppModule 引入下:
然后创建一个 service:
nest g module task
nest g service task
定义个方法,通过 @Cron 声明每 10s 执行一次:
import { Injectable, Logger } from '@nestjs/common';
import { Cron, CronExpression } from '@nestjs/schedule';
@Injectable()
export class TasksService {
@Cron(CronExpression.EVERY_10_SECONDS)
handleCron() {
console.log('task execute')
}
}
然后就可以看到控制台会每 10s 打印一次
我们在 TaskModule 引入 ArticleModule:
import { Module } from '@nestjs/common';
import { TaskService } from './task.service';
import { ArticleModule } from 'src/article/article.module';
@Module({
imports: [
ArticleModule
],
providers: [TaskService]
})
export class TaskModule {}
并且在 ArticleModule 导出 ArticleService
然后在 TaskService 里注入 articleService
import { Inject, Injectable, Logger } from '@nestjs/common';
import { Cron, CronExpression } from '@nestjs/schedule';
import { ArticleService } from 'src/article/article.service';
@Injectable()
export class TaskService {
@Inject(ArticleService)
private articleService: ArticleService;
@Cron(CronExpression.EVERY_MINUTE)
async handleCron() {
await this.articleService.flushRedisToDB();
}
}
每分钟执行一次,调用 articleService 的 flushRedisToDB 方法。
然后我们实现这个方法:
先在 RedisService 添加一个 keys 方法,用来查询 key:
async keys(pattern: string) {
return await this.redisClient.keys(pattern);
}
然后在 ArticleService 里实现同步数据库的逻辑:
async flushRedisToDB() {
const keys = await this.redisService.keys(`article_*`);
console.log(keys);
}
我们先打印下 keys。
现在只有一个 key,我们再访问下另一篇文章
现在就有 2 个 key 了:
我们把所有的 key 对应的值存入数据库:
async flushRedisToDB() {
const keys = await this.redisService.keys(`article_*`);
for (let i = 0; i < keys.length; i++) {
const key = keys[i];
const res = await this.redisService.hashGet(key);
const [, id] = key.split('_');
await this.entityManager.update(Article, {
id: +id
}, {
viewCount: +res.viewCount,
});
}
}
查询出 key 对应的值,更新到数据库。
测试下:
刷新几次 view 接口,redis 里阅读量增加了:
但是数据库里没变:
过了一会,控制台打印了 2 条 update 语句:
数据库里的数据就更新了:
接下来只要把定时任务的执行时间改为 4 点就好了:
@Cron(CronExpression.EVERY_DAY_AT_4AM)
这样,基于 redis 的阅读量缓存,以及定时任务更新数据库就完成了。
还有剩下的一个问题:
- 每次刷新阅读量都加一,其实还是同一个人看的这篇文章,这样统计出来的阅读量是不准的,我们想要的阅读量是有多少人看过这篇文章
我们可以在用户访问文章的时候在 redis 存一个 10 分钟过期的标记,有这个标记的时候阅读量不增加。
await this.redisService.set(`user_${userId}_article_${id}`, 1, 3);
为了测试方便,我们先设置 3s 过期。
const flag = this.redisService.get(`user_${userId}_article_${id}`);
if(flag) {
return res.viewCount;
}
这里需要传入 userId。
我们在 ArticleController 的 view 方法里传入下:
@Get(':id/view')
async view(@Param('id') id: string, @Session() session, @Req() req) {
return await this.articleService.view(+id, session?.user?.id || req.ip);
}
试试看:
可以看到,现在就不是每次刷新都增加阅读量了,而是 3s 之后再刷新才增加。
在 redis 里可以看到这个 key:
只不过现在没登录,用的是 ip,而本地访问的时候获取的 ip 就是 ::1 这样的,线上就能拿到具体的 ip 了。
然后我们登录下再访问:
这时用的就是用户 id 了:
这样就实现了真实的阅读量计数。
案例代码上传了小册仓库。
总结
我们通过 redis + 定时任务实现了阅读量计数的功能。
因为阅读是个高频操作,所以我们查出数据后存在 redis里,之后一直访问 redis 的数据,然后通过定时任务在凌晨 4 点把最新数据写入数据库。
并且为了统计真实的用户阅读量,我们在 redis 存储了用户看了哪篇文章的标识,10 分钟后过期。
这就是我们常见的阅读量功能的实现原理。