跳转至

XLiu知识空间

弹幕设计

XLiu知识空间

主页
主页
- 梦想
- 标签
调度系统
调度系统
- 概念
- Yarn
  Yarn
- 工作流调度
  工作流调度
  - DophinScheduler
  - ArgoWorkflow
分布式共识/一致性
分布式共识/一致性
- 一致性
- 共识
代码内功
代码内功
- 设计原则
- 代码整洁之道
- 重构
- 设计模式
  设计模式
  - 导览
  - 创建型模式
    创建型模式
    
    （TODO）工厂模式
    
    抽象工厂
    
    单例
    
    构造者模式
  - 结构型模式
    结构型模式
    
    适配器模式
    
    桥接模式
    
    组合模式
    
    装饰模式
    
    外观模式
    
    享元模式
    
    代理模式
  - 行为型模式
    行为型模式
    
    职责链模式
    
    命令模式
    
    解释器模式
    
    迭代器模式
    
    中介者模式
    
    备忘录模式
    
    观察者模式
    
    状态模式
    
    策略模式
    
    模板方法
    
    访问者模式
  - 分布式应用设计模式
- 数据结构
  数据结构
  - 数组
  - 队列
  - 列表
  - 树
  - 散列
    散列
    
    基础
    
    分布式一致性Hash
  - 布隆过滤器
  - Ping-Pong-Buffer
- 算法
  算法
编程语言
编程语言
- Java
  Java
  - Effective java
  - 性能
    性能
    
    常见问题分析
    
    arthas性能分析
    
    cpu profiler
    
    jvm-profile分布式应用分析
  - Native
    Native
    
    概览
    
    JNI
    JNI
    
    原理
    
    示例
    
    JNR
  - JVM
    JVM
    
    即时编译Jit
    
    jvm规范
    
    字节码
  - Agent
  - 序列化
  - 反射
  - 注解
  - SPI
  - 进程
  - 测试
  - 类加载器
  - 命令行工具
  - 版本
- Python
  Python
  - 三方包
    三方包
    
    java和Python互相访问
数据查询
数据查询
- SQL系统对比
- SQL 基础知识
  SQL 基础知识
  - 基础
  - 索引
- 统一SQL-openLooKong-
- 统一SQL-Presto
  统一SQL-Presto
- 基准测试(TPC)
- MySQL
  MySQL
  - 基础
数据系统
数据系统
- 缓存系统
  缓存系统
  - Redis(done)
- 消息队列
  消息队列
  - Apache Pulsar
  - STOMP协议
- 数据管理
  数据管理
  - 数据集成
    数据集成
    
    数据同步
    
    CDC
    
    seatunnel
    
    chunjun
    
    tis
    
    bitsail
  - 数据集成框架(InLong)
- 数据湖
  数据湖
  - Apache Hudi
    Apache Hudi
    
    原理
    
    服务
    服务
    
    压缩（Compaction）
    
    聚簇（clustering）
    
    Spark使用
计算引擎
计算引擎
- Spark
  Spark
  - 概览
  - Spark SQL
    Spark SQL
    
    基础
    
    特性
    
    数据源
    
    CLI
  - Spark Graphx
  - Spark on Yarn
  - Spark Yarn RestAPI
  - Spark Metrics
  - Spark 调优
  - Spark Shuffle
- GPU编程
  GPU编程
  - 介绍
  - Cuda
    Cuda
    
    安装
    
    编程
  - Rocm
    Rocm
    
    编程
CS系统知识
CS系统知识
- 基础
- 网络
  网络
  - 基础
  - LVS
  - http
  - 内网穿透
  - 网络层协议
  - 传输层协议
- 操作系统
- Linux 知识
  Linux 知识
  - 基础
  - acls
  - bash
  - cgroup
  - chmod
  - chroot
  - firewall
  - ip
  - journald
  - log
  - namespace
  - network
  - proc
  - ramdisk
  - rsync
  - services
  - tuning
  - updatedb
  - 进程快照
  - yum
  - 零拷贝
- Linux Shell
  Linux Shell
  - basic
  - args
- OSLabCourse
  OSLabCourse
  - 大纲
  - 操作系统概述
机器学习
机器学习
- 图像视频
  图像视频
  - 图像特征
- 自然语言处理NLP
  自然语言处理NLP
  - 动手做聊天机器人(TODO)
- 示例案例
- 部署平台
  部署平台
  - kserve
Devops
Devops
- 概览
- 代码仓库
  代码仓库
  - Gitlab
- CI/CD
  CI/CD
  - 概览
  - Gitlab CI
  - Drone CI
  - Gitlab CD
  - argo cd
  - 版本自动发布
  - 制品库
- Ansible(部署)
- Prometheus(时序数据存储)
- Ansible(部署)
- 数据来源
  数据来源
  - 日志收集
  - 节点监控
- 部署
  部署
  - K8s集群交付
- 实战
Web服务
Web服务
- 实战
  实战
  - 数据权限
  - 实时消息推送
  - 弹幕设计弹幕设计
    目录
    
    视频的弹幕设计（B站）
    
    直播的弹幕设计
    
    需求分析
    
    带宽优化
    
    弹幕卡顿、丢失分析
    
    可靠与性能
  - 视频播放
- 后端
  后端
  - servlet及容器(done)
  - 全局ID生成器(done)
  - 接口管理设计(done)
  - 缓存(done)
  - 操作日志
  - 数据库
  - Spring
    Spring
    
    SpringBoot
  - SpringCloud
    SpringCloud
    
    介绍
    
    网关
    
    服务发现
  - 分布式追踪
    分布式追踪
    
    概览
  - 模板引擎
  - 规则引擎
  - 状态机框架
  - 指标系统
  - MQTT
- 认证
- 授权
- 安全
工具
工具
- maven
  maven
  - 基础
  - 插件
- markdown
  markdown
  - 公式
  - 图
  - Typora
- mkdocs
- 开源协议声明

弹幕设计

视频的弹幕设计（B站）

直播的弹幕设计

如何设计一个 70w 在线人数的弹幕系统？CSDN博客

需求分析

70w 在线人数的弹幕系统

带宽压力

假如说每3秒促达用户一次，那么每次内容至少需要有15条才能做到视觉无卡顿。15条弹幕+http包头的大小将超过3k，那么每秒的数据大小约为8Gbps，

带宽优化

Http 压缩（小数据的 Http 压缩的性价比？）

通过查阅资料，http gzip压缩比率可以达到40%以上（gzip比deflate要高出4%~5%）

弹幕的 Response 结构简化，降低传输字节数
内容排列顺序优化，将字符串和数字内容放在一起摆放，增加压缩比；
频率控制
带款控制：通过添加请求间隔参数（下次请求时间），保证客户端的请求频率服务端可控
通过添加请求间隔参数（下次请求时间），保证客户端的请求频率服务端可控

弹幕卡顿、丢失分析

根据了解腾讯云的弹幕系统，在300人以下使用的是推送模式，300人以上则是采用的轮训模式。

促达机制，推送 vs 拉取

Long Pulling
减少轮询次数，低延迟，浏览器兼容性较好
服务器需要保持大量连接
WebSocket：
较少的控制开销（相对于 HTTP 请求每次都要携带完整的头部），更强的实时性；
每个客户端使用一个持久化的连接

Long Polling 能发现连接异常的最短间隔为：\(min(keepalive\_intvl, polling\_interval)\)

Websockets能发现连接异常的最短间隔为：\(min(keepalive\_intvl, client\_sending\_interval)\)

弱网情况下Websockets其实已经不能作为一个候选项

即使Websockets服务端已经发现连接断开，仍然没有办法推送数据，只能被动等待客户端重新建立好连接才能推送，在此之前数据将可能会被采取丢弃的措施处理掉；（没有缓存/入库？）
在每次断开后均需要再次发送应用层的协议进行连接建立。

可靠与性能

将逻辑较为复杂、调用较少的发送弹幕业务与逻辑简单、调用量高的弹幕拉取服务拆分开来。

不同服务的QPS往往是不对等的，例如像拉取弹幕的服务的请求频率和负载通常会比发送弹幕服务高1到2个数量级

拉取弹幕

数据更新的策略是服务会定期发起RPC调⽤从弹幕服务拉取数据，拉取到的弹幕缓存到内存中
缓存：按照时间进行分片（采用 RingBuffer），最多保留60秒的数据，只保留了尾指针，它随着时间向前移动，每⼀秒向前移动一格
读请求：缓冲环会根据客户端传入的时间戳计算出指针的索引位置，并从尾指针的副本区域往回遍历直至跟索引重叠，收集到一定数量的弹幕列表返回
写操作是单线程，读和写是相反的方向，⽽决定读和写的位置是否出现重叠取决于index的位置，
保证读操作最多只能读到30秒内的数据，因此缓冲环完全可以做到无锁读写

发送弹幕

用户一定时间能看得过来弹幕总量是有限
对弹幕进行限流，有选择的丢弃多余的弹幕