第 17 章:性能优化实战
学习目标
- 综合运用优化技术
- 分析性能瓶颈
- 达到性能目标
17.1 优化目标
目标:CPI < 0.7(IPC > 1.4)
思考:如何达到这个目标?
17.2 优化清单
1. 分支预测
- GShare 预测器
- BTB(256 项)
- RAS(8 项)
- 目标:准确率 > 90%
2. Cache
- I-Cache(16KB,2 路)
- D-Cache(16KB,2 路)
- 目标:命中率 > 95%
3. 流水线
- 双发射
- 数据转发
- 分支延迟槽
17.3 性能测试
# 运行 CoreMark
./coremark.elf
# 查看性能计数器
Cycles: 1000000
Instructions: 1500000
IPC: 1.5
思考:哪个优化带来的提升最大?