学习目标

  • 综合运用优化技术
  • 分析性能瓶颈
  • 达到性能目标

17.1 优化目标

目标:CPI < 0.7(IPC > 1.4)

思考:如何达到这个目标?

17.2 优化清单

1. 分支预测

  • GShare 预测器
  • BTB(256 项)
  • RAS(8 项)
  • 目标:准确率 > 90%

2. Cache

  • I-Cache(16KB,2 路)
  • D-Cache(16KB,2 路)
  • 目标:命中率 > 95%

3. 流水线

  • 双发射
  • 数据转发
  • 分支延迟槽

17.3 性能测试

# 运行 CoreMark
./coremark.elf

# 查看性能计数器
Cycles: 1000000
Instructions: 1500000
IPC: 1.5

思考:哪个优化带来的提升最大?

下一步

综合项目:超标量处理器

更新时间: