计算机体系结构

🎓 研究生📚 专业选修

计算机体系结构 研究计算机系统的结构设计与性能优化。 核心素养

🧬 知识点关系网络

单核性能
(流水线、超标量、乱序)
多核并行
(多核、多线程)
数据并行
(SIMD、GPU)
领域专用
(TPU、NPU)

⬆️ 从通用计算到专用加速,体系结构在不断突破性能瓶颈。

📖 学习建议(阶梯式路径)

  1. 流水线与指令级并行 —— 流水线如何提升吞吐率?数据冒险、控制冒险如何通过转发、分支预测解决?超标量与乱序执行的原理。
    💡 用WinMIPS64或Ripes模拟器观察流水线冒险。
  2. 存储系统与Cache —— Cache映射方式(直接、组相联)、替换策略(LRU、随机)、写策略(写穿、写回)。理解Cache一致性协议(MESI)。
    💡 用`perf stat`观察程序的Cache命中率。
  3. 多核与多处理器 —— 从SMP到NUMA,理解共享内存与消息传递模型。内存一致性模型(TSO、弱一致性)对并发编程的影响。
    💡 写一个多线程累加程序,观察无锁与加锁的性能差异。
  4. 向量处理与GPU —— SIMD指令集(SSE、AVX、NEON)如何加速计算?GPU的SIMT模型与线程束调度。
    💡 用CUDA或OpenCL写一个向量加法,体会数据并行的威力。
  5. 领域专用架构 —— TPU的脉动阵列、NPU的矩阵加速单元——AI芯片如何针对矩阵乘法优化?
    💡 对比CPU与TPU在ResNet推理上的功耗与延迟。
💡 学习贴士: 多动手实践,参与开源项目或在线评测,将理论转化为肌肉记忆。

🧠 认知导航

前置依赖: 学习计算机体系结构前,建议具备编程基础与相应的数学知识。

后续延伸: 学完计算机体系结构后,推荐继续探索:数据结构 · 算法设计 · 操作系统 · 计算机网络

📚 核心知识点全景

🔵 已开放 · 可随时探索🟠 生长中 · 内容持续丰富🟣 探索级 · 深度拓展

🌱 为了包容与博爱的传递,为了知识平权,善智导航正在陆续深化每一个知识点页面。
下方所有知识点均已预留链接,可随时点击探索。

✨ 每个链接都是一扇门,推开即是新世界。

🏙️ 生活中的计算机体系结构

🤖 AI训练

NVIDIA GPU的Tensor Core如何加速深度学习矩阵运算。

📱 手机芯片

ARM big.LITTLE大小核设计,在性能与功耗间平衡。

☁️ 云端实例

AWS Graviton、阿里倚天——ARM服务器芯片的崛起。

🎮 游戏主机

PS5的统一内存架构与高速SSD直连,实现无缝加载。

🔗 权威参考

🤖 AI陪练指令

我是一名正在学习计算机体系结构的学生,请用生动易懂的方式为我讲解其核心概念,并结合实际应用场景给出代码示例。

📁 更多计算机科学AI指令 →