codehzhang / bcst_csapp

A C language repo to implement CSAPP

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

BCST (Bilibili Computer Science Topics) Project

Copyright Declaration

This repository is a part of BCST project. BCST project contains the source code and videos produced by yangminz. The videos are published publicly on the bilibili by yaaangmin. The source code are published on github yangminz. Any repository and video under BCST project is exclusively owned by yangminz and shall not be used for commercial and profitting purpose without yangminz's permission.

计算机系统 - Computer System A Programmer's Perspective (CSAPP)

Hello 观众朋友们大家好,这个Repo是我在做《深入理解计算机系统》(CSAPP)视频时所用到的代码,还包括一本设计手册,设计手册还在慢慢更新。代码、手册以及视频都是为了给大家介绍CSAPP这本书,帮助大家阅读和理解最基础的计算机系统知识。特别是本科低年级的同学(大一大二),准备转专业的同学,以及跨专业考研的同学,通常会掌握一些基本的编程语言,但是可能对计算机系统本身并不足够了解。我的视频、代码以及手册就是希望帮助大家学习,尽量通过代码实现CSAPP上的知识点,然后再通过视频讲解,将基础的计算机系统知识连贯起来。

下面是目录:

Chapter 02 - Representing and Manipulating Information

计算机可以看作对Bit串的翻译器,为了了解计算机系统,我们首先需要了解Bit在计算机中是如何被表达与解释的,简单了解这些位运算的操作,背后的代数结构。

2020-09-29 关于有符号与无符号整数,以及它们背后的代数结构。我设计了一张环形图,方便观众理解Bit串到有符号与无符号整数的映射。这张环形图在手册里更加精美: video

2020-10-01 我们第一次动手写C语言代码。一些简单的位操作运算,例如判断一个十六进制数中是否全部都是字母,使用卡诺图对布尔代数进行化简。一个基于位运算的数据结构:树状数组。video

2020-10-16 浮点数的四种类型:规格化、非规格化、无穷大、非数。uint32_tfloat的数值转换,特别是关于约分的规定:video

Chapter 03 - Machine-Level Representation of Program

拥有Bit构成的基本数据类型以后,我们开始考虑构造一台原始的冯诺依曼结构的计算机。其实,我们是在做一个计算机的模拟器。为此,我们需要模拟CPU中的寄存器与内存等硬件,在这些硬件的基础上编写指令集。我们的指令集是通过字符串写成的,就像我们通常所写的高级语言代码一样,其实都是文本。我们用一些编译的基础知识来解析字符串指令集,将它们翻译成指令的数据类型,然后按照操作符与操作数解释执行这些代码。

在这里,我们其实做了一层抽象:文本与字符串指令就像一台虚拟机,类似于JVM中的字节码,CLR中的IL,我们解释执行的是虚拟机指令。字符串指令集上,我们实现一些简单的指令,例如addsubmov,最重要的是关于过程控制,也就是函数调用的几个指令:callpushpopret,我们对内存栈的控制蕴含在这几条指令之中。

2020-10-22 CPU寄存器的模拟器,这是我们模拟器的第一行代码。我们利用结构体与联合等异构的数据类型来描述寄存器:video

2020-10-31 指令的数据结构,用来描述一条汇编指令的操作符,源操作数以及目的操作数,包括操作数中的立即数、寄存器等:video

2020-11-05 一个CPU的指令周期,我们第一次执行了一条汇编指令:video

2020-11-06 模拟器的运行若干条指令,形成一个程序。为了访问内存资源,我们需要设计内存访问接口。完成call指令:video, git-commit

2020-11-18 递归与树与栈之间的关系,实现push指令:video, git-commit

2020-12-04 完成popret指令,至此,我们已经在内存栈上实现了函数的过程控制。我们开始第一次代码重构,将in-memory的结构体指令数组转换为字符串指令数组,并且开始解析字符串指令:video, git-commit

2020-12-08 为了解析字符串指令,特别是其中所要用到的立即数,我们开始写字符串到十进制与十六进制数的转换。我们使用确定有限自动状态机去扫描字符串,设计状态机的状态转移:video, git-commit

2020-12-18 解析字符串操作数中的内存与寄存器格式:video, git-commit

2020-12-27 完成字符串指令的解析,并且在字符串指令上运行了程序。设计状态码,支持条件判断:video, git-commit

2021-01-04 实现jmpjneleave指令。到此为止,我们已经可以模拟函数的递归调用了:video, git-commit

2021-01-15 总结与回顾我们到此为止所做的一切工作,关于数据类型和冯诺依曼计算机,一个简化的计算模型——URM:video

2021-01-23 除了冯诺依曼计算机,我们还有另一种计算模型:λ演算。冯诺依曼计算机中,函数是数据;λ演算中,数据是函数:video

Chapter 07 - Linking

模拟了计算机的硬件基础以后,我们准备开始在模拟器上运行程序。因此,我们需要设计自己的程序。考虑到我们将指令集用字符串实现,因此我们的程序也是字符串的汇编指令。这一步工作可以由编译器为我们实现,我们需要做的是完成一个简陋的链接器,将可执行的文件链接起来。

正如我们在上一部分所说的,字符串指令可以看作一种在字符串与文本上实现的虚拟机,因此我们的链接也是在.txt文本上实现的,一个可执行可链接的文本格式,.elf.txt。为了设计这个文本格式,我们需要理解Linux中是如何处理ELF文件的。

2021-02-06 ELF文件从它的Header开始,我们用readelfhexdump去看ELF文件的二进制数据,按照Byte去理解ELF文件的Header:video

2021-02-21 Section Header Table的结构:video

2021-02-28 ELF的符号表,以及什么是符号,它们在编译器和链接器视角中的差异:video

2021-03-07 符号表中的Bind, Type以及Index,C语言.c源文件中不同位置的申明与定义是如何在ELF文件中描述的,特别是COMMON节等容易混淆的地方:video

2021-03-14 设计可执行与可链接的文本格式,.elf.txt。从磁盘上的文件中读取到内存:video, git-commit

2021-03-21 解析.elf.txt的节头表与符号表:video, git-commit

2021-03-27 静态链接的第一步:符号解析,设计内部的符号表作为维护符号关系的数据结构:video, git-commit

2021-04-04 静态链接的第二步:将ELF的Section合并为EOF的Segment,并且计算Segment的运行时起始地址:video, git-commit

2021-04-10 静态链接的第三步:将ELF文件中的符号引用重定位到它们在EOF中的符号:video, git-commit

2021-04-18 完成静态链接,计算符号的运行时地址。动态链接:GOT与PLT:video, git-commit

2021-04-23 链接部分的总结。C语言的.c源文件如何被预处理,编译,链接,然后加载到内存中执行。在运行时,进程怎样使用动态链接库:video

Chapter 06 - The Memory Hierarchy

编译与链接的知识可以帮助我们理解进程的内存模型。从这里开始,我们要真正开始讨论内存问题了,主要包括内存本身的实现以及虚拟内存与物理内存的转换。我们首先讨论内存体系,理解缓存**在内存体系中的地位。实际上,计算机想要实现高性能的应用,也大量依赖缓存的技术。一旦涉及缓存,或者说共享的资源,我们就无法回避一致性的问题。缓存背后的局部性,如何设计缓存,如何分析缓存一致性带来的性能问题,是我们这一阶段的核心主题。

2021-04-27 简单介绍一下关于内存的许多问题,这也是我们学习计算机系统的最核心知识。内存的层次、局部性、内存与缓存的一致性,以及我们怎么考虑虚拟内存。 video

2021-05-09 关于cache的基本结构:cache视角下的物理地址,组相连的cache。video, git-commit

About

A C language repo to implement CSAPP


Languages

Language:C 93.6%Language:Python 6.4%