【转载】了解bl616/618之RISC-V 入门笔记（一）

显示全部楼层 · 2023-11-29 20:26:42

RISC-V详细介绍

文章目录

RISC-V指令集介绍
    什么是RISC-V
    RISC-V诞生的背景
        ISA霸权
        摩尔定律的穷途末路
        穷困潦倒的学者
        不断增长的指令数量
    RISC-V架构设计思想
        如何设计一个好的ISA
    RISC-V之RV32I
        四个典型特点
    RISC-V之乘除法指令
        指令格式
        用乘法代替常数除法
    RISC-V之RV64
    RISC-V的特权架构
        机器模式
        监管者模式
    扩展指令集
AI中涉及的运算操作
    机器学习
    深度学习
现有的AI指令集或其他底层解决方案
    TPU解决方案
    X86
    现有AI芯片
现有AI软件与芯片设计关系详解
参考资料

RISC-V指令集介绍

什么是RISC-V

RISC-V（发音为“risk-five”）是一个基于精简指令集（RISC）原则的开源指令集架构（ISA）。
与大多数指令集相比，RISC-V指令集可以自由地用于任何目的，允许任何人设计、制造和销售RISC-V芯片和软件。虽然这不是第一个开源指令集，但它具有重要意义，因为其设计使其适用于现代计算设备（如仓库规模云计算机、高端移动电话和微小嵌入式系统）。设计者考虑到了这些用途中的性能与功率效率。该指令集还具有众多支持的软件，这解决了新指令集通常的弱点。
该项目2010年始于加州大学伯克利分校，但许多贡献者是该大学以外的志愿者和行业工作者。
RISC-V指令集的设计考虑了小型、快速、低功耗的现实情况来实做，但并没有对特定的微架构做过度的设计。

简而言之，RISC-V是一个ISA

RISC-V诞生的背景

ISA霸权

微处理器的开放指令集有望重塑计算，并引入新的、更强大的功能。

现代计算机依靠许多元件来提供高速和高性能，但是很少有比一台精简的指令集计算机(通常称为RISC)发挥更大作用的了。尽管指令集体系结构（ISA）具有不同的形状和形式-并且它支持多种系统和设备-但存在一个共同点，与复合指令集计算机（CISC）相比，RISC允许微处理器以更少的每指令周期（CPI）运行。

当然，ISA是计算的核心。加州大学伯克利分校计算机科学教授、ACM A.M.图灵奖获得者戴夫·帕特森（Dave Patterson）说：“这是允许硬件和软件进行通信的基本词汇，他差不多算是创造了这个术语，并开发了早期的RISC计算模型。在过去的几十年里，英特尔和ARM这两大实体基本上控制了ISA。他们的专利微处理器可以从笔记本电脑到云服务器，从智能手机到物联网（IoT）设备的所有设备运行。如今，很难找到没有英特尔或ARM处理器的计算设备。

摩尔定律的穷途末路

RISC-V的推出与半导体行业的其他重大变化不谋而合。CMOS晶体管的缩放速度正在放缓，这已不是秘密。即使最近在设计上取得了突破，将密度和性能提升到了新的水平，戈登·摩尔（Gordon Moore）关于每两年将晶体管倍增的长期预测——“摩尔定律”（Moore’s Law）也不再成立。随着半导体进展缓慢，而性能需求持续增长，设计更先进的计算设备和燃料创新的能力受到威胁。Patterson解释说：“向前看，逻辑路径是为应用领域的微处理器上的基本指令集添加扩展。”。

RISC-V的吸引力是不可否认的。一个通用的ISA意味着ISA的不同实现和用例可以利用相同的核心软件堆栈，从而最小化移植到编译器、操作系统和其他软件的工作。RISC- v的主要优点不是它是RISC的一个新的变种或迭代，而是它是一个开放的ISA。因此，人们期望该模型将产生将RISC-V置于商业地图上所需的软件堆栈。然而，与此同时，也有一种担忧，即给用户改变ISA的能力将导致RISC-V软件生态系统的分裂。

穷困潦倒的学者

Asanovíc和Patterson于2010年开始在伯克利的并行计算实验室（Par Lab）研究第五代RISC指令集。该项目的诞生源于对专有ISA缺乏灵活性的失望。Patterson回忆说：“我们无法做一些我们想做的重新搜索。两人瞄准了一个长期存在的行业问题：无法为特定目的定制芯片。这项倡议是基于他们自己的需要。“由于我们无法获得英特尔或ARM使用或修改其专有指令集的许可，我们决定为自己的研究开发自己的指令集，并帮助其他学者的研究。”

不断增长的指令数量

RISC-V架构设计思想

如何设计一个好的ISA

在介绍 RISC-V 这个 ISA 之前，了解计算机架构师在设计 ISA 时的基本原则和必须做出的权衡是有用的。如下的列表列出了七种衡量标准。页边放置了对应的七个图标，以突出显示 RISC-V 在随后章节中应对它们的实例。（印刷版的封底有所有图标的图例。） ⚫ 成本（美元硬币） ⚫ 简洁性（轮子） ⚫ 性能（速度计） ⚫ 架构和具体实现的分离（分开的两个半圆） ⚫ 提升空间（手风琴） ⚫ 程序大小（相对的压迫着一条线的两个箭头） ⚫ 易于编程/编译/链接（儿童积木“像 ABC 一样简单”）

RISC-V的不同寻常之处，除了在于它是最近诞生的和开源的以外，还在于：和几乎所有以往的ISA不同，它是模块化的。它的核心是一个名为RV32I的基础ISA，运行一个完整的软件栈。RV32I是固定的，永远不会改变。这为编译器编写者，操作系统开发人员和汇编语言程序员提供了稳定的目标。模块化来源于可选的标准扩展，根据应用程序的需要，硬件可以包含或不包含这些扩展。这种模块化特性使得RISC-V具有了袖珍化、低能耗的特点，而这对于嵌入式应用可能至关重要。RISC-V编译器得知当前硬件包含哪些扩展后，便可以生成当前硬件条件下的最佳代码。惯例是把代表扩展的字母附加到指令集名称之后作为指示。例如，RV32IMFD将乘法（RV32M），单精度浮点（RV32F）和双精度浮点（RV32D）的扩展添加到了基础指令集（RV32I）中。

RISC-V之RV32I

RV32I 基础指令集的一页图形表示。对于每幅图，将有下划线的字母从左到右连接起来，即可组成完整的 RV32I 指令集。对于每一个图，集合标志{}内列举了指令的所有变体，变体用加下划线的字母或下划线字符_表示。特别的，下划线字符_表示对于此指令变体不需用字符表示。例如，下图表示了这四个 RV32I 指令：slt，slti，sltu，sltiu:

四个典型特点

首先，指令只有六种格式，并且所有的指令都是 32 位长，这简化了指令解码。ARM-32，还有更典型的 x86-32 都有许多不同的指令格式，使得解码部件在低端实现中偏昂贵，在中高端处理器设计中容易带来性能挑战。第二，RISC-V 指令提供三个寄存器操作数，而不是像 x86-32 一样，让源操作数和目的操作数共享一个字段。当一个操作天然就需要有三个不同的操作数，但是 ISA 只提供了两个操作数时，编译器或者汇编程序程序员就需要多使用一条 move（搬运）指令，来保存目的寄存器的值。第三，在 RISC-V 中对于所有指令，要读写的寄存器的标识符总是在同一位置，意味着在解码指令之前，就可以先开始访问寄存器。在许多其他的 ISA 中，某些指令字段在部分指令中被重用作为源目的地，在其他指令中又被作为目的操作数（例如，ARM-32 和 MIPS-32）。因此，为了取出正确的指令字段，我们需要时序本就可能紧张的解码路径上添加额外的解码逻辑，使得解码路径的时序更为紧张。第四，这些格式的立即数字段总是符号扩展，符号位总是在指令中最高位。这意味着可能成为关键路径的立即数符号扩展，可以在指令解码之前进行。

下图显示了六种基本指令格式，分别是：用于寄存器-寄存器操作的 R 类型指令，用于短立即数和访存 load 操作的 I 型指令，用于访存 store 操作的 S 型指令，用于条件跳转操作的 B 类型指令，用于长立即数的 U 型指令和用于无条件跳转的 J 型指令。

解释说明：四种基础指令格式 R/I/S/U

imm：立即数

rs1：源寄存器1

rs2：源寄存器2

rd：目标寄存器

opcode：操作码

RISC-V之乘除法指令

指令格式

RV32M 具有有符号和无符号整数的除法指令：divide(div)和 divide unsigned(divu)，它们将商放入目标寄存器。在少数情况下，程序员需要余数而不是商，因此 RV32M 提供 remainder(rem)和 remainder unsigned(remu)，它们在目标寄存器写入余数，而不是商。

为了正确地得到一个有符号或无符号的 64 位积，RISC-V 中带有四个乘法指令。要得到整数 32 位乘积（64 位中的低 32 位）就用 mul 指令。要得到高 32 位，如果操作数都是有符号数，就用 mulh 指令；如果操作数都是无符号数，就用 mulhu 指令；如果一个有符号一个无符号，可以用 mulhsu 指令。在一条指令中完成把 64 位积写入两个 32 位寄存器的操作会使硬件设计变得复杂，所以 RV32M 需要两条乘法指令才能得到一个完整的 64 位积。用乘法代替常数除法

对许多微处理器来说，整数除法是相对较慢的操作。如前述，除数为 2 的幂次的无符号除法可以用右移来代替。事实证明，通过乘以近似倒数再修正积的高 32 位的方法，可以优化除数为其它数的除法。例如，图 4.3 显示了 3 为除数的无符号除法的代码。

先把数装到t0里面
addi是立即数与寄存器的数相加， t0-1365放回t0
a0和t0相乘（无符号）
立即数→移，也就是a1右移1位

==也就是说从数值上来讲，可以通过乘法代替常数除法==

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。本文链接：https://blog.csdn.net/weixin_43914889/article/details/106108377 ———————————————— 版权声明：本文为CSDN博主「tsz danger」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。原文链接：https://blog.csdn.net/weixin_43914889/article/details/106108377

WT_0213 · 2023-11-30 09:23:04

内容丰富

干簧管 · 2023-11-30 09:56:09

2023-11-30 12:44:10