论坛积分策略 论坛VIP区开放申请 我爱电脑万人签名活动 原声大碟520欢迎你 广告位招租
打印

[CPU] CPU 知识详解

本主题由 dxjazj 于 2008-5-23 20:20 加入精华
10、外频我爱电脑技术论坛( V* d- l, t6 K0 [" [) @

4 n* l& r2 i4 m8 @打造最好的电脑自学交流论坛  外频是 CPU 乃至整个计算机系统的基准频率,单位是 MHz(兆赫兹)。在早期的电脑中,内存与主板之间的同步运行的速度等于外频。在这种方式下,可以理解为 CPU 外频直接与内存相连通,实现两者间的同步运行状态。对于目前的计算机系统来说,两者完全可以不相同。但是外频的意义仍然存在,计算机系统中大多数的频率都是在外频的基础上,乘以一定的倍数来实现,这个倍数可以是大于 1 的,也可以是小于 1 的。
( y* _" i2 z7 M, t8 t8 {, Ewww.520diannao.com我爱电脑技术社区--打造最好的电脑技术自学交流平台( C3 v( A3 m! w  t5 D
  说到处理器外频,就要提到与之密切相关的两个概念:倍频与主频,主频就是 CPU 的时钟频率;倍频即主频与外频之比的倍数。主频、外频、倍频,其关系式:主频=外频×倍频。电脑,技术,IT,学习,交流,网络安全,QQ,硬件,软件,编程,教程,建站- r5 }! U: E& z2 o( d& V$ K# l# B1 ?! w
打造最好的电脑自学交流论坛0 i* j8 W/ c5 O
  在 486 之前,CPU 的主频还处于一个较低的阶段,CPU 的主频一般都等于外频。而在 486 出现以后,由于 CPU 工作频率不断提高,而 PC 机的一些其他设备(如插卡、硬盘等)却受到工艺的限制,不能承受更高的频率,因而限制了 CPU 频率的进一步提高。因此出现了倍频技术,该技术能够使 CPU 内部工作频率变为外部频率的倍数,从而通过提升倍频而达到提升主频的目的。倍频技术,就是使外部设备可以工作在一个较低外频上,而 CPU 主频是外频的倍数。我爱电脑技术社区--打造最好的电脑技术自学交流平台7 ~' I$ s: b/ }, m& L
我爱电脑技术社区--打造最好的电脑技术自学交流平台% `, }3 ]5 a, M4 A2 M* w/ ^
  在 Pentium 时代,CPU 的外频一般是 60/66MHz,从 Pentium Ⅱ 350 开始,CPU 外频提高到 100MHz,目前 CPU 外频已经达到了 200MHz。由于正常情况下,外频和内存总线频率相同,所以当 CPU 外频提高后,与内存之间的交换速度也相应得到了提高,对提高电脑整体运行速度影响较大。
; P% P9 S4 H6 T9 C: j- R! ?电脑,技术,IT,学习,交流,网络安全,QQ,硬件,软件,编程,教程,建站
, W. o* T, l* [4 _* ~$ v) E  外频与前端总线(FSB)频率,很容易被混为一谈。前端总线的速度,指的是 CPU 和北桥芯片间总线的速度,更实质性的表示了 CPU 和外界数据传输的速度。而外频的概念,是建立在数字脉冲信号震荡速度基础之上的,也就是说,100MHz 外频特指数字脉冲信号在每秒钟震荡一万万次,它更多的影响了 PCI 及其他总线的频率。之所以前端总线与外频这两个概念容易混淆,主要的原因,是在以前的很长一段时间里(主要是在 Pentium 4 出现之前和刚出现 Pentium 4 时),前端总线频率与外频是相同的,因此往往直接称前端总线为外频,最终造成这样的误会。随着计算机技术的发展,人们发现前端总线频率需要高于外频,因此采用了 QDR(Quad Date Rate)技术,或者其他类似的技术实现这个目的。这些技术的原理类似于 AGP 的 2X 或者 4X,它们使得前端总线的频率成为外频的 2 倍、4 倍甚至更高,从此之后,前端总线和外频的区别,才开始被人们重视起来。

TOP

11、倍频www.520diannao.com3 m7 \$ d4 _7 x$ n6 A" |
www.520diannao.com9 g; j8 b, l7 ?6 Z/ q
  CPU 的倍频,全称是倍频系数。CPU 的核心工作频率与外频之间,存在着一个比值关系,这个比值就是倍频系数,简称倍频。理论上,倍频是从 1.5 一直到无限的。但需要注意的是,倍频是以 0.5 为一个间隔单位。外频与倍频相乘,就是主频。所以,其中任何一项提高,都可以使 CPU 的主频上升。www.520diannao.com. u/ A" c; w1 n7 i9 r

4 K4 P/ w5 @' ^. Q7 p电脑,技术,IT,学习,交流,网络安全,QQ,硬件,软件,编程,教程,建站  原先并没有倍频概念,CPU 的主频和系统总线的速度是一样的。但随着 CPU 的速度越来越快,倍频技术也就应运而生。它可使系统总线工作在相对较低的频率上,而 CPU 速度可以通过倍频来无限提升。那么 CPU 主频的计算方式,就变为:主频 = 外频 x 倍频。也就是,倍频是指 CPU 和系统总线之间相差的倍数,当外频不变时,提高倍频,CPU 主频也就越高。

TOP

12、制作工艺
  A6 U# l& Y0 [; k* @" z
, W  g0 M) v3 }7 H( b7 P5 Y电脑,技术,IT,学习,交流,网络安全,QQ,硬件,软件,编程,教程,建站  通常,我们所说的 CPU 的“制作工艺”,指的是在生产 CPU 过程中,要进行加工各种电路和电子元件,制造导线连接各个元器件。其生产精度以微米(长度单位,1 微米等于千分之一毫米)来表示,未来有向纳米(1 纳米等于千分之一微米)发展的趋势。精度越高,生产工艺就越先进。在同样的材料中,可以制造更多的电子元件,连接线也越细,提高 CPU 的集成度,CPU 的功耗也越小。
9 A3 F6 L( {1 n' R打造最好的电脑自学交流论坛
: V( n+ e: U4 |6 ~2 _$ |我爱电脑技术论坛  制造工艺的微米,是指 IC 内电路与电路之间的距离。制造工艺的趋势是向密集度愈高的方向发展。密度愈高的 IC 电路设计,意味着在同样大小面积的 IC 中,可以拥有密度更高、功能更复杂的电路设计。微电子技术的发展与进步,主要是靠工艺技术的不断改进,使得器件的特征尺寸不断缩小,从而集成度不断提高,功耗降低,器件性能得到提高。芯片制造工艺在1995年以后,从 0.5 微米、0.35 微米、0.25 微米、0.18 微米、0.15 微米、0.13 微米、0.09 微米,而 0.065 微米(65 纳米)的制造工艺,将是下一代 CPU 的发展目标。

TOP

13、二级缓存容量我爱电脑技术论坛/ u$ y. ]  f! \- y5 V; p  ~

7 I) d+ |) U( ]1 s4 o4 v我爱电脑技术社区--打造最好的电脑技术自学交流平台  CPU 缓存(Cache Memoney)是位于 CPU 与内存之间的临时存储器。它的容量比内存小,但交换速度更快。缓存中的数据,只是内存数据中的一小部分,但这一小部分是短时间内 CPU 即将访问的,当 CPU 调用大量数据时,就可避开内存直接从缓存中调用,从而加快读取速度。由此可见,在 CPU 中加入缓存,是一种高效的解决方案。这样,整个内存储器(缓存+内存)就变成了既有缓存的高速度,又有内存的大容量的存储系统了。缓存对 CPU 的性能影响很大。主要是因为 CPU 的数据交换顺序和 CPU 与缓存间的带宽引起的。电脑,技术,IT,学习,交流,网络安全,QQ,硬件,软件,编程,教程,建站# K2 e0 m6 F' j/ N
我爱电脑技术社区--打造最好的电脑技术自学交流平台- H. l* B* v/ \! C+ @( Z
  缓存的工作原理,是当 CPU 要读取一个数据时,首先从缓存中查找,如果找到,就立即读取并送给 CPU 处理;如果没有找到,就用相对慢的速度从内存中读取并送给 CPU 处理,同时把这个数据所在的数据块调入缓存中,可以使得以后对整块数据的读取都从缓存中进行,不必再调用内存。
7 v( o' E3 _! @4 g& s% `www.520diannao.com我爱电脑技术社区--打造最好的电脑技术自学交流平台- q6 [' {, c9 M/ [' |% F7 }! E% j
  正是这样的读取机制,使 CPU 读取缓存的命中率非常高(大多数 CPU 可达 90% 左右),也就是说,CPU 下一次要读取的数据 90% 都在缓存中,只有大约 10% 需要从内存读取。这就大大节省了 CPU 直接读取内存的时间,也使 CPU 读取数据时基本无需等待。总的来说,CPU 读取数据的顺序,是先缓存,后内存。我爱电脑技术论坛  f9 t6 U1 I1 R, J& d. x
, p! C/ \2 a4 K5 K9 M- {& G" P
  最早先的 CPU 缓存是个整体的,而且容量很低,英特尔公司从 Pentium 时代开始,把缓存进行了分类。当时集成在 CPU 内核中的缓存已不足以满足 CPU 的需求,而制造工艺上的限制,又不能大幅度提高缓存的容量。因此出现了集成在与 CPU 同一块电路板上或主板上的缓存,此时,就把 CPU 内核集成的缓存,称为一级缓存。而外部的称为二级缓存。一级缓存中,还分数据缓存(Data Cache,D-Cache)和指令缓存(Instruction Cache,I-Cache)。二者分别用来存放数据和执行这些数据的指令,而且两者可以同时被 CPU 访问,减少了争用 Cache 所造成的冲突,提高了处理器的效能。英特尔公司在推出 Pentium 4 处理器时,还新增了一种一级追踪缓存,容量为 12KB。www.520diannao.com! r2 m- p$ m: t! S
我爱电脑技术论坛9 x$ \% M3 y3 p) ^
  随着 CPU 制造工艺的发展,二级缓存也能轻易的集成在 CPU 内核中,容量也在逐年提升。现在再用集成在 CPU 内部与否来定义一、二级缓存,已不确切。而且随着二级缓存被集成入 CPU 内核中,以往二级缓存与 CPU 大差距分频的情况也被改变,此时其以相同于主频的速度工作,可以为 CPU 提供更高的传输速度。
  i! p6 O9 r6 N1 s1 _8 C我爱电脑技术论坛打造最好的电脑自学交流论坛6 s" ]: Y1 O: A* F1 n2 [% g5 I( H
  二级缓存是 CPU 性能表现的关键之一。在 CPU 核心不变的情况下,增加二级缓存容量,能使性能大幅度提高。而同一核心的 CPU 高低端之分,往往也是在二级缓存上有差异。由此可见,二级缓存对于 CPU 的重要性。电脑,技术,IT,学习,交流,网络安全,QQ,硬件,软件,编程,教程,建站/ t, H) F+ p) w# E9 @

" f8 n  ?6 m, X) }6 w/ f打造最好的电脑自学交流论坛  CPU 在缓存中找到有用的数据被称为“命中”,当缓存中没有 CPU 所需的数据时(这时称为未命中),CPU 才访问内存。从理论上讲,在一颗拥有二级缓存的 CPU 中,读取一级缓存的命中率为 80%。也就是说,CPU 一级缓存中找到的有用数据,占数据总量的 80%,剩下的 20% 从二级缓存中读取。由于不能准确预测将要执行的数据,读取二级缓存的命中率也在 80% 左右(从二级缓存读到有用的数据占总数据的 16%)。那么,还有的数据就不得不从内存调用,但这已经是一个相当小的比例了。目前的较高端的 CPU 中,还会带有三级缓存,它是为读取二级缓存后未命中的数据设计的—种缓存,在拥有三级缓存的 CPU 中,只有约 5% 的数据需要从内存中调用,这进一步提高了 CPU 的效率。
6 f2 J' p2 C( Q4 B; h, }0 U电脑,技术,IT,学习,交流,网络安全,QQ,硬件,软件,编程,教程,建站我爱电脑技术社区--打造最好的电脑技术自学交流平台6 i1 a% t2 A1 u2 l6 D4 Y# t$ ?
  为了保证 CPU 访问时有较高的命中率,缓存中的内容应该按一定的算法替换。一种较常用的算法,是“最近最少使用算法”(LRU 算法),它是将最近一段时间内最少被访问过的行淘汰出局。因此,需要为每行设置一个计数器,LRU 算法是把命中行的计数器清零,其他各行计数器加 1。当需要替换时,淘汰行计数器计数值最大的数据行出局。这是一种高效、科学的算法。其计数器清零过程,可以把一些频繁调用后再不需要的数据淘汰出缓存,提高缓存的利用率。
5 m0 l& O) I' I) ^2 K) ^8 Q, N+ Vwww.520diannao.com电脑,技术,IT,学习,交流,网络安全,QQ,硬件,软件,编程,教程,建站9 M; w, `  M# b" v
  CPU 产品中,一级缓存的容量基本在 4KB 到 64KB 之间,二级缓存的容量则分为 128KB、256KB、512KB、1MB、2MB 等。一级缓存容量,各产品之间相差不大,而二级缓存容量,则是提高 CPU 性能的关键。二级缓存容量的提升,是由 CPU 制造工艺所决定的,容量增大必然导致 CPU 内部晶体管数的增加,要在有限的 CPU 面积上集成更大的缓存,对制造工艺的要求也就越高。

TOP

14、核心电压电脑,技术,IT,学习,交流,网络安全,QQ,硬件,软件,编程,教程,建站7 B, ~2 Y7 P1 B1 K+ g/ g0 A3 v

' g6 \) o2 R& G; h9 h我爱电脑技术论坛  CPU 的工作电压(Supply Voltage),即 CPU 正常工作所需的电压。任何电器在工作的时候都需要电,自然也有对应额定电压,CPU 也不例外。目前 CPU 的工作电压,有一个非常明显的下降趋势,较低的工作电压,主要有三个优点:
& }2 o% I# t2 }打造最好的电脑自学交流论坛打造最好的电脑自学交流论坛' F) C; d& X, R: |6 W6 k
  一是采用低电压的 CPU 的芯片,总功耗降低了。功耗降低,系统的运行成本就相应降低,这对于便携式和移动系统来说非常重要,使其现有的电池可以工作更长时间,从而使电池的使用寿命大大延长;
3 a" b. f8 K6 E" x8 [3 Q  M( v2 X我爱电脑技术社区--打造最好的电脑技术自学交流平台1 b8 Z4 W$ b( d# {- B* ^* r6 v
  二是功耗降低,致使发热量减少,运行温度不过高的 CPU,可以与系统更好的配合;我爱电脑技术社区--打造最好的电脑技术自学交流平台0 w# u4 @2 D2 G! h% G+ q) {

$ y. k  P$ a2 Z, ^" w2 Z; z. g9 m2 R# V打造最好的电脑自学交流论坛  三是降低电压,也是 CPU 主频提高的重要因素之一。电脑,技术,IT,学习,交流,网络安全,QQ,硬件,软件,编程,教程,建站; i- m5 A, h$ i
www.520diannao.com" h. @, w" h: M- Y8 E
  CPU 的工作电压,分为两个方面,CPU 的核心电压与 I/O 电压。核心电压,即驱动 CPU 核心芯片的电压。I/O 电压,则指驱动 I/O 电路的电压。通常 CPU 的核心电压,小于或等于 I/O 电压。我爱电脑技术社区--打造最好的电脑技术自学交流平台& z+ R3 ~; r! H- j% F
我爱电脑技术论坛# ?8 b+ [3 @# K$ b
  早期 CPU(286~486 时代)的核心电压与I/O一致,通常为 5V,由于当时的制造工艺相对落后,以致 CPU 的发热量过大,导致其寿命缩短。不过那时的 CPU 集成度很低,而目前的 CPU 集成度相当高,因此显得现在的 CPU 发热量更大。随着 CPU 的制造工艺提高,近年来,各种 CPU 的工作电压有逐步下降的趋势,目前台式机用 CPU 的核心电压,通常为 2V 以内,笔记本专用 CPU 的工作电压,相对更低,从而达到大幅减少功耗的目的,以延长电池的使用寿命,并降低了 CPU 发热量。而且现在的 CPU 会通过特殊的电压 ID(VID)引脚来指示主板中嵌入的电压调节器,自动设置正确的电压级别。
9 B  Q  _+ i3 }- h% m# Twww.520diannao.com
4 y2 X( ?6 s2 W% o* I& E我爱电脑技术论坛  许多面向新款 CPU 的主板,都会提供特殊的跳线或者软件设置。通过这些跳线或软件,可以根据具体需要手动调节 CPU 的工作电压。很多实验表明,在超频的时候,适度提高核心电压,可以加强 CPU 内部信号,对 CPU 性能的提升,会有很大帮助。但这样也会提高 CPU 的功耗,影响其寿命及发热量,建议一般用户不要进行此方面的操作。

TOP

15、超线程技术www.520diannao.com3 k+ A: W& I# c: w. }

( o5 w* z2 @! M! u% y$ {我爱电脑技术社区--打造最好的电脑技术自学交流平台  CPU 生产商为了提高 CPU 的性能,通常做法是提高 CPU 的时钟频率和增加缓存容量。不过,目前 CPU 的频率越来越快,如果再通过提升 CPU 频率和增加缓存的方法来提高性能,往往会受到制造工艺上的限制以及成本过高的制约。
8 G' r# g  l5 p# Y, h* T  }电脑,技术,IT,学习,交流,网络安全,QQ,硬件,软件,编程,教程,建站
3 j3 W" u* Q6 Y+ K8 G打造最好的电脑自学交流论坛  尽管提高 CPU 的时钟频率和增加缓存容量后,的确可以改善性能,但这样的 CPU 性能提高,在技术上存在较大的难度。实际上在应用中,基于很多原因,CPU 的执行单元都没有被充分使用。如果 CPU 不能正常读取数据(总线/内存的瓶颈),其执行单元利用率会明显下降。另外,就是目前大多数执行线程缺乏 ILP(Instruction-Level Parallelism,多种指令同时执行)支持。这些都造成了目前 CPU 的性能没有得到全部的发挥。因此,Intel 则采用另一个思路去提高 CPU 的性能,让 CPU 可以同时执行多重线程,就能让 CPU 发挥更大效率,即所谓“超线程(Hyper-Threading,简称 HT)”技术。超线程技术就是利用特殊的硬件指令,把两个逻辑内核模拟成两个物理芯片,让单个处理器都能使用线程级并行计算,进而兼容多线程操作系统和软件,减少了 CPU 的闲置时间,提高了 CPU 的运行效率。
+ N% X8 S4 R- @+ v6 ]8 jwww.520diannao.com
# J0 P  g+ F" }+ M, X- I电脑,技术,IT,学习,交流,网络安全,QQ,硬件,软件,编程,教程,建站  采用超线程,就是在同一时间里,应用程序可以使用芯片的不同部分。虽然单线程芯片每秒钟能够处理成千上万条指令,但是在任一时刻,只能够对一条指令进行操作。而超线程技术,可以使芯片同时进行多线程处理,使芯片性能得到提升。
4 s  L/ o$ w$ |5 U7 Q1 |% S- v# \打造最好的电脑自学交流论坛我爱电脑技术社区--打造最好的电脑技术自学交流平台! a" I; C, g" `* J9 x; f% R
  超线程技术是在一颗 CPU 同时执行多个程序而共同分享一颗 CPU 内的资源,理论上要像两颗 CPU 一样,在同一时间执行两个线程,P4 处理器需要多加入一个 Logical CPU Pointer(逻辑处理单元)。因此,新一代的 P4 HT 的 die 的面积比以往的 P4 增大了 5%。而其余部分,如 ALU(整数运算单元)、FPU(浮点运算单元)、L2 Cache(二级缓存)则保持不变,这些部分是被分享的。
1 c; X  c& i; t( |我爱电脑技术论坛
/ j) O# W, }% w9 \  虽然采用超线程技术能同时执行两个线程,但它并不象两个真正的 CPU 那样,每个 CPU 都具有独立的资源。当两个线程都同时需要某一个资源时,其中一个要暂时停止,并让出资源,直到这些资源闲置后才能继续。因此,超线程的性能并不等于两颗 CPU 的性能。我爱电脑技术论坛$ {) W* w6 c2 Y! C
我爱电脑技术论坛. l- n; \% _: G5 E* @8 l$ O3 N' b) T# e
  英特尔 P4 超线程有两个运行模式,Single Task Mode(单任务模式)及 Multi Task Mode(多任务模式)。当程序不支持 Multi-Processing(多处理器作业)时,系统会停止其中一个逻辑 CPU 的运行,把资源集中于单个逻辑 CPU 中,让单线程程序不会因其中一个逻辑 CPU 闲置而减低性能。但由于被停止运行的逻辑 CPU 还是会等待工作,占用一定的资源,因此 Hyper-Threading CPU 运行 Single Task Mode 程序模式时,有可能达不到不带超线程功能的 CPU 性能,但性能差距不会太大。也就是说,当运行单线程应用软件时,超线程技术甚至会降低系统性能,尤其是在多线程操作系统运行单线程软件时,容易出现此问题。我爱电脑技术社区--打造最好的电脑技术自学交流平台: q) z7 @5 R5 ]2 v! \
电脑,技术,IT,学习,交流,网络安全,QQ,硬件,软件,编程,教程,建站, c) y0 S/ ?1 A
  需要注意的是,含有超线程技术的 CPU,需要芯片组及软件的支持,才能比较理想的发挥该项技术的优势。我爱电脑技术论坛7 n( U# [6 `' a1 z& H

1 z2 m& _- L9 O- s/ @; R* F1 P打造最好的电脑自学交流论坛  目前,支持超线程技术的芯片组包括:
* j  S8 O. Z8 Z& D. k9 r% _www.520diannao.com: v! J7 x7 z2 i8 h. l" Y+ y
  英特尔 i845GE、PE 及矽统 iSR658 RDRAM、SiS645DX、SiS651 可直接支持超线程;我爱电脑技术论坛& p) Z2 g/ M2 k3 N9 \- \% j
  英特尔 i845E、i850E 通过升级 BIOS 后可支持;
- P# {' |2 F, j/ X5 U我爱电脑技术社区--打造最好的电脑技术自学交流平台  威盛 P4X400、P4X400A 可支持,但未获得正式授权。打造最好的电脑自学交流论坛$ _+ ^( A' S/ n, T+ [3 w
; i! s; h: M$ n2 `, U" j
  目前,支持超线程技术的操作系统有:
" m2 F7 ~" x9 l% i/ H我爱电脑技术论坛
; a, A; D. S9 e# i电脑,技术,IT,学习,交流,网络安全,QQ,硬件,软件,编程,教程,建站  Microsoft Windows XP
7 O. w" I  g- I" W* d+ ~$ {  Microsoft Windows 2003
8 d& q% P0 m! q" s9 n打造最好的电脑自学交流论坛  Linux kernel 2.4.x 以后的版本,也支持超线程技术。

TOP

16、3D Now电脑,技术,IT,学习,交流,网络安全,QQ,硬件,软件,编程,教程,建站! x3 @: q9 G. b' l5 N6 r4 g- t$ l

2 X5 d. @% N) l9 l" s0 O我爱电脑技术社区--打造最好的电脑技术自学交流平台  由 AMD 公司提出的 3DNow! 指令集,应该说出现在 SSE 指令集之前,并被 AMD 广泛应用于其 K6-2、K6-3 以及 Athlon(K7)处理器上。3DNow! 指令集技术,其实就是 21 条机器码的扩展指令集。www.520diannao.com( T: p+ j6 a9 x$ ]. b
打造最好的电脑自学交流论坛$ N% f. [+ z5 |
  与 Intel 公司的 MMX 技术侧重于整数运算有所不同,3DNow! 指令集主要针对三维建模、坐标变换和效果渲染等三维应用场合,在软件的配合下,可以大幅度提高 3D 处理性能。后来在 Athlon 上开发了 Enhanced 3DNow!。这些 AMD 标准的 SIMD 指令和 Intel 的 SSE 具有相同效能。因为受到 Intel 在商业上以及 Pentium III 成功的影响,软件在支持 SSE 上比起 3DNow! 更为普遍。Enhanced 3DNow! AMD 公司继续增加至 52 个指令,包含了一些 SSE 码,因而在针对 SSE 做最佳化的软件中,能获得更好的效能。

TOP

17、多媒体指令集
; y, y9 ~+ ?  `' p7 b; X+ |, owww.520diannao.com电脑,技术,IT,学习,交流,网络安全,QQ,硬件,软件,编程,教程,建站9 {! L$ |8 S, E0 {* y7 M
  CPU 依靠指令来计算和控制系统,每款 CPU 在设计时,就规定了一系列与其硬件电路相配合的指令系统。指令的强弱,也是 CPU 的重要指标。指令集是提高微处理器效率的最有效工具之一。
! Y/ X5 w# E5 N0 N# ~3 H: g% m# ^电脑,技术,IT,学习,交流,网络安全,QQ,硬件,软件,编程,教程,建站
" ?) b7 {% M# L  从现阶段的主流体系结构讲,指令集可分为“复杂指令集”和“精简指令集”两部分。
+ X: [) b5 B5 a" J: ~: d电脑,技术,IT,学习,交流,网络安全,QQ,硬件,软件,编程,教程,建站www.520diannao.com8 w& Z3 f( t% {& w
  而从具体运用看,如 Intel 的 MMX(Multi Media Extended)、SSE、SSE2(Streaming-Single instruction multiple data-Extensions 2)和 AMD 的 3DNow! 等都是 CPU 的扩展指令集,分别增强了 CPU 的多媒体、图形图象和 Internet 等的处理能力。我们通常会把 CPU 的扩展指令集称为“CPU 的指令集”。我爱电脑技术论坛: g1 w( I; u8 X1 W' C3 ?
打造最好的电脑自学交流论坛( B% t. H5 C3 r* m: X$ h' h
  1、精简指令集的运用
2 `# t# T: e. Z- B% A% O6 S) e* k( a我爱电脑技术论坛
* R% s$ e" k. ?( M9 t我爱电脑技术论坛  在最初发明计算机的数十年里,随着计算机功能日趋增大,性能日趋变强,内部元器件也越来越多,指令集日趋复杂,过于冗杂的指令,严重的影响了计算机的工作效率。后来经过研究发现,在计算机中,80% 的程序,只用到了 20% 的指令集。基于这一发现,“RISC 精简指令集”就被提了出来。这是计算机系统架构的一次深刻革命。RISC 体系结构的基本思路是:抓住“CISC 指令系统”的指令种类太多、指令格式不规范、寻址方式太多的缺点,通过减少指令种类、规范指令格式和简化寻址方式,方便处理器内部的并行处理,提高 VLSI 器件的使用效率,从而大幅度地提高处理器的性能。电脑,技术,IT,学习,交流,网络安全,QQ,硬件,软件,编程,教程,建站; C$ n$ D' E8 p0 ^* M

7 }5 M/ o7 H/ e' twww.520diannao.com  RISC 指令集有许多特征,其中最重要的有:
" b; s; o: Y- K+ y( V$ t打造最好的电脑自学交流论坛
" p: }, n# m. ?: ?www.520diannao.com  指令种类少,指令格式规范——RISC 指令集通常只使用一种或少数几种格式。指令长度单一(一般 4 个字节),并且在字边界上对齐。字段位置、特别是操作码的位置是固定的。 打造最好的电脑自学交流论坛: i" S4 R" L4 J. s

; ?$ ^9 x3 ^! _( j6 D+ C# ywww.520diannao.com  寻址方式简化——几乎所有指令都使用寄存器寻址方式,寻址方式总数一般不超过 5 个。其他更为复杂的寻址方式,如间接寻址等,则由软件利用简单的寻址方式来合成。我爱电脑技术社区--打造最好的电脑技术自学交流平台: Y2 u: E4 m! K1 i! [' w4 H. g# G
我爱电脑技术社区--打造最好的电脑技术自学交流平台0 \1 \# [% S: h. w9 M' N5 s* v
  大量利用寄存器间操作——RISC 指令集的大多数操作,都是寄存器到寄存器的操作,只以简单的 Load 和 Store 操作访问内存。因此,每条指令中访问的内存地址不会超过 1 个,访问内存的操作不会与算术操作混在一起。( b! B# m: c* m8 E% U, I

" J# v0 g+ u- g5 j! L打造最好的电脑自学交流论坛  简化处理器结构——使用 RISC 指令集,可以大大简化处理器的控制器和其他功能单元的设计,不必使用大量专用寄存器,特别是允许以硬件线路来实现指令操作,而不必像 CISC 处理器那样,使用微程序来实现指令操作。因此,RISC 处理器不必像 CISC 处理器那样设置微程序控制存储器,就能够快速地直接执行指令。
4 n+ {% F, W9 n9 F( |) iwww.520diannao.com我爱电脑技术社区--打造最好的电脑技术自学交流平台* ^2 N  \; [- [: X( N' r$ {/ u1 S# a1 \
  便于使用 VLSI 技术——随着 LSI 和 VLSI 技术的发展,整个处理器(甚至多个处理器)都可以放在一个芯片上。RISC 体系结构可以给设计单芯片处理器带来很多好处,有利于提高性能,简化 VLSI 芯片的设计和实现。基于 VLSI 技术,制造 RISC 处理器要比 CISC 处理器工作量小得多,成本也低得多。
# T2 l+ S4 K! ~8 R' ^( f我爱电脑技术社区--打造最好的电脑技术自学交流平台
7 q0 L, h% v8 M* t, @: I打造最好的电脑自学交流论坛  加强了处理器并行能力——RISC 指令集能够非常有效地适合于采用流水线、超流水线和超标量技术,从而实现指令级并行操作,提高处理器的性能。目前常用的处理器内部并行操作技术,基本上是基于 RISC 体系结构发展和走向成熟的。电脑,技术,IT,学习,交流,网络安全,QQ,硬件,软件,编程,教程,建站  u* V* t, |3 e8 Y
电脑,技术,IT,学习,交流,网络安全,QQ,硬件,软件,编程,教程,建站" w( x( j3 |9 P$ K4 ~
  正由于 RISC 体系所具有的优势,它在高端系统得到了广泛的应用,而 CISC 体系则在桌面系统中占据统治地位。如今在桌面领域,RISC 也不断渗透,预计未来,RISC 将要一统江湖。
+ z. {' `; `, J/ R我爱电脑技术社区--打造最好的电脑技术自学交流平台我爱电脑技术论坛7 J& A6 L  W; z  }
  2、CPU 的扩展指令集
- o9 J  C& g) e# i% G# s
8 l# J/ ~$ E3 N! n/ G我爱电脑技术社区--打造最好的电脑技术自学交流平台  对于 CPU 来说,在基本功能方面,它们的差别并不太大,基本的指令集也都差不多。但是许多厂家为了提升某一方面性能,又开发了扩展指令集。扩展指令集定义了新的数据和指令,能够大大提高某方面数据处理能力,但必须要有软件的支持。www.520diannao.com" X3 k9 ~1 k; ^# l

9 ~; g" n  D- u4 X打造最好的电脑自学交流论坛  1) MMX 指令集我爱电脑技术论坛/ w3 B' n$ m& K% w+ D3 Q
电脑,技术,IT,学习,交流,网络安全,QQ,硬件,软件,编程,教程,建站# j" U$ u$ }  h" z
  MMX(Multi Media eXtension,多媒体扩展指令集)指令集,是 Intel 公司于 1996 年推出的一项多媒体指令增强技术。MMX 指令集中,包括有 57 条多媒体指令,通过这些指令,可以一次处理多个数据,在处理结果超过实际处理能力的时候,也能进行正常处理。这样,在软件的配合下,就可以得到更高的性能。MMX 的益处在于,当时存在的操作系统不必为此而做出任何修改,便可以轻松地执行 MMX 程序。但是,问题也比较明显,那就是 MMX 指令集与 x87 浮点运算指令不能够同时执行,必须做密集式的交错切换,才可以正常执行。这种情况,就势必造成整个系统运行质量的下降。
) ]4 z3 V$ {* |3 n/ i& }3 m我爱电脑技术社区--打造最好的电脑技术自学交流平台我爱电脑技术社区--打造最好的电脑技术自学交流平台! b( w8 [3 A6 Y$ A0 _0 \' m  x
  2) SSE 指令集
: f9 N6 N; G7 ?9 f4 E; t) P1 V7 Y电脑,技术,IT,学习,交流,网络安全,QQ,硬件,软件,编程,教程,建站
& ]1 r7 @  f  P2 ~% {3 `www.520diannao.com  SSE(Streaming SIMD Extensions,单指令多数据流扩展)指令集,是 Intel 在 Pentium III 处理器中率先推出的。其实,早在 PIII 正式推出之前,Intel 公司就曾经通过各种渠道公布过所谓的 KNI(Katmai New Instruction)指令集,这个指令集也就是 SSE 指令集的前身,并一度被很多传媒称之为 MMX 指令集的下一个版本,即 MMX2 指令集。究其背景,原来“KNI”指令集是 Intel 公司最早为其下一代芯片命名的指令集名称,而所谓的“MMX2”则完全是硬件评论家们和媒体凭感觉和印象对“KNI”的评价,而 Intel 公司从未正式发布过关于 MMX2 的消息。
$ |4 f  ^; h/ U  I2 e; D, J! [8 j4 V7 V# d
  最终推出的 SSE 指令集,也就是所谓胜出的“互联网 SSE”指令集。SSE 指令集包括了 70 条指令,其中包含提高 3D 图形运算效率的 50 条 SIMD(单指令多数据技术)浮点运算指令、12 条 MMX 整数运算增强指令、8 条优化内存中连续数据块传输指令。理论上,这些指令对目前流行的图像处理、浮点运算、3D 运算、视频处理、音频处理等诸多多媒体应用,起到了全面强化的作用。SSE 指令与 3DNow! 指令彼此互不兼容,但 SSE 包含了 3DNow! 技术的绝大部分功能,只是实现的方法不同。SSE 兼容 MMX 指令,它可以通过 SIMD 和单时钟周期,并行处理多个浮点数据来有效地提高浮点运算速度。
$ R* n! [" P/ L& X* {' V) m) s打造最好的电脑自学交流论坛www.520diannao.com4 l6 N$ \, Q& X. K1 G
  后来 Intel 为了应对 AMD 的 3Dnow!+ 指令集,又在 SSE 的基础上,开发了 SSE2,增加了一些指令,使得其 P4 处理器性能有大幅度提高。到 P4 设计结束为止,Intel 增加了一套包括 144 条新建指令的 SSE2 指令集。像最早的 SIMD 扩展指令集,SSE2 涉及了多重的数据目标上立刻执行一单个的指令(即 SIMD,一个计算低工控最好的方法是让每指令执行更多的工作)。最重要的是,SSE2 能处理 128 位和两倍精密浮点数学运算。处理更精确浮点数的能力,使 SSE2 成为加速多媒体程序、3D 处理工程以及工作站类型任务的基础配置。但重要的是,软件是否能适当的优化利用它。5 X& F' Q/ \1 u
打造最好的电脑自学交流论坛% Q/ p" u- A6 T% Q+ U
  3) 3DNow! 指令集
( i9 F% w# b  F# M  |: {
" Q2 T5 m4 C4 ~4 W" l: y  由 AMD 公司提出的 3DNow! 指令集,应该说出现在 SSE 指令集之前,并被 AMD 广泛应用于其 K6-2、K6-3 以及 Athlon(K7)处理器上。3DNow! 指令集技术,其实就是 21 条机器码的扩展指令集。
9 n3 n0 X* x* |我爱电脑技术论坛
, C# }, K) {9 I& w! h2 Y. n  与 Intel 公司的 MMX 技术侧重于整数运算有所不同,3DNow! 指令集主要针对三维建模、坐标变换和效果渲染等三维应用场合,在软件的配合下,可以大幅度提高 3D 处理性能。后来在 Athlon 上开发了 Enhanced 3DNow!。这些 AMD 标准的 SIMD 指令和 Intel 的 SSE 具有相同效能。因为受到 Intel 在商业上以及 Pentium III 成功的影响,软件在支持 SSE 上,比起 3DNow! 更为普遍。Enhanced 3DNow! AMD 公司继续增加至 52 个指令,包含了一些 SSE 码,因而在针对 SSE 做最佳化的软件中,能获得更好的效能。

TOP

18、双核心类型及酷睿