族谱网 头条 人物百科

每秒浮点运算次数

2020-10-16
出处:族谱网
作者:阿族小谱
浏览:266
转发:0
评论:0
评价许多专家对每秒浮点运算次数颇多微词,认为它并不是一个有意义的量度,因为FLOPS并不能反应出许多对执行效能有影响的因素。例如:I/O的效能、内存的架构、快取内存一致性(cachecoherence)。这意味着电脑的实际计算容量,与FLOPS的理论峰值间会有一段不小的差距。随着新资讯科技时代(数据挖掘、机器学习、深度学习、BIGDATA大数据、各种人工神经网络和人工智能等)及工业革命4.0的发展,与FLOPS运算效能指标有关的计算设备以显卡GPU和FPGA为主要核心,但FLOPS指标却未能准确地反映出以上设备在相关领域运算的效能表现。皆因以上设备的架构是利用CUDA、OpenCL等编程语言来实现加速相关应用程序的运算速度(普遍达20倍甚至高达过千倍),而这些技术的实现依赖的更多是如GPU比CPU拥有更多倍数集成的核心,如一块NVIDIAGeForceGTX-750Ti处理器就拥有高达50...

评价

许多专家对每秒浮点运算次数颇多微词,认为它并不是一个有意义的量度,因为FLOPS并不能反应出许多对执行效能有影响的因素。例如:I/O的效能、内存的架构、快取内存一致性(cache coherence)。这意味着电脑的实际计算容量,与FLOPS的理论峰值间会有一段不小的差距。

随着新资讯科技时代(数据挖掘、机器学习、深度学习、BIG DATA 大数据、各种人工神经网络和人工智能等)及工业革命 4.0 的发展,与 FLOPS 运算效能指标有关的计算设备以显卡 GPU 和 FPGA 为主要核心,但 FLOPS 指标却未能准确地反映出以上设备在相关领域运算的效能表现。皆因以上设备的架构是利用 CUDA、OpenCL 等编程语言来实现加速相关应用程序的运算速度(普遍达 20 倍甚至高达过千倍),而这些技术的实现依赖的更多是如 GPU 比 CPU 拥有更多倍数集成的核心,如一块 NVIDIA GeForce GTX-750Ti 处理器就拥有高达 500+ 多个 CUDA Core,其 GFLOPS 性能表现理想但 GFLOPS 并未实际对大数据运算作出很大的贡献,更多地是因为成百计以上的 CUDA 核心(每核心内置各自的 ALU 算术逻辑运算单元)能进行并行运算而产生的指数级别运算速度提升。

换算

一个MFLOPS(megaFLOPS)等于每秒一佰万(=10)次的浮点运算,

一个GFLOPS(gigaFLOPS)等于每秒拾亿(=10)次的浮点运算,

一个TFLOPS(teraFLOPS)等于每秒一兆(=10)次的浮点运算,

一个PFLOPS(petaFLOPS)等于每秒一千兆(=10)次的浮点运算,

一个EFLOPS(exaFLOPS)等于每秒一佰京(=10)次的浮点运算。

其他

以下列出几个有代表性硬件的每秒浮点运算次数

注意:本页所收集之数据于大部分情况下仅供作实际参考值,视不同设备持有者的芯片品质及运作相关(如:厂商硬件设置、主板条件、供电系统设置、运作温度会因高温而自动强制降频作保护等因素)而有所不同,大致会与参考值有 (+/-)MAX 9 % 的差异值。

浮点性能参考指标 (xFLOPS) = 总运算核心数 x 每周期运算次数 x 处理器相对运作频率 i.e.: 1,228.8 GFLOPS/1.2288 TFLOPS = 384 Core x 4 x 800 MHz(0.8 GHz)

FLOPS

ENIAC: 300 FLOPS

MFLOPS

CRAY-1: 160 MFLOPS

Raspberry Pi Broadcom CM2708 ARM11 @1 GHz(OC): 316.56 MFLOPS

好奇号BAE RAD750 抗辐射处理器(基于IBMPowerPC 750 设计)@0.1~0.2 GHz: 400 MIPS

GFLOPS

Intel Xeon 3.6 GHz: <1.8 GFLOPS

Intel Pentium 4 HT 3.6Ghz: 7 GFLOPS

Raspberry Pi Cluster (32 node)x Broadcom CM2708 ARM11@1 GHz: 10.13 GFLOPS (集群由 博伊西州立大学电气工程与计算机系博士生 Joshua Kiepert 实践)

NintendoWii: 12 GFLOPS

Intel Core 2 Duo E4300 14 GFLOPS

ARM Mali-400 MP4 @ 533MHz: 19.2 GFLOPS

树莓派上的VideoCore: 24 GFLOPS

Intel Core 2 Duo E8400 24 GFLOPS

AMD Phenom9950: 29.05 GFLOPS

Intel Core i5-4210U: 36.77175 GFlops (Win 8.1/Pro x64, LinX 0.6.5, Problem Size=11,530, MiB=1,024, 3 times) in 27.798sec

Intel Core 2 Quad Q8200 37 GFLOPS

Intel Core 2 Extreme QX9770: 39.63 GFLOPS

AMD Phenom IIx4 955: 42.13 GFlopS

Intel Core i5-4210U: 43.4467 GFlops (Win 8.1/Pro x64, LinX 0.6.5, Problem Size=11,530, MiB=1,024, 3 times) in 23.526sec

Intel HD Graphics2000 @ 1250MHz(SB): 60 GFLOPS

Intel Core i7965: 69.23 GFLOPS

ARM Mali-T720 MP8 @ 600MHz: 81.6 Peak GFLOPS

Intel Core i7980 XE : 107.6 GFLOPS

Intel HD Graphics2500 @ 1150MHz(IVB): 110.4 GFLOPS

Intel Core i52500K @ 4.5GHz: 123.35 GFLOPS (w/AVX instruction set)

Intel HD Graphics3000 @ 1300MHz: 125 GFLOPS

Intel HD Graphics3000 @ 1350MHz(SB): 129.6 GFLOPS

New Intel HD GraphicsGT1 @ 1150MHz(Haswell): 184 GFLOPS

SONYPlayStation 3: 228.8 GFLOPS

MircosoftXbox 360: 240 GFLOPS

IBM POWER7: 264.96GFLOPS

ARM Mali-T760 MP16 @ 600MHz: 326 GFLOPS

NVIDIA Jetson TK1 (Tegra K1) 开发平台-Ubuntu: 326 GFLOPS (此为最大值且于自带风扇下运作)

NintendoWii U: 352 GFLOPS

Intel HD Graphics4000 @ 1300MHz(IVB): 332.8 GFLOPS

NVIDIA GeForce8800 Ultra(G80-450 GPU):393.6 GFLOPS

Intel HD Graphics4200/4400 (Mobile)/4600/P4600/P4700 GT2 @ 1350MHz: 432 GFLOPS

AMD RadeonHD 3870(RV670 GPU):497 GFLOPS

NVIDIATegraX1:512 GFLOPS

Intel HD Graphics5000 GT3 ~HD4XXX @ 1100MHz : ~704 GFLOPS

NVIDIA GeForceGTX 280(G200-300 GPU):720 GFLOPS

NVIDIA GeForce840M w/2GB vRAM: 790 GFLOPS

NVIDIA GeForce840M (2GB Dedicated VRAM): 790.3 GFLOPS

Intel Iris Graphics 5100 @ 1100MHz : 704 GFLOPS

AMD RadeonHD 4870(RV770 GPU):1008 GFLOPS

NVIDIA Jetson TX1: over 1,100 GFLOPS

TFLOPS

MicrosoftXbox One:1.31TFLOPS

Microsoft Xbox One S:1.4052TFLOPS

NVIDIA Geforce GTX 950(GM206 GPU):1.57 TFLOPS

SONYPlayStation 4:1.84TFLOPS

AMD Radeon HD 7850(Pitcairn GPU):1.946 TFLOPS

NVIDIA Geforce GTX 960(GM206 GPU):2.3 TFLOPS

NVIDIA Geforce GTX 580(GF110-375 GPU):2.37 TFLOPS

NVIDIA Geforce GTX 680(GK104-400-A2 GPU):3.09 TFLOPS

AMD Radeon R9 380(Tonga GPU):3.48 TFLOPS

NVIDIA Geforce GTX 970(GM204 GPU):3.49 TFLOPS

NVIDIA Geforce GTX 1060(GP106 GPU):3.85 TFLOPS

SONY PlayStation 4 Pro:4.2TFLOPS

AMD Radeon HD 7970 Ghz Edition(Tahiti XT2 GPU):4.3 TFLOPS

NVIDIA Geforce GTX Titan(GK110 GPU):4.5 TFLOPS

NVIDIA Geforce GTX 980(GM204 GPU):4.61 TFLOPS

AMD Radeon HD 6990(R900 GPU):4.98 TFLOPS

NVIDIA Geforce GTX 780Ti(GK110 GPU):5.046 TFLOPS

NVIDIA Geforce GTX 980 Ti(GM200 GPU):5.63 TFLOPS

Microsoft Xbox One X:6 TFLOPS

NVIDIA Geforce GTX 1070(GP104 GPU):6 TFLOPS

NVIDIA Geforce GTX Titan X(GM200 GPU):7 TFLOPS

NVIDIA Geforce GTX 1080(GP104 GPU):9 TFLOPS

NVIDIA Geforce GTX 1080 Ti(GP102 GPU):11.34 TFLOPS

NVIDIA Titan X(GP102 GPU):11 TFLOPS

AMD Radeon R9 390(Grenada GPU):5.1 TFLOPS

AMD Radeon RX 480(Polaris 10 GPU):5.1 TFLOPS

AMD Radeon R9 290X(Hawaii XT GPU):5.632 TFLOPS

NVIDIA Geforce GTX Titan Z(GK110 GPU):8.122 TFLOPS

AMD Radeon R9 Nano(Fiji XT GPU):8.19 TFLOPS

AMD Radeon HD 7990(Malta GPU):8.2 TFLOPS

AMD Radeon R9 295X2(Vesuvius GPU):11.46 TFLOPS

Earth Simulator:35.61 TFLOPS

Blue Gene/L:135.5 TFLOPS

中国曙光Dawning 5000A:230 TFLOPS

PFLOPS

IBM Roadrunner:1.026 PFLOPS

Jaguar:1.75 PFLOPS

天河一号:2.566 PFLOPS

IBM Mira: 8.16 PFLOPS

京:10.51 PFLOPS

BOINC运算平台:11.015 PFLOPS (随时变动)

IBM Sequoia:16.32 PFLOPS

Cray Titan:17.59 PFLOPS

天河二号:33.86 PFLOPS

Folding@home运算平台:92.03 PFLOPS (随时变动)

神威太湖之光:93.01 PFLOPS

EFLOPS

参见

浮点数

IEEE 754


免责声明:以上内容版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。感谢每一位辛勤著写的作者,感谢每一位的分享。

——— 没有了 ———
编辑:阿族小谱
发表评论
写好了,提交
{{item.label}}
{{commentTotal}}条评论
{{item.userName}}
发布时间:{{item.time}}
{{item.content}}
回复
举报
点击加载更多
打赏作者
“感谢您的打赏,我会更努力的创作”
— 请选择您要打赏的金额 —
{{item.label}}
{{item.label}}
打赏成功!
“感谢您的打赏,我会更努力的创作”
返回

更多文章

更多精彩文章
打赏
私信

推荐阅读

· 米每秒
转化1米每秒等于:1英尺/秒=0.3048m·s准确值1英里/小时≈0.4471m·s大约值1km·h-1≈0.2778m·s大约值1千米每秒等于:定义由于BIPM是用真空中的光速定义米的,即一米是真空中光在1/299792458秒走过的距离,因此某种程度上也可以光速来直接定义米每秒。参见千米每小时
· 运算
参见函数算子
· DNA运算
历史DNA运算最先由南加州大学的伦纳德·阿德曼在1994年实现。Adleman演示了一种将DNA应用于解决七点哈密顿路径问题的概念验证方法。自Adleman的实验以后,学界又取得了许多进展,多种图灵机被证明是可行的。尽管一开始的研究热点集中在解决P/NP问题,但人们旋即意识到此类问题并不是DNA运算的最佳应用场合,以致有多种意见要求寻找杀手级应用。1997年,计算机学家MitsunoriOgihara和生物学家AnimeshRay一道提出了一种组合逻辑电路的评价方法,并描绘了实现方法。2002年,来自WeizmannInstituteofScience的研究者公开了一种由DNA分子和酶,而不是硅组成的计算机器。2004年3月28日,WeizmannInstitute的EhudShapiro,YaakovBenenson,BinyaminGil,UriBen-Dor,和RivkaAdar在自
· 浮点数
计算机的浮点数浮点指的是带有小数的数值,浮点运算即是小数的四则运算,常用来测量电脑运算速度。大部分计算机采用二进制(b=2)的表示方法。位(bit)是衡量浮点数所需存储空间的单位,通常为32位或64位,分别被叫作单精度和双精度。有一些计算机提供更大的浮点数,例如英特尔公司的浮点运算单元Intel8087协处理器(以及其被集成进x86处理器中的后代产品)提供80位长的浮点数,用于存储浮点运算的中间结果。还有一些系统提供128位的浮点数(通常用软件实现)。浮点数的标准在电脑使用的浮点数被电气电子工程师协会(IEEE)规范化为IEEE754。举例π的值可以表示为π=3.1415926...10(十进制)。当在一个支持17位尾数的计算机中表示时,它会变为0.11001001000011111×2。准确性由于浮点数不能表达所有实数,浮点运算与相应的数学运算有所差异,有时此差异极为显著。比如,二进制浮
· 世界上最快的计算机它以其每秒20亿亿次的运算速度打破纪录
社会的不断在进步,科技的不断在发展,计算机的性能也是不断在被革新,那么你知道目前世界上最快的计算机有多快吗?(指运算速度),普通的计算机的运算速度一般只有几万亿次,但是看到下面这些超级计算机之后,绝对会刷新你对电脑的认知,好了废话不多说,下面就一起来看看吧!一、最快的计算机(美国Summit)在世界超级计算机排名上用“龙争虎斗”来形容也不为过,截止到2018年,目前世界上最快的计算机宝座也再次变更,由中国的“神威.太阳湖之光”变为了美国IBM所最新创造的Summit超级计算机,它以其每秒20亿亿次的运算速度打破纪录,登上“王座”。Summit也由4608台服务器所组成的一台超级计算机,由美国IBM公司所创造,在今年也已经是交付美国能源实验室使用,其运行速度比起中国最快的计算机“神威太湖之光”还要快了60%,简直是逆天,也因此从它手中夺走了“世界上速度最快的计算机”的宝座。前纪录保持者(中国...

关于我们

关注族谱网 微信公众号,每日及时查看相关推荐,订阅互动等。

APP下载

下载族谱APP 微信公众号,每日及时查看
扫一扫添加客服微信