每秒浮点运算次数-族谱新闻-族谱网

每秒浮点运算次数

2020-10-16

出处：族谱网

作者：阿族小谱

浏览:266次

转发:0次

评论:0

评价许多专家对每秒浮点运算次数颇多微词，认为它并不是一个有意义的量度，因为FLOPS并不能反应出许多对执行效能有影响的因素。例如：I/O的效能、内存的架构、快取内存一致性（cachecoherence）。这意味着电脑的实际计算容量，与FLOPS的理论峰值间会有一段不小的差距。随着新资讯科技时代（数据挖掘、机器学习、深度学习、BIGDATA大数据、各种人工神经网络和人工智能等）及工业革命4.0的发展，与FLOPS运算效能指标有关的计算设备以显卡GPU和FPGA为主要核心，但FLOPS指标却未能准确地反映出以上设备在相关领域运算的效能表现。皆因以上设备的架构是利用CUDA、OpenCL等编程语言来实现加速相关应用程序的运算速度（普遍达20倍甚至高达过千倍），而这些技术的实现依赖的更多是如GPU比CPU拥有更多倍数集成的核心，如一块NVIDIAGeForceGTX-750Ti处理器就拥有高达50...

评价

许多专家对每秒浮点运算次数颇多微词，认为它并不是一个有意义的量度，因为FLOPS并不能反应出许多对执行效能有影响的因素。例如：I/O的效能、内存的架构、快取内存一致性（cache coherence）。这意味着电脑的实际计算容量，与FLOPS的理论峰值间会有一段不小的差距。

随着新资讯科技时代（数据挖掘、机器学习、深度学习、BIG DATA 大数据、各种人工神经网络和人工智能等）及工业革命 4.0 的发展，与 FLOPS 运算效能指标有关的计算设备以显卡 GPU 和 FPGA 为主要核心，但 FLOPS 指标却未能准确地反映出以上设备在相关领域运算的效能表现。皆因以上设备的架构是利用 CUDA、OpenCL 等编程语言来实现加速相关应用程序的运算速度（普遍达 20 倍甚至高达过千倍），而这些技术的实现依赖的更多是如 GPU 比 CPU 拥有更多倍数集成的核心，如一块 NVIDIA GeForce GTX-750Ti 处理器就拥有高达 500+ 多个 CUDA Core，其 GFLOPS 性能表现理想但 GFLOPS 并未实际对大数据运算作出很大的贡献，更多地是因为成百计以上的 CUDA 核心（每核心内置各自的 ALU 算术逻辑运算单元）能进行并行运算而产生的指数级别运算速度提升。

换算

一个MFLOPS（megaFLOPS）等于每秒一佰万（=10）次的浮点运算，

一个GFLOPS（gigaFLOPS）等于每秒拾亿（=10）次的浮点运算，

一个TFLOPS（teraFLOPS）等于每秒一兆（=10）次的浮点运算，

一个PFLOPS（petaFLOPS）等于每秒一千兆（=10）次的浮点运算，

一个EFLOPS（exaFLOPS）等于每秒一佰京（=10）次的浮点运算。

其他

以下列出几个有代表性硬件的每秒浮点运算次数

注意：本页所收集之数据于大部分情况下仅供作实际参考值，视不同设备持有者的芯片品质及运作相关（如：厂商硬件设置、主板条件、供电系统设置、运作温度会因高温而自动强制降频作保护等因素）而有所不同，大致会与参考值有 (+/-)MAX 9 % 的差异值。

浮点性能参考指标 (xFLOPS) = 总运算核心数 x 每周期运算次数 x 处理器相对运作频率 i.e.: 1,228.8 GFLOPS/1.2288 TFLOPS = 384 Core x 4 x 800 MHz(0.8 GHz)

FLOPS

ENIAC: 300 FLOPS

MFLOPS

CRAY-1: 160 MFLOPS

Raspberry Pi Broadcom CM2708 ARM11 @1 GHz(OC): 316.56 MFLOPS

好奇号BAE RAD750 抗辐射处理器(基于IBMPowerPC 750 设计)@0.1~0.2 GHz: 400 MIPS

GFLOPS

Intel Xeon 3.6 GHz: <1.8 GFLOPS

Intel Pentium 4 HT 3.6Ghz: 7 GFLOPS

Raspberry Pi Cluster (32 node)x Broadcom CM2708 ARM11@1 GHz: 10.13 GFLOPS (集群由博伊西州立大学电气工程与计算机系博士生 Joshua Kiepert 实践)

NintendoWii: 12 GFLOPS

Intel Core 2 Duo E4300 14 GFLOPS

ARM Mali-400 MP4 @ 533MHz: 19.2 GFLOPS

树莓派上的VideoCore: 24 GFLOPS

Intel Core 2 Duo E8400 24 GFLOPS

AMD Phenom9950: 29.05 GFLOPS

Intel Core i5-4210U: 36.77175 GFlops (Win 8.1/Pro x64, LinX 0.6.5, Problem Size=11,530, MiB=1,024, 3 times) in 27.798sec

Intel Core 2 Quad Q8200 37 GFLOPS

Intel Core 2 Extreme QX9770: 39.63 GFLOPS

AMD Phenom IIx4 955: 42.13 GFlopS

Intel Core i5-4210U: 43.4467 GFlops (Win 8.1/Pro x64, LinX 0.6.5, Problem Size=11,530, MiB=1,024, 3 times) in 23.526sec

Intel HD Graphics2000 @ 1250MHz(SB): 60 GFLOPS

Intel Core i7965: 69.23 GFLOPS

ARM Mali-T720 MP8 @ 600MHz: 81.6 Peak GFLOPS

Intel Core i7980 XE : 107.6 GFLOPS

Intel HD Graphics2500 @ 1150MHz(IVB): 110.4 GFLOPS

Intel Core i52500K @ 4.5GHz: 123.35 GFLOPS (w/AVX instruction set)

Intel HD Graphics3000 @ 1300MHz: 125 GFLOPS

Intel HD Graphics3000 @ 1350MHz(SB): 129.6 GFLOPS

New Intel HD GraphicsGT1 @ 1150MHz(Haswell): 184 GFLOPS

SONYPlayStation 3: 228.8 GFLOPS

MircosoftXbox 360: 240 GFLOPS

IBM POWER7: 264.96GFLOPS

ARM Mali-T760 MP16 @ 600MHz: 326 GFLOPS

NVIDIA Jetson TK1 (Tegra K1) 开发平台-Ubuntu: 326 GFLOPS (此为最大值且于自带风扇下运作)

NintendoWii U: 352 GFLOPS

Intel HD Graphics4000 @ 1300MHz(IVB): 332.8 GFLOPS

NVIDIA GeForce8800 Ultra（G80-450 GPU）:393.6 GFLOPS

Intel HD Graphics4200/4400 (Mobile)/4600/P4600/P4700 GT2 @ 1350MHz: 432 GFLOPS

AMD RadeonHD 3870（RV670 GPU）:497 GFLOPS

NVIDIATegraX1:512 GFLOPS

Intel HD Graphics5000 GT3 ~HD4XXX @ 1100MHz : ~704 GFLOPS

NVIDIA GeForceGTX 280（G200-300 GPU）:720 GFLOPS

NVIDIA GeForce840M w/2GB vRAM: 790 GFLOPS

NVIDIA GeForce840M (2GB Dedicated VRAM): 790.3 GFLOPS

Intel Iris Graphics 5100 @ 1100MHz : 704 GFLOPS

AMD RadeonHD 4870（RV770 GPU）:1008 GFLOPS

NVIDIA Jetson TX1: over 1,100 GFLOPS

TFLOPS

MicrosoftXbox One：1.31TFLOPS

Microsoft Xbox One S：1.4052TFLOPS

NVIDIA Geforce GTX 950（GM206 GPU）：1.57 TFLOPS

SONYPlayStation 4：1.84TFLOPS

AMD Radeon HD 7850（Pitcairn GPU）：1.946 TFLOPS

NVIDIA Geforce GTX 960（GM206 GPU）：2.3 TFLOPS

NVIDIA Geforce GTX 580（GF110-375 GPU）：2.37 TFLOPS

NVIDIA Geforce GTX 680（GK104-400-A2 GPU）：3.09 TFLOPS

AMD Radeon R9 380（Tonga GPU）：3.48 TFLOPS

NVIDIA Geforce GTX 970（GM204 GPU）：3.49 TFLOPS

NVIDIA Geforce GTX 1060（GP106 GPU）：3.85 TFLOPS

SONY PlayStation 4 Pro：4.2TFLOPS

AMD Radeon HD 7970 Ghz Edition（Tahiti XT2 GPU）：4.3 TFLOPS

NVIDIA Geforce GTX Titan（GK110 GPU）：4.5 TFLOPS

NVIDIA Geforce GTX 980（GM204 GPU）：4.61 TFLOPS

AMD Radeon HD 6990（R900 GPU）：4.98 TFLOPS

NVIDIA Geforce GTX 780Ti（GK110 GPU）：5.046 TFLOPS

NVIDIA Geforce GTX 980 Ti（GM200 GPU）：5.63 TFLOPS

Microsoft Xbox One X：6 TFLOPS

NVIDIA Geforce GTX 1070（GP104 GPU）：6 TFLOPS

NVIDIA Geforce GTX Titan X（GM200 GPU）：7 TFLOPS

NVIDIA Geforce GTX 1080（GP104 GPU）：9 TFLOPS

NVIDIA Geforce GTX 1080 Ti（GP102 GPU）：11.34 TFLOPS

NVIDIA Titan X（GP102 GPU）：11 TFLOPS

AMD Radeon R9 390（Grenada GPU）：5.1 TFLOPS

AMD Radeon RX 480（Polaris 10 GPU）：5.1 TFLOPS

AMD Radeon R9 290X（Hawaii XT GPU）：5.632 TFLOPS

NVIDIA Geforce GTX Titan Z（GK110 GPU）：8.122 TFLOPS

AMD Radeon R9 Nano（Fiji XT GPU）：8.19 TFLOPS

AMD Radeon HD 7990（Malta GPU）：8.2 TFLOPS

AMD Radeon R9 295X2（Vesuvius GPU）：11.46 TFLOPS

Earth Simulator：35.61 TFLOPS

Blue Gene/L：135.5 TFLOPS

中国曙光Dawning 5000A：230 TFLOPS

PFLOPS

IBM Roadrunner：1.026 PFLOPS

Jaguar：1.75 PFLOPS

天河一号：2.566 PFLOPS

IBM Mira: 8.16 PFLOPS

京：10.51 PFLOPS

BOINC运算平台：11.015 PFLOPS (随时变动)

IBM Sequoia：16.32 PFLOPS

Cray Titan：17.59 PFLOPS

天河二号：33.86 PFLOPS

Folding@home运算平台：92.03 PFLOPS （随时变动）

神威太湖之光：93.01 PFLOPS

EFLOPS

参见

浮点数

IEEE 754

免责声明：以上内容版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。感谢每一位辛勤著写的作者，感谢每一位的分享。

——— 没有了 ———

大学

高温

高达

领域

编辑：阿族小谱

关于我们

关注族谱网微信公众号，每日及时查看相关推荐，订阅互动等。

APP下载

下载族谱APP 微信公众号，每日及时查看

每秒浮点运算次数

相关资料

更多文章

24小时热门

推荐阅读

知识互答

关于我们

APP下载