您的位置:网站首页 > 挖矿(POW/IDO/POS/减半) > 正 文 比特币

转码/解密/挖矿!显卡计算能力大对比.

【作者:网文】 来源:转载 日期:2012-3-18 22:31:49 人气: 标签:转码/解密/挖矿 【打印】

 现在的显卡市场,同质化已经严重到了什么地步呢?不仅仅是板卡厂商之间的显卡性能基本没区,而且同价位的N卡和A卡在不同游戏中的表现也是难分胜负,让游戏玩家们难以抉择。

于是NVIDIAAMD的竞争开始逐渐淡化游戏,而强调功能和应用,三屏、3D、PhysX、视频等开始大行其道。不过这些功能都难以量化,随着CUDA和Stream的飞速发展催生了OpenCL和DirectCompute通用计算标准,使得NVIDIAAMD在另一条道路上展开了新的竞赛——并行计算。
    近年来GPU已经在科学研究和超级计算领域取得突破性进展,随着数百万支持CUDA的GPU已经遍布全球计算机,软件开发人员、科学人士和研究人员正在利用CUDA探测到更多更广的领域中,包括图像和视频编辑、计算生物学和计算化学、流体力学模拟、CT图像重组、地震分析、光线追踪以及其它更多。近年来超级计算机的突飞猛进很大程度上也是得益于强大的GPU加盟。

对显卡感兴趣的朋友都知道,通用计算之所以如此热门,根本原因在于显卡核心GPU的多流处理器(相当于数百核心)架构:GPU强大的并行浮点运算能力是仅仅拥有个位数核心的中央处理器CPU无法望其项背的。而通用计算技术可以发挥GPU的长处,让其电脑运算速度飙升,一些应用程序的速度可以提高数倍甚至数十倍,让原来因为运算量巨大而不可完成的任务变得可行。 
    而在家用、办公电脑上,借助GPU加速的软件也越来越多,这些软件有的可以用来转码,有的可以用来增强图像、视频的画质,有的可以将2D电影转换成3D,有的还能智能归类和编辑照片……

AMD和NVIDIA通用计算解析



    跟以往的GPGPU概念不同的是,CUDA是一个完整的解决方案,包含了API、C编译器等,能够利用显卡核心的片内L1 Cache共享数据,使数据不必经过内存-显存的反复传输,shader之间甚至可以互相通信,对数据的存储也不再约束于以往GPGPU的纹理方式,存取更加灵活,可以充分利用stream out(流输出)特性,最典型的例子就是PhysX物理加速特效。PhysX最早是Aegia公司推出的硬件级物理加速技术,NVIDIA将其收购之后便通过CUDA环境将PhysX软件化,由显卡中的shader单元承担物理加速特效的运算。

 对于Stream技术,AMD宣称可让显卡内数百个平行串流核心,为各种一般用途的应用带来加速的效果,打造各种优异的平台,并可大幅提升每瓦性能,而实现这一点的前提就依赖于AMD独特的流处理器单元设计。

  GF100的512个CUDA核心都符合IEEE 754-2008浮点算法(Cypress也是如此)和完整的32位整数算法,而后者在过去只是模拟的,事实上仅能计算24-bit整数乘法;同时全面引入的还有积和熔加运算(Fused Multiply-Add/FMA)。此外双精度浮点(FP64)性能大大提升,峰值执行率可以达到单精度浮点(FP32)的1/2,而过去只有1/8,AMD从R600开始到现在的Cypress核心都是1/5,没有做任何变化。     下接第二页

返回顶部】【关闭窗口 风险提示:本站分享转载的信息均来自互联网,且仅供阅读参考,不作为具体投资的依据,据此入市,风险自担。本站所有内容涉及到的“货币”字眼需谨慎研判,我们维护各国法币的合法地位,同时数字资产具有货币的某些属性,目前是不能替代任何国家的法定货币的,请谨慎理解投资并严格遵守各国法律法规!详见本站[免责声明]。】
【读完这篇文章后,可否发表您的感受?】
0
0
0
0
0
0
0
0
本文网址:
安全联盟站长平台 互联网举办平台 公共信息安全网监 中国网安 赛门铁克安全响应中心