永胜| 西充| 带岭| 双牌| 昌吉| 芒康| 宁德| 勉县| 辉县| 樟树| 顺平| 柘荣| 丰顺| 固始| 达县| 门头沟| 裕民| 通海| 北辰| 乌马河| 江永| 曲水| 铜山| 津市| 惠水| 洞口| 遵义县| 长海| 吴桥| 临邑| 罗田| 西乌珠穆沁旗| 马龙| 莱山| 长泰| 腾冲| 井研| 两当| 敦煌| 甘棠镇| 台中县| 新疆| 辽阳县| 安化| 宣汉| 兰州| 鄂州| 红安| 百色| 陆河| 台中市| 黎城| 紫金| 乌尔禾| 息烽| 萨迦| 调兵山| 昌黎| 卓资| 嘉祥| 南郑| 贺州| 弓长岭| 泾阳| 镇宁| 周宁| 广安| 广灵| 宜城| 万源| 松江| 吉安市| 永昌| 恒山| 尚志| 沿滩| 黑河| 鸡泽| 洋县| 怀仁| 册亨| 乌鲁木齐| 抚远| 莲花| 召陵| 巴青| 河津| 临泽| 达州| 博爱| 延川| 嘉祥| 平远| 耒阳| 新沂| 马鞍山| 新绛| 绵竹| 龙海| 凤城| 正镶白旗| 龙游| 治多| 囊谦| 昭觉| 绥宁| 修水| 泽库| 将乐| 安康| 新绛| 肃南| 连城| 新兴| 南票| 阿克塞| 伊川| 雁山| 深圳| 竹溪| 新竹县| 吉隆| 玉山| 西峰| 涪陵| 灵石| 贵池| 东乌珠穆沁旗| 彝良| 科尔沁右翼中旗| 青田| 房县| 关岭| 曲周| 湘乡| 汉中| 藁城| 柳城| 广西| 江油| 浮山| 徐水| 沧州| 安远| 吉隆| 莘县| 柳河| 兰考| 富阳| 科尔沁左翼后旗| 策勒| 西盟| 罗田| 道县| 瑞昌| 沧州| 满洲里| 永胜| 兴国| 冠县| 嘉善| 敖汉旗| 博白| 林芝县| 扶沟| 栖霞| 延安| 唐海| 文安| 开平| 东乌珠穆沁旗| 浏阳| 华坪| 阿拉尔| 林口| 望江| 吉木萨尔| 辽源| 蓬安| 兰西| 中方| 乾县| 仪征| 尼玛| 阿克苏| 万山| 仙桃| 台中市| 泽普| 张北| 荣成| 兴安| 台儿庄| 威远| 周宁| 泸州| 楚州| 成都| 左贡| 陈巴尔虎旗| 镇宁| 陵水| 惠来| 景泰| 西平| 弋阳| 遵义县| 东兰| 宜秀| 夷陵| 汕尾| 隆尧| 大同市| 广平| 庆安| 奇台| 阳春| 安康| 黄陂| 那坡| 塔城| 顺义| 丹徒| 四会| 毕节| 泗阳| 郁南| 潮阳| 禹城| 灵山| 滴道| 澄海| 衡东| 柘城| 东阳| 南山| 拉萨| 柳河| 环江| 红古| 高州| 元阳| 南宁| 扬州| 土默特左旗| 四会| 新城子| 韶山| 朗县| 洞头| 香港| 嘉义市| 广元| 天长| 固始| 山西| 武鸣| 乃东| 惠农| 剑阁| 郫县| 都安| 威县| 丹东| 百度

日本のロボット技術、スマート化と省力化が新トレンド

2019-03-19 08:57 来源:硅谷网

  日本のロボット技術、スマート化と省力化が新トレンド

  百度  2005年2月,任辉南县委书记;2006年12月,任白城市委常委、宣传部长;2007年8月,任白城市委常委、宣传部长、政法委书记,市公安局党委书记(兼);2007年10月,任白城市委常委、宣传部长、政法委书记,市公安局党委书记、局长(兼);2008年1月,任白城市委常委、政法委书记,市公安局局长(兼);2010年4月,任白城市委常委、副市长;2011年12月,任吉林省政府国有资产监督管理委员会党委委员、副主任;2016年4月,任吉林省政府国有资产监督管理委员会党委书记、主任;2017年12月,任吉林省工商行政管理局党组书记;2018年2月,任吉林省工商行政管理局党组书记、局长;2018年10月,任吉林省市场监督管理厅(省知识产权局)党组书记、厅长。  得益于40年改革开放,中国外向型经济取得了巨大成就、站上新的起点。

  中国青年报·中青在线中国青年网记者杜沂蒙  侦破各类网络犯罪案件万余起  净网2018成效怎么样?发布会上,公安部新闻发言人郭林用了显著两个字。

    调查指出,学生选择到内地升学的主因是收生要求较低(61%),其次是学费较便宜(32%)。公开资料显示,这一年,习近平主持参加了429项内政外交活动,平均每月近36项。

  办案检察官充分发挥主观能动性,多次与公安机关、鉴定机构沟通,最终确定雷某等5人渔获物的价值,让他们在承担刑事责任的同时,赔偿生态修复费万元。比如说理工科考研不怎么考实验,有些学生就很少去上实验课,还有一些通识教育,学生也不怎么重视。

格桑德吉说:希望国家在加强硬件投入改善边远地区办学条件的同时,也统筹考虑教育软件投入,让偏远地区的学生不仅有学上,更要上好学。

  对于实施国家项目的资金来源,梅德韦杰夫表示不仅有政府拨款,也有私人投资,政府的工具箱还包括调整增值税、消费税税率等。

  大家抱着简历,仔细审视各大公司的招聘简章,从工作地点、薪资水平,到发展前景,一个不漏。华图教育公考辅导专家李曼卿分析。

  例如,作为国家医疗健康项目的一部分,俄计划在弗拉基米尔、伏尔加格勒、梁赞、彼尔姆和克拉斯诺亚尔斯克地区建立最需要的医疗中心。

    报道称,全国政协十三届二次会议的新闻发言人郭卫民表示,全国政协十三届二次会议将于3日下午3时在人民大会堂开幕,3月13日上午闭幕。试卷的投递、安全保管、分发和回收等环节众多,给考务组织部门带来的工作压力越来越大。

    中新网3月4日电据《香港商报》报道,3日,由香港旺角街坊会主办、油尖旺民政事务处协办的第15届大角咀庙会举行,晚上过百位健儿舞动500英尺长(约152米)的夜光龙压轴出场。

  百度  杨德才委员分析,消费增长的前提是居民收入增长,一方面要让老百姓有钱花,创造条件提高居民收入;另一方面则要让老百姓敢花钱,这就需要完善各种公共服务,深入推进社会保障领域的改革。

  美国前国务卿、中美建交的亲历者基辛格博士曾说:“体育是联结世界的纽带。  发现遗骸  在湖南衡阳加福村被找到  2014年,湖南衡阳县洪市镇加福村的一位老人陈玉龙向人提起,他家附近的一个小山坡上埋葬着几位抗日时期的空降兵骸骨。

  百度 百度 百度

  日本のロボット技術、スマート化と省力化が新トレンド

 
责编:
您正在使用IE低版浏览器,为了您的雷锋网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
雷锋网
人工智能 正文
发私信给程弢
发送

0

日本のロボット技術、スマート化と省力化が新トレンド

本文作者:程弢 2019-03-19 14:03
导语:从这次发布的测试结果来看,TPU似乎已经超出了业界的预期,但是藏在这一芯片背后的内部架构究竟有什么秘密呢,我们从Jouppi此前发布的论文当中,可以找到答案。
百度 杨丽丽说,即使现在给她一个北京户口,也很难找到那份归属感。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

在谷歌发布TPU一年后,这款机器学习定制芯片的神秘面纱终于被揭开了。

昨日,谷歌资深硬件工程师Norman Jouppi刊文表示,谷歌的专用机器学习芯片TPU处理速度要比GPU和CPU快15-30倍(和TPU对比的是英特尔Haswell CPU以及Nvidia Tesla K80 GPU),而在能效上,TPU更是提升了30到80倍。

从这次发布的测试结果来看,TPU似乎已经超出了业界的预期,但是藏在这一芯片背后的内部架构究竟有什么秘密呢,我们从Jouppi此前发布的论文当中,可以找到答案。

据雷锋网了解,早在四年前,谷歌内部就开始使用消耗大量计算资源的深度学习模型,这对CPU、GPU组合而言是一个巨大的挑战,谷歌深知如果基于现有硬件,他们将不得不将数据中心数量翻一番来支持这些复杂的计算任务。

所以谷歌开始研发一种新的架构,Jouppi称之为“下一个平台”。Jouppi曾是MIPS处理器的首席架构师之一,他开创了内存系统中的新技术。三年前他加入谷歌的时候,公司上下正在用CPU、GPU混合架构上来进行深度学习的训练。

Jouppi表示,谷歌的硬件工程团队在转向定制ASIC之前,早期还曾用FPGA来解决廉价、高效和高性能推理的问题。但他指出,FPGA的性能和每瓦性能相比ASIC都有很大的差距。他解释说,“TPU可以像CPU或GPU一样可编程,它可以在不同的网络(卷积神经网络,LSTM模型和大规模完全连接的模型)上执行CISC指令,而不是为某个专用的神经网络模型设计的。一言以蔽之,TPU兼具了CPU和ASIC的有点,它不仅是可编程的,而且比CPU、GPU和FPGA拥有更高的效率和更低的能耗。

TPU的内部架构

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

该图显示了TPU上的内部结构,除了外挂的DDR3内存,左侧是主机界面。指令从主机发送到队列中(没有循环)。这些激活控制逻辑可以根据指令多次运行相同的指令。

TPU并非一款复杂的硬件,它看起来像是雷达应用的信号处理引擎,而不是标准的X86衍生架构。Jouppi说,尽管它有众多的矩阵乘法单元,但是它GPU更精于浮点单元的协处理。另外,需要注意的是,TPU没有任何存储的程序,它可以直接从主机发送指令。

TPU上的DRAM作为一个单元并行运行,因为需要获取更多的权重以馈送到矩阵乘法单元(算下来,吞吐量达到了64,000)。Jouppi并没有提到是他们是如何缩放(systolic)数据流的,但他表示,使用主机软件加速器都将成为瓶颈。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

256×256阵列缩放数据流引擎,经过矩阵乘法积累后实现非线性输出

从第二张图片可以看出,TPU有两个内存单元,以及一个用于模型中参数的外部DDR3 DRAM。参数进来后,可从顶部加载到矩阵乘法单元中。同时,可以从左边加载激活(或从“神经元”输出)。那些以收缩的方式进入矩阵单元以产生矩阵乘法,它可以在每个周期中进行64,000次累加。

毋庸置疑,谷歌可能使用了一些新的技巧和技术来加快TPU的性能和效率。例如,使用高带宽内存或混合3D内存。然而,谷歌的问题在于保持分布式硬件的一致性。

TPU对比Haswell处理器

在和英特尔“Haswell”Xeon E5 v3处理器来的对比中,我们可以看到,TPU各方面的表现都要强于前者。

在Google的测试中,使用64位浮点数学运算器的18核心运行在2.3 GHz的Haswell Xeon E5-2699 v3处理器能够处理每秒1.3 TOPS的运算,并提供51GB/秒的内存带宽;Haswell芯片功耗为145瓦,其系统(拥有256 GB内存)满载时消耗455瓦特。

相比之下,TPU使用8位整数数学运算器,拥有256GB的主机内存以及32GB的内存,能够实现34GB/秒的内存带宽,处理速度高达92 TOPS ,这比Haswell提升了71倍,此外,TPU服务器的热功率只有384瓦。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

除此之外,谷歌还测试了CPU、GPU和TPU处理不同批量大小的每秒推断的吞吐量。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

如上图所示,在小批量任务中(16),Haswell CPU的响应时间接近7毫秒,其每秒提供5482次推断(IPS),其可以实现的最大批量任务(64)每秒则可以完成13194次推断,但其响应时间为21.3毫秒。相比之下,TPU可以做到批量大小为200,而响应时间低于7毫秒,并提供225000个IPS运行推理基准,是其峰值性能的80%,当批量大小为250,响应时间为10毫秒。

不过需要注意的是,谷歌所测试的Haswell Xeon处理器似乎也不能完全说明问题,英特尔Broadwell Xeon E5 v4处理器和最新的“Skylake”Xeon E5,每核心时钟(IPC)的指令比这款处理器提升了约5%。在Skylake是28核,而Haswell为18核,所以Xeon的总体吞吐量可能会上升80%。当然,这样的提升与TPU相比仍有差距。

最后雷锋网需要强调的是,TPU是一个推理芯片,它并非是要取代GPU,可以确定的是,TPU与CPU一起使用对训练分析更加有益。但对于CPU制造商而言,如何研发出像ASIC一样兼顾性能和能效的芯片是现在以及未来要做的。

可以确定的是,谷歌已经逐渐在自己的数据中心部署TPU,但是上述测试数据只是理论结果,实际应用表现如何?我们还不得而知。

Via nextplatform,雷锋网(公众号:雷锋网)编译

雷锋网版权文章,未经授权禁止转载。详情见转载须知

分享:
相关文章

文章点评:

表情

略懂技术的小编

关注一切有未来感的产品及技术!
当月热门文章
最新文章
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说
百度