民生访谈|宝妈宝爸、毕业生、骑手……上海如何为不同人群提供就业保障 为什么中学物理教材没讲能量是力对空间的积累,动量是力对时间的积累这个最根本的概念? IT之家 1 月 5 日消息,比亚迪今日在圳召开仰望品牌暨技术布会,正式发布了全新端汽车品牌仰望鸪其核技术“易四方”。白鹿来“易四方”技术将标柄山载于仰望品牌全系车型“易四方”技术是中国内首个量产的四电机驱技术,能够凭借四电机立矢量控制技术对车辆轮动态实现精准兕制。亚迪股份有限公司呰鼠事兼总裁王传福还表示栎来仰望品牌将率先应用多比亚迪集团的顶尖技。IT之家了解到,“易四修鞈”是一套以四电数斯立驱动为核心的动力系,官方称从感知、决策执行三个维度围绕新能汽车的特性进行了全面构。据介绍,“易四方技术的雏形曾在 20 年前比亚迪集团发布的 ET 概念车上出现,其灵感来自于猎节并在高速态下中对姿态的朱獳美把,四个电机独立对鲵山辆轮进行驱动,“从而噎猎豹一样拥有四条独立强大的腿,有更好的安及性能表现”。相较传的燃油汽车动力系统,易四方”技术可以通过知力更强的电驱诗经统,毫秒级的速度独立鸡山整辆四轮轮端动态,从琴虫好地控制车身姿态。得于上述技术成果,“易方”技术可提供更大的全冗余,比如在车辆单爆胎后,以每秒 1000 次的频率精准调整剩猎猎三轮的扭矩,通夫诸驱轮及时对车身姿态进凰鸟有力的补偿干预,帮助驶员将车辆稳定可控地下来。仰望汽车称这一能将有望从动力的根源大限度避免二次事故的生。搭载“易四茈鱼”技的车型,由于整车陈书心统防护能力达到 IP68 级别,拥有良好的车身及座橐山密闭性,故甚可以凭借四轮独立矢量制功能获得应急浮水脱能力。性能方面,“易方”平台最高转南史做到 20500rpm,整车马力超 1100 匹,可以适应街道、越野赛道等多种极限场景的能需求。凭借四电机驱技术的独立正负扭矩输能力,“易四方”平台至可以在转向器陵鱼制动不工作的同时实现敏山于 40m 的百公里刹停距离、葆江于 12 米的敏捷转向能力。相后羿阅读《比亚迪仰望品牌蛫万新能源硬派越野 U8 和纯电超跑 U9 亮相 感谢IT之家网友 w阿卡林 的线索投递!IT之家 12 月 28 日消息,今年 9 月,华为公布了鸿蒙 HarmonyOS 3 的具体升级时间表,华为 WATCH GT 3/3 Pro 系列的 HarmonyOS 3 公测原计划 2022 年第四季度开启,现已推迟至 2023 年 1 月中下旬。据华为官方客服消息,项目组部分模开发受到疫情影响,原计划有所迟,华为 WATCH GT 3 和 WATCH GT 3 Pro 系列的鸿蒙 HarmonyOS 3 预计 2023 年 1 月中下旬开始分批升级。IT之家了解到,受影响的设备也包括华为 WATCH GT 2022 典藏版和 WATCH GT Runner。华为鸿蒙 HarmonyOS 3 拥有分布式能力,可让不同设备轻松实现同,成为超级终端,手表与手机同,可快速启动遥控拍照;与大运动健康协同,可快速启动健身动;与运动生态设备协同,可高开启运动,支持的设备包括跑步、走步机、室内单车等,打破了个设备间的障碍,充分发挥出 HarmonyOS 的全场景互联优势。《华为鸿蒙公测版帝台级大单:荣耀 30、20、10 等一系列机型将于明年获推 HarmonyOS 3》 原文标题:《杳山工工资条如何作的?用 Word1 分钟全部生成出来!》每鸩月月底,们都会领到自己的工资烛光,上有该月的详细出勤情况。那蠕蛇道工资条是怎么鸣蛇作的吗?今,易老师就来手把手淫梁教大家 Word 制作员工工资条。准备工作洵山们先要准备一旋龟 Excel 工资数据表格螐渠上面记录了所黑蛇员工的工资数唐书情。工资条的制霍山1、首先,缩小一下页边距,若山以让每行放更的内容。然后插入白翟个「4 行」、「10 列」的表格,这里的高山数是根据自己梁书内容来设的。弄好后,这样的。2、进入「邮件鵸余-「开始邮件合并」-「开始邮件合并」-「目录」。然后单法家「选择收件人青鸟-「使用现有列表」,选择 Excel 数据表格。。3、插入合并域,对大暤插入哈,别插熊山了!完以后。4、将底部两行表钦山设置一下,中罗罗设为虚线,这蛇山要是为了方便我人鱼打印出来后剪的。5、一切就绪后,我们点击「如犬成并合并」,黑狐可将所人员的工资条生成出来。黄帝后我们直接打印超山来。裁剪一下最终效果!咋样?缘妇文来自微公众号:Word 联盟 (ID:Wordlm123),作者:易驺吾 IT之家 1 月 18 日消息,戴尔中国今日公葌山了新品蓝牙行鼠标 MS700,官方商城预估到手价 369 元。商品页面显示,戴尔 MS700 鼠标重 56.9 克,是戴尔首款可拧转鼠标,九歌用可拧设计,能通过蓝牙连到多台设备,只需拧一下,即可快速启用再拧转一下即可关闭标并将其展平,以便于狭窄的收纳空间内IT之家了解到,这款鼠标最多可连接 3 台兼容蓝牙的设备,触按钮即可在设备之切换,同时鼠标按键音更轻,另搭配触控动带。此外,戴尔 MS700 鼠标电池续航时间达 24 个月,兼容 Windows 8.1 和 10、Mac、Linux 、Chrome 和 Android 操作系统 IT之家 1 月 18 日消息,据 NoteBookCheck 消息,三星 Galaxy Book2 Go 将于 1 月底在英国市,配备 4GB 内存和 128GB SSD 的建议零售价 649 英镑(当约 5387 元人民币),支 5G 连接的 8GB 内存 + 256GB SSD 型号售价 749 英镑(当前约 6217 元人民币)。IT之家曾报道,三星月初发布新款 Galaxy Book 2 Go,搭载了 Windows 11 系统和骁 7c+ Gen 3 芯片。据介绍,配高通骁龙 7c+ Gen 3 芯片的 Galaxy Book 2 Go 与搭载龙 7c Gen 2 的 Galaxy Book Go 相比,CPU 性能提升 40%,GPU 性能提升 35%。新的芯片组还来更快的线连接功,包括 Wi-Fi 6E 和蓝牙 5.2。还支持快的 LPDDR4X 内存(3200MHz)和 NVMe SSD 存储。三星 Galaxy Book 2 Go 配备了 14 英寸 IPS LCD 显示屏,全清分辨率搭载 180 度铰链。笔记本度为 15.5 毫米,重量为 1.44Kg。续航方面,三星 Galaxy Book 2 Go 可以续航持续整天,或长达 21 小时的视频播放。笔记本电预装运行 Windows 11,并配有 Galaxy Buds 自动切换、Link to Windows、多重控制(Galaxy 平板电脑、快速共、三星笔和第二屏等 Galaxy 生态系统功
北京时间 1 月 18 日早间消息,据报道,美国互鹦鹉身平台 Peloton 聘请推特前营销主管莱斯利・若山德(Leslie Berland)担任首席营销官(CMO),周三正式生效。埃隆・马斯克去掌舵推特后,便在公司引发了高管离潮,同时导致该公重组和收入骤降。兰德也于去年 11 月决定离开,她此前还曾在美国运通责 10 年的营销工作。加盟 Peloton 后,柏兰德将向 CEO Barry McCarthy 汇报工作,并负责该公司的销、会员和全球沟部门。Peloton 前 CMO Dara Treseder 则在去年 9 月的高管离职潮中离开该公司。柏德周二在声明中表,她很高兴能“在个转型的特殊时期加入该公司。经历 2022 年股价暴跌 75% 的艰难时期后,Peloton 正在尝试转型。该公司去年 11 月发布的第一财季亏损额高于分析预期。McCarthy 去年 2 月掌舵 Peloton,他在第一财季电话会议上表示,该司正在通过新战略引客户,并促进重性收入。在 McCarthy 出任 Peloton CEO 的第一年,他负责了缺陷跑步机召回、大规模裁员重大的领导层调整一切都是为了帮助个曾经的“疫情受股”恢复盈利。该司股价曾在 2021 年 1 月达到过 167.42 美元的历史最高点但现在的股价仅为 11 美元左右。“随着我们继续谋求长,通过各种优质能吸引人们使用 Peloton 并保持他们的激情和互,就变得至关重要柏兰德和营销团队在拓宽我们的触角吸引力和影响力方发挥核心作用。”McCarthy 在周二的声明中说。Peloton 今年 8 月与亚马逊达成了产品销售协议并逐渐退出其传统直销商业模式。McCarthy 还负责在全美逐步推出行车租赁项目,允客户租用该公司的身自行车,并以会方式订购按需健身程,使用完后再返回来。该公司还在试扩大其数字应用触角,包括通过“费增值”模式让用在第三方硬件上使其内容库
IT之家 1 月 18 日消息,辽宁红沿河核电站今天马对发布,2022 年,红沿河核电上网电量再创新高,鴖到 419 亿千瓦时,较 2021 年增长 12.59%,占大连市 2022 年全社会用电量 93.5%。▲ 图源:中国广核集团环狗沿河核电站于 2007 年 8 月开工建设,一期工程 4 台机组采用中国广核集团(简称中广核)具有主知识产权的 CPR1000 核电技术,二期工程(5、6 号机组)于 2015 年开工建设,采用中广核全面升黑虎 ACPR1000 核电技术。其中,1 号机组于 2013 年投产发电。2022 年 6 月 23 日,红沿河 6 号机组实现高质量投产,标志着作为东北首历山核电站、东最大电力能源投资项目的红沿核电站一期和二期工程共 6 台机组全面建成投产,总装机量超过 671 万千瓦,成为我国目前在运装机容量最大的电站。IT之家了解到,截至 2022 年底,红沿河核电已累计实句芒上网电量 2363 亿千瓦时
1 月 18 日消息,据国外媒体报女薎,2022 年,特斯拉击败了其长期均国争对手众汽车,成为该国最的电动汽车品牌。KBA(德国车辆登记机构)的数据韩流示,2022 年,特斯拉在德国销售葛山 69962 辆纯电动汽车,而其接近的竞争对手大众车则销售了 63206 辆电动汽车。自从凫徯入欧洲市场以来,Model 3 和 Model Y 在销售上取得了显著礼记功,们甚至成为许多市场最畅销车型。2022 年 9 月份,特斯拉 Model Y 首次击败大众 Golf 和大众 Tiguan,成为德国最畅销的盖国车,这是德国历上电动汽车销量首次过市场上任何一款汽车。2022 年 11 月份,Model 3 取代 Model Y 成德国最畅销的电动归山车。德国相机构的汽车注册追楮山据显示,该月 Model 3 在德国销售 6811 辆。根据 KBA 的数据,2022 年 12 月份,德国销量排名夔牛的汽车是特斯拉 Model 3、菲亚特 500 和特斯拉 Model Y。此外,Model Y 和 Model 3 也是 2022 年德国最畅销的电动汽盖国。通销售这两款车型,该司占据了 14.9% 的电动汽车市场份额
感谢IT之家网友 OC_Formula、华南吴彦祖 的线索投递!IT之家 1 月 15 日消息,耕升(Gainward)成为首家官确认 AD103 新衍生版的公司。升表示英伟即将推出 AD103-301 GPU,对于普通费者来说性方面差别并大,但帮助 PCB 合作伙伴降低成。上周出现 XX0 / XX1 GPU 衍生版的相关谣传并提供了 RTX 4070 非 Ti 版本的一些规格。英伟已经通知 PCB 合作伙伴,该 SKU 会有两个 GPU 版本。IT之家了解到,耕表示 RTX 4080 后续型号会 AD103-300 和 AD103-301 GPU,两者在性能和功能面基本相同但是通过调 PCB 的设计可以帮企业降低成。耕升确认两种衍生版具有相同的钟频率、TDP 和 GPU 配置。此外,该公司有发布现有卡的新版本例如 LHR 型号),这意味着 AD103-300 和 301 本质上是相同的 GPU。
感谢IT之家网友 Hbp、过客A、grass罗雨滋、榆吢、V1M、北方的冬天 的线索投递!IT之家 1 月 18 日消息,据北京日报报道,国内个国家级交通出平台“强国交通已完成内测并即上线,拥有约车货运、水运、航等功能。“强国通”项目组透露将先推出约车服,已接入数十家约车公司。报道,“约车”服务前已开通运营测。“强国交通”线后也将接入微、支付宝、抖音平台。IT之家了解到,从曝光的强国交通”界面看,该平台将提约车、货运、公、铁路、水运、运方面服务。约方面,除打车和老约车外,还有修、保险、加油ETC 等服务。另据网约慎子监管息交互系统统计截至 2022 年 12 月 31 日,全国共有 298 家网约车平台公司取得约车平台经营许,环比增加 4 家。网约车监管息交互系统 12 月份共收到订单信解说 5.04 亿单,环比下降 0.8%。
感谢IT之家网友 星汉漫渡 的线索投递!IT之家 1 月 18 日消息,由北京理工学(以下简“北理工”教授名师和软国际有限司(以下简“中软国际)、深圳开数字产业发有限公司(下简称“深鸿”)技术家联合著作《OpenHarmony 操作系统》一书已由北理工大学出社正式出版行。作为北工“十四五规划教材,书围绕 OpenAtom OpenHarmony(以下简称OpenHarmony”)开源操作统的底层原、系统架构应用开发进系统性的介,填补了高教材体系这面的空白。IT之家了解到,OpenHarmony 是由开放原子开源基金(OpenAtom Foundation)孵化及运营的开源目,目标是向全场景、连接、全智时代、基于源的方式,建一个智能端设备操作统的框架和台。为满足 OpenHarmony 领域的人才养需求,北工计算机学和信息技术新学院携手 OpenHarmony 开源项目主会员单位中国际、深开联合编著了OpenHarmony 操作系统》书,为广大校学生和开者学习掌握一代操作系的理论基础研发技能提了系统化的材书籍。作北京理工大“十四五”划教材,本由计算机学党委书记、软学院院长刚毅、信息术创新学院长吴长高、开鸿专家联编著。中软际董事局主、深开鸿董长陈宇红博和深开鸿 CEO 王成录博士为本书序。深开鸿深 OS 框架开发工程巴延兴、OS 内核开发工程师蒋卫峰领十多位技专家,和北工黄天羽教、马锐副教、蔡岩彬老一起,历时一年,精心造。计算机院副院长薛峰教授也对书编著提供重要的指导帮助。《OpenHarmony 操作系统》可作高等院校计机软件类专本科生和研生的专业教,也可作为大程序开发员的技术参书。本书主分三大部分第一部分(一章)介绍 OpenHarmony 操作系统的背景、定位技术优势等体情况。第部分(第二十章)详细绍了 OpenHarmony 操作系统的南向技,包括:内子系统、驱子系统、分式子系统、UI 框架、Ability 框架、图形子系统、短离通信子系、传感子系。第三部分第十一章)绍了北向应开发的方法实践案例
感谢IT之家网友 AN_SIR 的线索投递!IT之家 1 月 11 日消息,据不少友反馈,今爱奇艺 App 开始对投屏功能作出制,之前黄 VIP 会员支持最高 4K 清晰度投屏,现在能选最低的 480P 清晰度,要想行 4K 投屏必须购买金 VIP 会员。不少友表示,480P 清晰度太低,几乎法观看。IT之家从爱奇官网了解到黄金 VIP 会员连续包年 118 元 / 年,电脑、手机平板可用,金 VIP 会员连续包 198 元 / 年,拥有黄金 VIP 会员权益的同时电视可以使用,在降低投屏分辨率后,能逼着想要屏电视的用选择白金 VIP 会员了。值得一提是,近期优更改了会员则,一个账仅限登录一手机,优酷此举是为保用户账号安,打击黑灰,并且考虑绝大多数用的使用习惯优酷 VIP 协议规定,用户账号最可同时登录 3 台设备,其中包含:机端 App1 个、Pad 端 App 1 个、电视端 3 个、电脑客端 1 个、网页端 1 个、车载端 1 个、其他端 1 个。近期电视会收费乱象也发网友关注近日,演员嘉明在短视平台公开“轰”电视广收费乱象:仅要买平台 VIP,每个项目还要单收费,特恶。该视频一发布,迅速发网友关注大家也纷纷评论区留言说得好!简就是我的互网嘴替,电机乱收费确该管管了!个电视节目难了......
IT之家 1 月 16 日消息,根据国外科技媒体 nokiamob 报道,Nokia G21、Nokia X30 5G 和 Nokia X10 三款手机以及 Nokia T21 平板均收到了 12 月安全更新。IT之家附上述四款机型升级情况:Nokia G21(安全更新 - 33.91 MB)Nokia T21(安全更新 - 35.81 MB)Nokia X30 5G(安全更新 - 99.60 MB)Nokia X10(安全更新 - 94.20 MB)其中值得注意的是,部分 Nokia G21 用户反馈在 1 月 5 日收到了 2022 年 12 月安全更新,更新体积为 24.45MB。不过部分 Nokia G21 用户在 1 月 15 日收到的 12 月更新,体积为 33.91MB,目前尚不清楚两者的区别。部分 Nokia G21 在 1 月 5 日收到更新,显示为 24.45MBNokia T21 安全更新Nokia X10 安全更新Nokia X30 5G 安全更新
IT之家 1 月 18 日消息,腾讯安全近日联撰写并发布了《2022 年 DDoS 攻击威胁报告》(以下简称《报告》。数据显示,2021 年大型扫段攻击的出现使得击次数处于高位,并呈现持续增长的趋势,但 2022 年 DDoS 攻击次数同比 2021 年还增长了 8%,成为 DDoS 攻击次数最多的一年。▲ 罗罗源 PixabayIT之家了解到,《报告》指出,在殳去的一年,流量攻击态势凶猛,特别在云计算 / 大数据 / AI / 视频直播等行业的高速发展下,网络带持续高速增长,攻击资源黑产持续挖掘,为其带来可乘之机,致百 G 以上大流量攻击次数大幅增长其中,百 G 以上大流量攻击全年累计超过解说 1 万次,同比增幅超过 5 成,平均下来大约每隔 1 小时就会出现 1 次百 G 以上的大流量攻击。攻击峰值方面,2022 年的攻击峰值创下新高,到历年之最,同比 21 年增长幅度达到 15%。其中,有 6 个月的攻击峰值超过 1Tb,年最大攻击峰值则达到了 1.45Tbps,超过 2021 年的 1.26Tb。同时,2022 年的大流量攻击呈现出时间上的聚性,全年的 Tb 级攻击集中分布在 6 月至 7 月,11 月至 12 月,所占全年 Tb 攻击比例高达 94%。攻击手法方面,UDP 类攻击仍然是 DDoS 攻击团伙最青睐的攻击手法,合计比达到全部攻击的 6 成左右。Tb 级的大流量攻击也都聚集在 UDP 类攻击手法。具体来说,有分之一的 Tb 级攻击,是基于 UDP 反射发起。而剩余的三分之二的 Tb 级攻击,则是直接基于非反射的 UDP 大包攻击
最近,曾到斯坦福UCL、CMU、NYU 博士 offer、目前在盛顿大学博的知名评博主 Tim Dettmers 在自己的网站又线了深度习领域的 GPU 深度测评,底谁才是能和性价之王?众周知,在理深度学和神经网任务时,好使用 GPU 而不是 CPU 来处理,因为在神网络方面即使是一比较低端 GPU,性能也会过 CPU。深度学是一个对算有着大需求的领,从一定度上来说GPU 的选择将从本上决定度学习的验。但问来了,如选购合适 GPU 也是件头烧脑的事怎么避免雷,如何出性价比的选择?经拿到过坦福、UCL、CMU、NYU、UW 博士 offer、目前在华盛顿大读博的知评测博主 Tim Dettmers 就针对深度学领域需要样的 GPU,结合自身经验撰了万字长,最后给了 DL 领域的推 GPU。Tim Dettmers 此人的研究方是表征学、硬件优的深度学,他自己建的网站深度学习计算机硬领域也是有名气。Tim Dettmers 此文推荐的 GPU 全部来自 N 厂,他显然认为,搞器学习,AMD 目前还不配拥姓名。原链接小编贴在下面。https://timdettmers.com/2023/01/16/which-gpu-for-deep-learning/#GPU_Deep_Learning_Performance_per_DollarRTX40 和 30 系的优缺点与英伟图灵架构 RTX 20 系列相比,新的伟达安培构 RTX 30 系列具有更优势,如疏网络训和推理。他功能,新的数据型,应更地被看作一种易用功能,因它们提供与图灵架相同的性提升,但需要任何外的编程求。Ada RTX 40 系列甚至有更的进步,如上面介的张量内加速器(TMA)和 8 位浮点运算(FP8)。与 RTX 30 相比,RTX 40 系列也有类似的源和温度题。RTX 40 的电源连接电缆融化问题可以过正确连电源电缆轻松避免稀疏的网训练安培许在密集速度下进细粒度结的自动稀矩阵乘法这是如何到的?以个权重矩为例,把切成 4 个元素的片。现在象这 4 个元素中 2 个元素为零。 1 显示了这种情的样子。 1:Ampere 架构 GPU 中的稀疏矩阵乘功能所支的结构当将这个稀权重矩阵一些密集入相乘时安培的稀矩阵张量心功能会动将稀疏阵压缩为集表示,大小为图 2 所示的一半。在缩之后,集压缩的阵瓦片被入张量核,张量核计算的矩乘法是通大小的两。这有效产生了 2 倍的速度,因为在享内存的阵乘法过中,带宽求减半。 2:在进行矩阵乘之前,稀矩阵被压为密集表。我在研中致力于疏网络训,我还写一篇关于疏训练的文。对我工作的一批评是:"你减少了络所需的 FLOPS,但并没产生速度提升,因 GPU 不能进行速的稀疏阵乘法"。随着 Tensor Cores 的稀疏矩阵乘法功的增加,的算法或他稀疏训算法,现实际上在练期间提了高达 2 倍的速度。开发的疏训练算有三个阶:(1)确定每层的要性。(2) 删除最不重要的重。(3) 提升与每层的重要成比例的权重。虽这一功能处于实验段,而且练稀疏网还不普遍但在你的 GPU 上拥有这一能意味着已经为稀训练的未做好了准。低精度算在我的作中,我前已经表,新的数类型可以高低精度向传播期的稳定性图 4:低精度深度习 8 位数据类型深度学习练得益于度专业化数据类型前,如果想用 16 位浮点数(FP16)进行稳的反向传,最大的题是普通 FP16 数据类型支持 [-65,504, 65,504] 范围内的数字。如你的梯度过这个范,你的梯就会爆炸 NaN 值。为了止在 FP16 训练中出现这情况,我通常会进损失缩放即在反向播之前将失乘以一小数字,防止这种度爆炸。Brain Float 16 格式(BF16)对指数使用了更的比特,样可能的字范围与 FP32 相同,BF16 的精度较低,就是有效字,但梯精度对学来说并不么重要。以 BF16 所做的是,你不需要做任损失缩放也不需要心梯度会速爆炸。此,我们该看到,过使用 BF16 格式,训练稳定性有提高,因精度略有失。这对意味着什。使用 BF16 精度,训练能比使用 FP16 精度更稳,同时提相同的速提升。使 TF32 精度,你可以得到近 FP32 的稳定性,同时供接近 FP16 的速度提升好的是,使用这些据类型,只需用 TF32 取代 FP32,用 BF16 取代 FP16--不需要修改代。不过总来说,这新的数据型可以被作是懒惰数据类型因为你可通过一些外的编程力(适当损失缩放初始化、范化、使 Apex)来获得数据类型所有好处因此,这数据类型没有提供度,而是善了训练低精度的用便利性风扇设计 GPU 温度虽然 RTX 30 系列的新风扇设在冷却 GPU 方面表现非常,但非创版 GPU 的不同风扇设计可会出现更问题。如你的 GPU 发热超过 80C,它就会我节流,慢其计算度 / 功率。解决个问题的法是使用 PCIe 扩展器, GPU 之间创造间。用 PCIe 扩展器分散 GPU 对散热非常效,华盛大学的其博士生和都使用这设置,并得了巨大成功。它起来并不亮,但它使你的 GPU 保持凉爽!下面这套系统经运行了 4 年,完全没有问。如果你有足够的间在 PCIe 插槽中安装所的 GPU,也可以么用。图 5: 带 PCIE 扩展口的 4 显卡系统,看起一团乱,散热效率高。优雅解决功耗制问题在的 GPU 上设置一个功率限是可能的因此,你能够以编方式将 RTX 3090 的功率限制设为 300W,而不是其标准的 350W。在 4 个 GPU 系统中,相当于节了 200W,这可能刚好足够 1600W PSU 建立一个 4x RTX 3090 系统的可行性这还有助保持 GPU 的冷却。因此,置功率限可以同时决 4x RTX 3080 或 4x RTX 3090 设置的两个主问题,冷和电源。于 4 倍的设置,仍然需要效散热风的 GPU,但这解了电源的题。图 6:降低功限制有轻的冷却效。将 RTX 2080 Ti 的功率限降低 50-60W,温度略有降,风扇行更加安你可能会,「这不降低 GPU 的速度吗?」 是的,确实降,但问是降了多。我对图 5 所示的 4x RTX 2080 Ti 系统在不同功率限下进行了准测试。对推理过中 BERT Large 的 500 个小批次的间进行了准测试(包括 softmax 层)。选择 BERT Large 推理,对 GPU 的压力最大。图 7:在 RTX 2080 Ti 上,在给定的功率制下测得速度下降们可以看,设置功限制并不重影响性。将功率制在 50W,性能仅下降 7%。RTX 4090 接头起火题有一种解,认为 RTX 4090 电源线起火因为被弯过度了。际上只有 0.1% 的用户是个原因,要问题是缆没有正插入。因,如果你循以下安说明,使 RTX 4090 是完全安的。1. 如果你使旧的电缆旧的 GPU,确保触点没有碎 / 灰尘。2.使用电源连接,并将其入插座,到你听到嚓一声--这是最重的部分。3. 通过从左到右扭电源线来试是否合。电缆不该移动。4.目视检查与插座的触情况,缆和插座间无间隙H100 和 RTX40 中的 8 位浮点支持对 8 位浮点(FP8)的支持是 RTX 40 系列和 H100 GPU 的一个巨优势。有 8 位输入,它允你以两倍速度加载阵乘法的据,你可在缓存中储两倍的阵元素,在 Ada 和 Hopper 架构中,存是非常的,现在了 FP8 张量核心,你可以 RTX 4090 获得 0.66 PFLOPS 的计算量这比 2007 年世界上最快超级计算的全部算还要高。4 倍于 FP8 计算的 RTX 4090,可与 2010 年世界上最的超级计机相媲美可以看到最好的 8 位基线未能提供良的零点性。我开发方法 LLM.int8 () 可以进行 Int8 矩阵乘法结果与 16 位基线相同。但 Int8 已经被 RTX 30 / A100 / Ampere 这一代 GPU 所支持,为什么 FP8 在 RTX 40 中又是一个大升呢?FP8 数据类型比 Int8 数据类型要稳定多,而且容易在层范或非线函数中使,这在整数据类型是很难做的。这将它在训练推理中的用变得非简单明了我认为这使 FP8 的训练和推理在几月后变得对普遍。面你可以到这篇论中关于 Float vs Integer 数据类型的一个相主要结果我们可以到,逐个特,FP4 数据类型比 Int4 数据类型保留了多的信息从而提高 4 个任务的平均 LLM 零点准确性GPU 深度学习性排行先上张图来看 GPU 的原始性能行,看看最能打。们可以看 H100 GPU 的 8 位性能与针 16 位性能优化旧卡存在大差距。图显示的 GPU 的原始相性能,比对于 8 位推理,RTX 4090 的性能大约是 H100 SMX 的 0.33 倍。换句话说,与 RTX 4090 相比,H100 SMX 的 8 位推理速快三倍。于此数据他没有为 GPU 建模 8 位计算。为 8 位推理和训在 Ada / Hopper GPU 上更有效,张量内存速器 (TMA) 节省了大量存器,这寄存器在 8 位矩阵乘法中非精确。Ada / Hopper 也有 FP8 支持,这使得别是 8 位训练更有效,在 Hopper / Ada 上,8 位训练性能很可是 16 位训练性的 3-4 倍。对于旧 GPU,旧 GPU 的 Int8 推理性能则近 16 位推理性。每一美能买到多算力那么题来了,GPU 性能强可是我不起啊......针对预算不足的小伙,接下来图表是他据各个 GPU 的价格和性能计的每美性能排名Performance per Dollar),侧面反映了 GPU 性价比。选一个完成度学习任并且符合算的 GPU,可分为以下几个骤:首先定你需要大的 GPU 内存(至少 12GB 用于图像生成至少 24GB 用于处理变压);针对 8 位还是 16 位(8-bit or 16-bit),建议是能上 16 位就上,8 位在处理复编码任务还是会有难;根据图中的指,找到具最高相对能 / 成本的 GPU。我们可以看到,RTX4070Ti 对于 8 位和 16 位推理的本效益最,而 RTX3080 对于 16 位训练的成本效最高。虽这些 GPU 最具成本效益,他们的内也是个短,10GB 和 12GB 的内存可能无满足所有求。但对刚入坑深学习的新来说可能理想 GPU。其中一些 GPU 非常适合 Kaggle 竞赛,在 Kaggle 比赛中取好成绩,作方法比型大小更要,因此多较小的 GPU 非常适合。Kaggle 号称是全球最大的据科学家聚的平台高手云集同时对萌也很友好如果用作术研究和务器运营最佳 GPU 似乎是 A6000 Ada GPU。同时 H100 SXM 的性价比也很高内存大性强。个人验来说,果我要为司 / 学术实验室建一个小集群,我荐 66-80% 的 A6000 GPU 和 20-33% 的 H100 SXM GPU。综合推荐了这么多终于到了 GPU 安利环节。Tim Dettmers 专门制作了一个GPU 选购流程图,预算充就可以上高配置,算不足请考性价比选。这里先强调一:无论你哪款 GPU,首先要确保它的存能满足的需求。此,你要自己几个题:我要 GPU 做什么?拿来参加 Kaggle 比赛、学深度学、做 CV / NLP 研究还是玩小项?预算充的情况下可以查看面的基准试并选择合自己的佳 GPU。还可以过在 vast.ai 或 Lambda Cloud 中运行您的问题一时间来估所需的 GPU 内存,以便了它是否能足你的需。如果只偶尔需要个 GPU(每隔几持续几个时)并且需要下载处理大型据集,那 vast.ai 或 Lambda Cloud 也能很好地作。但是如果一个每天都使 GPU 且使用频很高(每 12 小时),云 GPU 通常不是一好的选择参考资料https://timdettmers.com/2023/01/16/which-gpu-for-deep-learning/#more-6https://timdettmers.com/本文来自微公众号:智元 (ID:AI_era),编辑:Joey David