开yun体育官网入口登录app"> 开yun体育官网入口登录app,这是一个为宠物爱好者打造的平台,提供全面的宠物护理知识、训练技巧以及宠物产品推荐。在这里,您可以与全球的宠物主人交流经验,分享爱宠的点滴生活。无论是初次养宠物,还是经验丰富的主人,您都能在这里找到有用的资源《开yun体育官网入口登录app》一款功能强大的小说阅读器软件,可以满足您的不同喜好。。️">
🍾第一步:🍭访问开yun体育官网入口登录app官方网站或可靠的软件下载平台:访问(http://bjssckj.cn/)确保您从官方网站或者其他可信的软件下载网站获取软件,这可以避免下载到恶意软件。
🍾第二步:🥇选择软件版本:根据您的操作系统(如Windows、Mac、Linux)选择合适的软件版本。有时候还需要根据系统的位数(32位或64位)来选择开yun体育官网入口登录app。
🍾第三步:⚓️下载开yun体育官网入口登录app软件:点击下载链接或按钮开始下载。根据您的浏览器设置,可能会询问您保存位置。
🍾第四步:💦检查并安装软件:
在安装前,您可以使用杀毒软件对下载的文件进行扫描,确保开yun体育官网入口登录app软件安全无恶意代码。
双击下载的安装文件开始安装过程。根据提示完成安装步骤,这可能包括接受许可协议、选择安装位置、配置安装选项等。
🍾第五步:⛩启动软件:安装完成后,通常会在桌面或开始菜单创建软件快捷方式,点击即可启动使用开yun体育官网入口登录app软件。
🍾第六步:🏔更新和激活(如果需要): 第一次启动开yun体育官网入口登录app软件时,可能需要联网激活或注册。
检查是否有可用的软件更新,以确保使用的是最新版本,这有助于修复已知的错误和提高软件性能。
🗼欢迎使用🔥【开yun体育官网入口登录app】🍾🍩️🍾支持:32/64bit🍾系统类型:开yun体育官网入口登录app(官方)官方网站IOS/Android通用版/手机APP(2024APP下载)创建于2005年,最初只是一个小型的体育资讯网站。经过多年的发展,如今已经成为了国内知名的体育赛事报道媒体。的创始人是一群热爱体育的年轻人,他们深知体育在人们生活中的重要性,希望通过,为更多的人传递体育的魅力。。
✈️恭喜发财🍼【开yun体育官网入口登录app】🍾🏺️🍾支持:16/32bit🍾系统类型:开yun体育官网入口登录app(中国)官方网站IOS/安卓通用版/APP下载(2024APP下载)平台汇聚了国内外最新、最全面的体育新闻资讯,包括赛事报道、赛程预告、球队动态、选手专访等,让你随时随地掌握最新的体育动态。。
🛸大吉大利🚨【开yun体育官网入口登录app】🍾🗺️🍾支持:32/64bit🍾系统类型:开yun体育官网入口登录app(中国)官方网站IOS/安卓通用版/APP下载(2024APP下载)平台还提供了多种社交互动功能,包括用户评论、点赞、分享等,用户可以通过这些功能与其他体育爱好者进行交流和互动,分享自己的观点和看法。。
🗼勇闯无限🎈【开yun体育官网入口登录app】🍾⛺️️🍾支持:32/64bit🍾系统类型:开yun体育官网入口登录app(中国)官方网站IOS/安卓通用版/手机app下载(2024APP下载)平台汇聚了国内外最新、最全面的体育新闻资讯,包括赛事报道、赛程预告、球队动态、选手专访等,让你随时随地掌握最新的体育动态。。
🏝网页认证🏝【开yun体育官网入口登录app】🍾🍝️🍾支持:32/64bit🍾系统类型:开yun体育官网入口登录app(官方)网站IOS/Android通用版/手机app下载(2024APP下载)未来,将继续坚持自己的特色,不断创新和进步。将会加强与各大体育联盟和俱乐部的合作,为广大体育爱好者提供更加丰富、全面的赛事报道。同时,也将会通过更多的渠道和方式,让更多的人了解体育,爱上体育。。
💰百度热搜🧀【开yun体育官网入口登录app】🍾⛴️🍾支持:32/64bit🍾系统类型:开yun体育官网入口登录app(官方)官方网站IOS/Android通用版/手机app下载(2024APP下载)彩网将持续优化平台,提供更加丰富的赛事内容和更加优质的用户体验。未来,还将加大对电竞等新兴赛事的支持,为用户带来更加多元化的娱乐选择。。
🧸2024百度百科🥇【开yun体育官网入口登录app】🍾🏠️🍾支持:32/64bit🍾系统类型:开yun体育官网入口登录app(官方)登录入口APP下载IOS/安卓通用版/手机APP下载(2024APP下载)的商业模式主要是广告收入和会员收入。通过广告投放、赞助合作等方式获得广告收入,同时也推出了会员服务,为用户提供更加个性化的服务,从而获得会员收入。。
【泰拉瑞亚哪个时装身后带白毛******
泰拉瑞亚,这款富有创意的沙盒游戏,以其独特的画风和丰富的游戏内容吸引了无数玩家。在游戏中,玩家可以探索、建设、战斗,同时还可以收集各种独特的时装来装扮自己的角色。其中,有一款带白毛的时装备受玩家们的喜爱和追捧。接下来,让我们来探讨一下这款泰拉瑞亚中的独特时装。
这款时装身的设计相当引人注目,以细腻的像素风格刻画出了丰富的细节和视觉效果。其最显著的特点就是身后那根长长的白毛,犹如一道洁白的羽翼,为角色增添了神秘而优雅的气质。白毛的质地和光泽度都经过精心设计,使得它在游戏中显得格外醒目和引人注目。
这款时装的来源并不简单,它需要通过一定的游戏任务或活动才能获得。这无疑增加了它的稀有性和吸引力,让玩家们为了得到它而努力挑战游戏中的各种难关。而一旦玩家成功获得这款时装,它就会成为他们在泰拉瑞亚世界中的独特标志,展示出他们的实力和个性。
从设计风格上来看,这款带白毛的时装与泰拉瑞亚的整体风格相得益彰。泰拉瑞亚的像素风格使得这款时装的线条和轮廓都显得非常清晰,给人一种非常独特的感觉。而白毛的加入则为其增添了一份神秘和优雅的气息,使得整个游戏世界都为之增色不少。
从时装的搭配角度来看,这款带白毛的时装也是非常值得尝试的。玩家可以尝试将它与其他时装、武器、饰品等进行搭配,以创造出独一无二的角色形象。无论是搭配其他像素风格的时装,还是与其他风格的物品进行混搭,都能产生出令人意想不到的效果。
此外,这款时装的背后故事也是其受欢迎的重要原因之一。在泰拉瑞亚的世界中,白毛被视为一种神秘的力量象征,它代表着纯洁、优雅和力量。因此,这款带白毛的时装也被赋予了特殊的含义和价值,成为了玩家们追求的目标。
对于喜欢泰拉瑞亚的玩家来说,这款带白毛的时装无疑是一种诱惑。它不仅外观独特、设计精良,还具有很高的稀有性和吸引力。在游戏中,拥有这款时装的玩家往往会成为众人瞩目的焦点,展示出他们的实力和个性。同时,它也是玩家们探索、挑战和创造的动力来源之一,让他们更加热爱这款游戏。
除了外观上的吸引力外,这款带白毛的时装还体现了泰拉瑞亚的价值观和文化内涵。它不仅是一种游戏道具,更是一种文化符号和精神象征。它代表着玩家的勇气、智慧和创造力,也体现了泰拉瑞亚世界的多样性和包容性。
总的来说,这款带白毛的时装是泰拉瑞亚中一款非常独特和受欢迎的时装。它的外观独特、设计精良、稀有度高、搭配性强等特点都让它成为了玩家们追求的目标。同时,它也体现了泰拉瑞亚的价值观和文化内涵,成为了游戏世界中的一种文化符号和精神象征。无论是从哪个角度来看,这款时装都是泰拉瑞亚中不可忽视的存在。
】【AI大模型时代:多元算力如何打破碎片化困局?******
21世纪经济报道记者白杨 北京报道
2024年,当大模型迈入新的发展阶段,AI全领域迎来更为迅猛的量变积累。
一方面,模型已突破模态的隔离,文本、语音、视觉等多种形式得以丰富结合,极大地增强了模态的多样性;另一方面,大模型的应用落地领域得到广泛拓展,企业对算力的需求持续增加,对算力的依赖性显著提升。
目前,业内的共识是,大模型的Scaling Law依旧有效,因此产业界对大模型能力的追求必将导致对大算力需求的持续增加。更重要的是,随着AI大模型在企业应用中的深度嵌入,算力不仅仅是技术基础设施,更成为影响企业竞争力的重要因素。
从算力层面看,行业目前仍呈现出“需求大、能耗高、效率低”的发展态势。以2020年发布的GPT-3与最新发布的LLaMA3-405B进行对比为例,尽管模型规模仅增大2.3倍,但所需算力却增长了116倍。
这种指数级的算力消耗增长,使得传统的单一算力架构已经难以为继,行业亟需更加高效、多元的算力解决方案。
因此,算法的创新将驱动算力需求的持续高增长,同时,算法结构的创新也带来了MoE(混合专家模型)、模型量化、定制算子等更加复杂的计算需求。这不仅对企业的技术积累提出了更高的要求,也对整个算力生态的协同发展形成了巨大挑战。
在此背景下,构建一个多元化的算力系统生态显得尤为重要。
12月25日下午,浪潮信息与智源研究院达成战略合作协议,双方将共建大模型多元算力开源创新生态,提升大模型创新研发的算力效率,降低大模型应用开发的算力门槛。
这次合作不仅是技术层面的互补,更是产业生态的一次重要整合。目前,智源的开源大模型通用算子库FlagGems已接入浪潮信息的元脑企智EPAI企业大模型开发平台,可帮助企业实现多元算力的适配与使用。
事实上,许多企业都已意识到多元多模的重要性,但是,由于不同硬件架构、指令集的差异以及算子库的独立实现,整个生态系统往往处于碎片化状态,难以形成合力,这种割裂的生态现状不仅抬高了大模型应用的技术门槛,也让企业在实际部署中面临重重困难。
尤其对于那些技术力量薄弱的传统企业用户来说,不仅在多元的芯片、模型中难以选择,而且即使部署成功,也存在软件框架多、易用性差等问题。这种局面导致企业在后期开发和使用中举步维艰。
而此次合作,通过将智源的开源大模型通用算子库FlagGems与浪潮信息的元脑企智EPAI企业大模型开发平台进行深度融合,让大模型应用开发能够使用跨硬件、多框架兼容的算子集合,进而满足了企业多种开发框架的需求,真正实现了大模型在跨算力平台上的无缝开发与迁移。
资料显示,FlagGems于今年6月推出,截至12月,已提供超过130个大模型算子,是目前提供算子数量最多、覆盖广度最大的开源算子库。现在,借助元脑企智EPAI大模型开发平台,企业不仅能够在多种算力平台上进行高效的AI算法开发,还能够灵活应对不同硬件架构带来的技术差异。
浪潮信息高级副总裁刘军向21世纪经济报道记者表示,“在多元多模的产业格局下,AI的产业化落地本质上就是推动人工智能与百行千业的深度融合。过去,硬件架构、指令集的差异及算子库的独立实现,让算力产业形成了生态藩篱,这次合作的目的就是要化解这些高门槛问题,为AI应用创新注入更强大、多元的算力支持”。
此外,开源开放是创新活力的源泉。未来,随着更多企业与开发者的加入,大模型多元算力生态有望逐渐成熟,并成为推动AI技术全面落地的关键引擎。
】【数据中心芯片需求放缓怎么办?英伟达供应商:AI手机将接力******
来源:华尔街见闻
在全球数据中心投资有放缓可能性的背景下,半导体行业面临新挑战。然而,周四英伟达供应商、全球芯片测试设备“龙头”Advantest CEO指出,AI智能手机的需求被看作是行业的新增长点,有望助力行业避免陷入衰退。目前AI手机需求不大,一些分析师预计现有的AI功能或许不足以刺激消费者大规模换机。
在当前全球数据中心投资可能出现放缓的背景下,半导体行业正面临新的挑战。
然而,英伟达供应商、全球芯片测试设备龙头Advantest的首席执行官Doug Lefever12月26日表示,AI智能手机的需求有可能为半导体行业带来新的增长点,助力行业避免陷入“恶性”衰退。
Lefever指出,尽管大型科技公司如Meta、谷歌和微软在AI领域的投入保持强劲,但他们对数据中心的投资可能会出现放缓的迹象。这种放缓虽然不会持续太久,但由于超大规模数据中心的市场集中度较高,任何放缓都可能对半导体供应链造成重大影响。Lefever强调,尽管不愿使用“泡沫”一词,但周期性波动可能会加剧,如果下一个周期来临,可能会相当严峻。
尽管数据中心投资面临不确定性,Lefever对AI智能手机的前景持乐观态度。他认为,尽管AI智能手机的需求目前“有点缓慢”,但有可能在未来迅速起飞。他解释道:
“现在大家都在屏息以待,等待AI手机的杀手级应用出现。如果这类应用诞生,用户开始大规模更换手机,市场将会迎来疯狂的增长。”
目前AI手机需求不大
AI手机的竞争已经在全球范围内展开。周三,三星推出了三款搭载AI功能的新手机:S24、S24 Plus和S24 Ultra。这些手机配备了一系列AI功能,包括实时电话翻译,语音录音转录,视频搜索,照片编辑。这些新机型在美国的售价在800美元到1300美元之间。三星在AI智能手机领域进行大胆尝试,旨在重新激活智能手机市场并与苹果展开差异化竞争。
除三星外,谷歌也在为其Pixel系列开发本地AI技术,国内厂商如荣耀、OPPO和小米也在积极推出搭载AI技术的智能手机。根据市场研究机构Canalys的预测,AI功能将成为未来智能手机的重要卖点,今年5%的智能手机出货量将具备AI功能,到2027年将达到6.35亿部,占智能手机市场总量的45%。
尽管AI手机引发了业界热议,但一些分析师对AI功能能否推动大规模换机持谨慎态度。一些分析师指出,大多数智能手机已经包含了某些AI功能,三星新推出的功能可能不足以推动大规模的换机潮。
大信证券分析师Park Kang-ho认为,现有的AI功能或许不足以刺激消费者大规模更换手机。然而,如果AI手机能够与其他智能设备(如汽车、家电、电脑等)实现更深入的互联互通,可能会引发更广泛的IT设备需求,从而推动整体市场增长。
Advantest受益于半导体需求激增
公开资料显示,Advantest总部位于日本东京,是全球领先的半导体测试设备制造商之一,尤其在为英伟达等公司提供高端图形处理单元(GPU)测试设备方面发挥着关键作用。随着半导体技术的不断进步,对测试设备的需求也随之激增。Lefever强调,随着芯片变得越来越复杂和昂贵,市场对其服务的需求也呈爆炸式增长。
近年来,Advantest的表现亮眼,其股价在过去一年上涨超过80%,五年期间更是增长了约500%。这一显著涨幅反映出市场对该公司在半导体测试领域主导地位的高度认可。
尽管日本自1980年代以来失去了全球芯片生产的领先地位,但Advantest等日本半导体测试设备和材料制造商依然在全球半导体供应链中占据着关键地位。虽然这些公司处于相对专业化的利基市场,但它们的产品和服务对于全球半导体产业链的顺畅运转至关重要。
Lefever指出,现代先进芯片的生产过程中,每颗芯片需要进行多次测试,通常在从晶圆切割到成品组装的过程中,至少需要进行10到20次测试。五年前,这一数字通常仅为个位数。这一趋势凸显了芯片质量控制的日益重要性,并推动了对测试设备需求的激增。
此外,测试时间的延长也是推动业绩增长的重要因素。例如,英伟达最新的Blackwell产品的测试时间比上一代产品长了3到4倍。这种变化表明,芯片在设计和生产过程中变得愈加复杂,需要更长时间进行精密测试。
受益于半导体需求的激增,Advantest在2024财年的业绩展望也出现了大幅上调。公司预计,2024财年净利润将增长16%,达到1220亿日元(约合7.92亿美元)。Lefever表示:“我们对未来的需求充满信心,特别是在AI相关领域,随着技术的不断突破,半导体测试设备市场将继续增长。”
风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
】【散户最爱!AI巨头英伟达今年“吸金”近300亿美元******
明年谁会登顶?
根据财经数据供应商Vanda Researc的最新统计,英伟达取代特斯拉成为今年散户净买入量最大的股票,这也意味着单只股票的净买盘连续第二年超过标普500指数ETF,反映出投资者仍在追逐科技股牛市。在人工智能发展浪潮推动下,2025年这样的趋势能否持续下去,谁将脱颖而出?
买盘三年增长9倍
与传统的指数基金热门代表标普500指数ETF相比,今年英伟达的净流入量几乎翻了一番,达到了298亿美元,这相当于2021年的近9倍。Vanda高级副总裁亚奇尼(Marco Iachini)表示:“事实证明,英伟达在某种程度上抢了特斯拉的风头,因为它的价格涨幅令人印象深刻。 ”
随着在人工智能领域应用不断获得突破,英伟达2024年累计涨幅超过180%,市值跨越了3万亿美元里程碑,并一度短时间超过苹果,成为了全球市值最大公司。
股价上涨的背后,普通投资者的持股发挥了更大的作用。Vanda的数据显示,英伟达在典型的家庭(mom-and-pop trader)投资组合中的权重超过10%,高于2024年初的5.5%。公司现在是普通散户投资者的第二大持股,略微落后于特斯拉。
投资银行D.A.Davidson技术研究主管卢利亚(Gil Luria)表示:“就散户投资者成为股东重要组成部分而言,英伟达确实算得上脱颖而出。上升幅度惊人。”
晨星股票策略师科尔略(Brian Colello)表示,英伟达的股价波动性“相当大”,这凸显了散户在推动股价方面可以发挥的作用。“如此大的公司在任何一天股价都会出现如此大的波动,有时令人瞠目结舌。”
财报关注度上升
随着市值持续飙升,英伟达已经超越苹果,成为了华尔街财报季的最大焦点。第一财经记者汇总发现,机构对今年业绩公布前的市值波动预测中值普遍在5%以上,这在明星科技股中并不多见,反映了市场的超高人气。
英伟达在人工智能技术领域处于领先地位,图像处理单元GPU是相关应用的支柱,公司首席执行官黄仁勋多次表示,英伟达的下一代旗舰人工智能芯片Blackwell已经投入生产,严重供不应求。英伟达的技术创新涵盖了从医疗保健到自动驾驶汽车的各个领域。不少机构认为,随着越来越多的行业开始利用其突破性技术,英伟达在科技生态系统中的作用将不断扩大和巩固。
不过,与一些竞争对手相比,英伟达的估值水平的优势正在缩减。本月13日,博通成为第九家市值突破1万亿美元的美国上市公司。公司预测,2027年市场对定制款AI芯片ASIC的需求规模为600亿至900亿美元。
根据伦交所(LSEG)汇编的数据,博通12个月远期市盈率为29.8倍,低于英伟达的31.03倍。资管公司Great Hill Capital董事长海耶斯(Thomas Hayes)表示:“随着人工智能从训练模型转向推理,越来越多的芯片公司将追赶英伟达。博通是煤矿中的金丝雀。”
卢利亚表示,尽管英伟达的盈利继续超出华尔街的预期,但仍不足以继续保持股价的快速增长。现在,该股已经达到了更“平衡”和“合理”的水平。
展望未来,一家软件厂商可能脱颖而出。亚奇尼表示,专注于大数据分析的软件公司Palantir四季度在零售市场获得了关注,并有望成为新年的热门选择。
Palantir今年也迎来了爆发式发展,通过着眼于AI+的数据,核心竞争力在于其本体论引擎(Ontology Engine)和高度定制化的能力。公司被纳入纳斯达克和标普500指数,股价累计上涨近380%,成为表现最好的标普成分股。在Vanda的榜单中,Palantir的买入量高居第九,高于亚马逊、谷歌和微软等行业巨头。
值得一提的是,Palantir首席执行官卡普(Alex Karp)在上周末发布的一段视频中感谢了散户投资者, “非常感谢你们所有个人投资者,有勇气超越传统、生锈、僵化的(市场)陈词滥调。”
】【刷屏的DeepSeek******
每经记者 郑雨航 每经编辑 高涵 兰素英
“DeepSeek-V3超越了迄今为止所有开源模型。”这是国外独立评测机构Artificial Analysis测试了DeepSeek-V3后得出的结论。
12月26日,深度求索官方微信公众号推文称,旗下全新系列模型DeepSeek-V3首个版本上线并同步开源。
公众号推文是这样描述的:DeepSeek-V3为自研MoE模型,671B参数,激活37B,在14.8T token上进行了预训练。DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。
不过,广发证券发布的测试结果显示,DeepSeek-V3总体能力与其他大模型相当,但在逻辑推理和代码生成领域具有自身特点。
更重要的是,深度求索使用英伟达H800 GPU在短短两个月内就训练出了DeepSeek-V3,仅花费了约558万美元。其训练费用相比GPT-4等大模型要少得多,据外媒估计,Meta的大模型Llama-3.1的训练投资超过了5亿美元。
消息一出,引发了海外AI圈热议。OpenAI创始成员Karpathy甚至对此称赞道:“DeepSeek-V3让在有限算力预算上进行模型预训练这件事变得容易。DeepSeek-V3看起来比Llama-3-405B更强,训练消耗的算力却仅为后者的1/11。”
然而,在使用过程中,《每日经济新闻》记者发现,DeepSeek-V3竟然声称自己是ChatGPT。一时间,“DeepSeek-V3是否在使用ChatGPT输出内容进行训练”的质疑声四起。
对此,《每日经济新闻》记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich,他表示对全新的DeepSeek模型的细节还了解不够,无法给出确切的答案。“但从普遍情况来说,几乎所有的大模型都主要基于公开数据进行训练,因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据(例如,专注于高质量来源的数据)来取得改进。”
每经记者向深度求索公司发出采访请求,截至发稿,尚未收到回复。
针对DeepSeek-V3,独立评测网站Artificial Anlaysis就关键指标——包括质量、价格、性能(每秒生成的Token数以及首个Token生成时间)、上下文窗口等多方面——与其他人工智能模型进行对比,最终得出以下结论。
质量:DeepSeek-V3质量高于平均水平,各项评估得出的质量指数为80。
价格:DeepSeek-V3比平均价格更便宜,每100万个Token的价格为0.48美元。其中,输入Token价格为每100万个Token 0.27美元,输出Token价格为每100万个Token1.10 美元。
速度:DeepSeek-V3比平均速度慢,其输出速度为每秒87.5个Token。
延迟:DeepSeek-V3与平均水平相比延迟更高,接收首个Token(即首字响应时间)需要1.14秒。
上下文窗口:DeepSeek-V3的上下文窗口比平均水平小,其上下文窗口为13万个Token。
最终Artificial Anlaysis得出结论:
“DeepSeek-V3模型超越了迄今为止发布的所有开放权重模型,并且击败了OpenAI的GPT-4o(8月),并接近Anthropic的Claude 3.5 Sonnet(10月)。
DeepSeek-V3的人工智能分析质量指数得分为80,领先于OpenAI的GPT-4o和Meta的Llama 3.3 70B等模型。目前唯一仍然领先于DeepSeek的模型是谷歌的Gemini 2.0 Flash和OpenAI的o1系列模型。领先于阿里巴巴的Qwen2.5 72B,DeepSeek现在是中国的AI领先者。”
12月29日广发证券计算机行业分析师发布研报称:“为了深入探索DeepSeek-V3的能力,我们采用了覆盖逻辑、数学、代码、文本等领域的多个问题对模型进行测试,将其生成结果与豆包、Kimi以及通义千问大模型生成的结果进行比较。”
测试结果显示,DeepSeek-V3总体能力与其他大模型相当,但在逻辑推理和代码生成领域具有自身特点。例如,在密文解码任务中,DeepSeek-V3是唯一给出正确答案的大模型;而在代码生成的任务中,DeepSeek-V3给出的代码注释、算法原理解释以及开发流程的指引是最为全面的。在文本生成和数学计算能力方面,DeepSeek-V3并未展现出明显优于其他大模型之处。
除了能力,DeepSeek-V3最让业内惊讶的是它的低价格和低成本。
《每日经济新闻》记者注意到,亚马逊Claude 3.5 Sonnet模型的API价格为每百万输入tokens 3美元、输出15美元。也就是说,即便是不按照优惠价格,DeepSeek-V3的使用费用也几乎是Claude 3.5 Sonnet的五十三分之一。
相对低廉的价格,得益于DeepSeek-V3的训练成本控制,深度求索在短短两个月内使用英伟达H800 GPU数据中心就训练出了DeepSeek-V3模型,花费了约558万美元。其训练费用相比OpenAI的GPT-4等目前全球主流的大模型要少得多,据外媒估计,Meta的大模型Llama-3.1的训练投资超过了5亿美元。
DeepSeek“AI界拼多多”也由此得名。
DeepSeek-V3通过数据与算法层面的优化,大幅提升算力利用效率,实现了协同效应。在大规模MoE模型的训练中,DeepSeek-V3采用了高效的负载均衡策略、FP8混合精度训练框架以及通信优化等一系列优化措施,显著降低了训练成本,以及通过优化MoE专家调度、引入冗余专家策略、以及通过长上下文蒸馏提升推理性能。这证明,模型效果不仅依赖于算力投入,即使在硬件资源有限的情况下,依托数据与算法层面的优化创新,仍然可以高效利用算力,实现较好的模型效果。
广发证券分析称,DeepSeek-V3算力成本降低的原因有两点。
第一,DeepSeek-V3采用的DeepSeekMoE是通过参考了各类训练方法后优化得到的,避开了行业内AI大模型训练过程中的各类问题。
第二,DeepSeek-V3采用的MLA架构可以降低推理过程中的kv缓存开销,其训练方法在特定方向的选择也使得其算力成本有所降低。
科技媒体Maginative的创始人兼主编Chris McKay对此评论称,对于人工智能行业来说,DeepSeek-V3代表了一种潜在的范式转变,即大型语言模型的开发方式。这一成就表明,通过巧妙的工程和高效的训练方法,可能无需以前认为必需的庞大计算资源,就能实现人工智能的前沿能力。
他还表示,DeepSeek-V3的成功可能会促使人们重新评估人工智能模型开发的既定方法。随着开源模型与闭源模型之间的差距不断缩小,公司可能需要在一个竞争日益激烈的市场中重新评估他们的策略和价值主张。
不过,广发证券分析师认为,算力依然是推动大模型发展的核心驱动力。DeepSeek-V3的技术路线得到充分验证后,有望驱动相关AI应用的快速发展,应用推理驱动算力需求增长的因素也有望得到增强。尤其在实际应用中,推理过程涉及到对大量实时数据的快速处理和决策,仍然需要强大的算力支持。
在DeepSeek-V3刷屏之际,有一个bug也引发热议。
在试用DeepSeek-V3过程中,《每日经济新闻》记者在对话框中询问“你是什么模型”时,它给出了一个令人诧异的回答:“我是一个名为ChatGPT的AI语言模型,由OpenAl开发。”此外,它还补充说明,该模型是“基于GPT-4架构”。
国内外很多用户也都反映了这一现象。而且,12月27日,Sam Altman发了一个帖文,外媒指出,Altman这篇推文意在暗讽其竞争对手对OpenAI数据的挖掘。
于是,有人就开始质疑:DeepSeek-V3是否是在ChatGPT的输出基础上训练的?为此,《每日经济新闻》向深度求索发出采访请求。截至发稿,尚未收到回复。
针对这种情况产生的原因,每经记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich,他表示,他对全新的DeepSeek模型的细节还了解不够,无法给出确切的答案。“但从普遍情况来说,几乎所有的大模型都主要基于公开数据进行训练,因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据(例如,专注于高质量来源的数据)来取得了改进。”
TechCrunch则猜测称,深度求索可能用了包含GPT-4通过ChatGPT生成的文本的公共数据集。“如果DeepSeek-V3是用这些数据进行训练的,那么该模型可能已经记住了GPT-4的一些输出,现在正在逐字反刍它们。”
“显然,该模型(DeepSeek-V3)可能在某些时候看到了ChatGPT的原始反应,但目前尚不清楚从哪里看到的,”伦敦国王学院专门研究人工智能的研究员Mike Cook也指出,“这也可能是个‘意外’。”他进一步解释称,根据竞争对手AI系统输出训练模型的做法可能对模型质量产生“非常糟糕”的影响,因为它可能导致幻觉和误导性答案。
不过,DeepSeek-V3也并非是第一个错误识别自己的模型,谷歌的Gemini等有时也会声称是竞争模型。例如,Gemini在普通话提示下称自己是百度的文心一言聊天机器人。
造成这种情况的原因可能在于,AI公司在互联网上获取大量训练数据,但是,现如今的互联网本就充斥着各种各样用AI生产出来的数据。据外媒估计,到2026年,90%的互联网数据将由AI生成。这种 “污染” 使得从训练数据集中彻底过滤AI输出变得相当困难。
“互联网数据现在充斥着AI输出,”非营利组织AI Now Institute的首席AI科学家Khlaaf表示,基于此,如果DeepSeek部分使用了OpenAI模型进行提炼数据,也不足为奇。
】顾云溪 | 2025-01-17 |
细节处理上还是差很多,小齐哥演技没话说,从当年《大事件》中就能看出来,希望老大以后多挑挑好剧本 |
那庄雅 | 2025-01-17 |
林间伞下 : 加一, |
旗之桃 | 2025-01-17 |
功夫熊猫,很好看的一步影片,推荐更多人来观看,影迷们有口福了,嘻嘻嘻嘻嘻嘻,欢迎强势围观 |
杞才艺 | 2025-01-17 |
家园 |
慕容翎 | 2025-01-17 |
手机用户61107943 : 爆裂魔女至少音乐很好,这游戏是一无是处。 |
拜沛萍 | 2025-01-17 |
超级棒 |
剧红豆 | 2025-01-17 |
Chido。 |
揭忆雪 | 2025-01-17 |
它有很多广告,不让你玩🥹 |
滕文漪 | 2025-01-17 |
可以和刘德华,古天乐组成寻子三人组,说不定路上你们还可以聚个餐,还有这部拍的很好,求求你别拍第二部了 |
皮志泽 | 2025-01-17 |
相比多年前看他的第一部皇家赌场!时间过的太快!转眼到现在的收官作!打斗戏少了好多!和九龙冰室一样圆满结局!谢幕了!致敬! |