logo

漫谈数字中国、信创、GPT


x1
蚂蚁搬家 2023-04-26 14:04:01 17630
分类专栏: 资讯 话题: AI大模型

关于数字中国

2023年2月27日,中共中央、国务院印发了《数字中国建设整体布局规划》(以下简称《规划》),并发出通知,要求各地区各部门结合实际认真贯彻落实中共中央 国务院印发《数字中国建设整体布局规划》,数字中国建设按照“2522”的整体框架进行布局,即夯实数字基础设施和数据资源体系“两大基础”,推进数字技术与经济、政治、文化、社会、生态文明建设“五位一体”深度融合,强化数字技术创新体系和数字安全屏障“两大能力”
数据要素相关政策早在2019年就开始探索,而本次数字中国建设整体布局规划是数据要素市场的顶层设计,之前在微观层面有金融信息化、工业信息化、医疗信息化、数据乡村等行业规划,但缺乏国家层面的统筹规划,而本次数字中国规划把各个行业和数字化相关的工作给统筹起来了
对本次数据中国政策推出意义的认知,可能是最重要的,规划的出台可能是从土地财政到数据财政的起点,意义深远。
过去二十年,土地财政保证了经济建设,城镇化和工业化的顺利进行。土地财政始于分税制改革,分税制减少了地方政府可支配的财政资源。虽然中央转移支付和税收返还可以填补预算内收支缺口,但发展经济所需的额外支出需要另筹资金。地方增加预算外收入,其中最重要的就是围绕土地出让和开发所产生的土地财政。土地财政的核心逻辑是,土地要素被重估,土地要素市场直接成就了土地财政
2002年,国土部明确四类经营用地(商业、旅游、娱乐、房地产)采用“招拍挂”制度。于是各地政府开始大量征收农民土地然后有偿转让,土地财政开始膨胀。土地出让收入从2001年开始激增,2003年就已经达到了地方公共预算收入的55%。2008年全球金融危机之后,在财政和信贷政策的共同刺激之下,土地转让收入再上一个台阶,2010年达到地方公共预算收入的68%
图片
而数据要素方面,国家的数据存量中60%是政务数据和公共数据,包括政府的数据,水电、天然气、煤气管道、交通医疗数据等,企业数据只有38%左右,其中央国企占比不小,剩下的1~2%是个人数据。政府不仅拥有巨大的原始数据资源,也具有采集大量数据的权利。政府作为最大的数据所有者,是不可或缺的参与者主导数据要素市场化是必然的。
土地财政作为一个历史阶段的产物,也将随着经济结构发展进入新的阶段而逐步由主导地位退居次要的、从属的地位。数据要素是潜在的重要财政收入来源之一。

数据要素市场催生的投资机会

规划里面明确提了“2522”的架构,数字基础设施和数据资源体是“两大基础”
首先看数字基础设施(信创),这个比较好理解,结合原文中的“推动数字技术和实体经济深度融合,在农业、工业、金融、教育、医疗、交通、能源等重点领域,加快数字技术创新应用”,即八大行业信创,意味着自主可控加速推进,行业信创在2027年前全面实现并非空穴来风,对于信创我们相对比较熟悉,本次政策对信创的影响就是,操作系统、软硬件、芯片各个环节全面替代加速,本轮应该是招投标加速,业绩兑现的一轮周期
图片
其次就是数字资源体,也就是数据要素市场化,是指以数据资源化为起点,经历数据资产化、数据资本化阶段,实现数据价值化的经济过程,是全新的市场,0-1。其中比较关注数据交易环节,《数据二十条》提出探索“建立数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制”,淡化数据所有权,强调数据的流通、使用与价值最大化,形成“三权分置”的中国特色数据产权制度。
收益分配:初次分配适当向价值创造者倾斜,市场主导以贡献度为分配标准,《数据二十条》提出“谁投入、谁贡献、谁受益”原则,保护各参与方投入产出收益。
云基建主力军是三大运营商+中电子+中电科,高进入壁垒下通过基础设施建设获取未来的数据运营权,再与地方政府进行分成,像深桑达和易华录可以在干瘪的传统业务基础上可以讲一个很宏大的故事,随着国家大数据局的成立,后续相关政策法规也会陆续出台,对数字要素板块的催化不断,数据要素市场化的路径,利益的分配也会逐渐清晰
GPT
GPT供给端的决定因素在于模型、数据、算力,ChatGPT 需要大量的算力(芯片)来支持其训练和部署,为支撑 ChatGPT 的算力需求,高性能的 GPU 是必需。训练成本方面,根据 OneFlow 的估算,GPT-3 训练一次的成本约为139.8 万美元;对于一些更大的 LLM(大型语言模型),训练成本在 200 万美元以上。简而言之就是大力出奇迹。
图片
那么未来算力的需求涉及到几个问题,大模型的参数规模、大模型的数量
从 2018 年到 2022 年,模型参数量增加了 5000 倍,GPT3的参数是1750亿,但是GPT4融合了图像功能,但是它的参数规模没有公布,但大概只有一个数量级的差距。很多卖方讲未来2年会有100Trillion参数的模型推出,但硬件的升级是线性的,H100和A100training是4倍的提升,那么参数量是难以支持百倍提升的,当前最大语言模型的规模可能是GPT3的3-4倍,进一步考虑训练方式的优化,可能模型变大了3-4倍,但是需要的算力芯片可能只增加1.5-3倍
图片
算力需求主要分为两部分,包括训练算力和推理算力。
目前来说对训练算力需求非常高,ChatGPT的公开数据显示训练算力消耗达到了3640PF-days(即假如每秒计算一千万亿次,需要计算3640天),换算成英伟达A100芯片,单卡算力相当于0.6P的算力,理想情况下总共需要大概6000张,在考虑互联损失的情况下,需要一万张A100作为算力基础(目前很多观点认为一万张是入局的门槛)。在A100芯片10万人民币/张的情况下,算力的硬件投资规模达到10亿人民币。
不完全统计500亿参数以上的模型正在训练的加起来30-40个,如果假设每一个模型需要8000片H100和2万片的A100,对应的需求应该是60-80万张A100,或者24-32万张H100。也就是说未来1-2年内的订单大概就有600-80亿人民币(虽然都是英伟达的),推理算力需求增速预计会随着AI生态的逐步建立高于训练,由此前三七开到七三开。
根据Verified Market Research数据,2020年,全球GPU市场规模为254.1亿美元。随着需求的不断增长,预计到2028年,这一数据将达到2465.1亿美元,年复合增长率为32.82%。潮水来临时,往往都会低估需求,乐观点拍脑袋,也许可以上调到40%+
图片
比起难以估计的需求,供给的研究会更有意义。如上图所示,行业格局其实蛮清晰的
至于国内AI芯片方面,一梯队,有成熟产品、批量出货的企业,包括寒武纪、华为海思、百度昆仑芯、燧原科技等;二梯队,以AI芯片起家的壁仞科技、天数智心、摩尔线程、沐曦等;三梯队,如海光、景嘉微等,已经批量生产的产品,大多都是A100的上一代;各公司正在研发的相关产品,如昆仑芯三代、思远590、燧思3.0等,都是对标A100,但由于“实体清单”的限制以及研发水平的原因,都还没有推到市场。
但···做人要有梦想,不然和咸鱼有什么区别
除了芯片之外,硬件方面可能需要更多层的PCB板,更强劲的散热解决方案,更精细的电源管理
 
至于AIGC,海外方面已经跑出来很多应用,办公领域的copilot、电商领域的shopify、图像创作领域的Stable Diffusion、Midjourney、金融领域的BloombergGPT,总体分为有优质应用落地场景的C端,以及有垂直领域数据积累的B端,投资上理性的看还是底层模型能力更强,掌握流量的巨头们更容易胜出,当然炒股票的话,标的的选择上可以更有想象力一些?
可以预见的是GPT的应用会对人类的工作、生活乃至社会产生巨大的影响,解放生产力提效的同时很多岗位也会很快被GPT摧毁,更长期的视角看对于人类个体的影响似乎难以评估,本质上GPT是在利用极其丰富的互联网数据资源不断的训练、学习,是对存量知识的归集,但没有创造。未来可能人人都有一个私有GPT,它会告诉我们它所知的一切,但省略掉的是形成认知、培养创造性思维的过程,影响的不仅仅是音乐绘画文学等强调原创性的艺术领域,工业、科技行业需要的创新同样需要创造性思维,而GPT也许会让绝大多数人都变得没什么区别,依赖AI就好了。
最后说下投资上的一点点思考
1.数字要素市场化这一块是全新的机会,尤其是涉及到数字交易的环节,可能会有超级成长股(虽然是融资扩表弱现金流的成长)
2.信创会加速推进,相比过去发生变化的点在于业绩确定性大幅提升,而党政军+八大行业信创的空间市场认知是充分的,只有拔估值的逻辑相对来说就不是那么吸引人
3.如果说现在是AI的iPhone时刻,回顾下iPhone 发布后的投资史,好像也不着急现在就下重注?
假装在研究的小李 Alass 2023-04-14 08:30 发表于上海

网站声明:如果转载,请联系本站管理员。否则一切后果自行承担。

本文链接:http://www.xckfsq.com/news/show.html?id=20702
赞同 0
评论 0 条
蚂蚁搬家
粉丝 11 发表 355 + 关注 私信
上周热门
人工智能赋能视频指挥 | 兴图新科携新品亮相北京军博会  4102
向新 共未来丨诚邀您参与2024中兴通讯创兴日  4046
诺基亚Lumia,重生  3870
第二届BCS企业数字化转型及数据安全专题研讨会在成都举行  3740
“移启”向前 共筑安全长城——重庆移动走进启明星辰专项活动成功举办  3736
国标16260中软件可移植性的子特性  3663
数据库管理系统中的模式与映像  3590
软件设计之耦合  3572
类似大蚂蚁即时通讯软件推荐  3538
2024苏州(高新区)信息技术应用创新交流及供需对接会顺利召开!  3510
本周热议
我的信创开放社区兼职赚钱历程 40
今天你签到了吗? 27
如何玩转信创开放社区—从小白进阶到专家 15
信创开放社区邀请他人注册的具体步骤如下 15
方德桌面操作系统 14
用抖音玩法闯信创开放社区——用平台宣传企业产品服务 13
我有15积分有什么用? 13
如何让你先人一步获得悬赏问题信息?(创作者必看) 12
2024中国信创产业发展大会暨中国信息科技创新与应用博览会 9
中央国家机关政府采购中心:应当将CPU、操作系统符合安全可靠测评要求纳入采购需求 8