国家数据局局长刘烈宏在中国发展高层论坛2026年年会上宣布,我国人工智能领域核心计量单位"Token"的官方中文译名为"词元"。这一术语不仅承载着智能时代的价值基准功能,更成为连接技术突破与商业落地的关键纽带,为量化评估人工智能应用价值提供了标准化尺度。
作为人工智能系统的信息处理基石,词元扮演着数字世界的"原子"角色。无论是用户输入的自然语言指令,还是系统生成的复杂代码,都需要经过词元化拆解才能被模型识别运算。数据显示,我国日均词元调用量已从2024年初的1000亿次激增至2025年3月的140万亿次,三个月内实现40%的跨越式增长,较年初水平更是实现千倍跃升。
这种指数级增长直接反映在商业价值创造上。某头部模型企业自2025年1月底以来,仅用20天就达成全年营收目标,印证了以词元计费为核心的新型商业模式正在重塑产业生态。刘烈宏特别指出,词元出口业务的蓬勃发展,标志着中国人工智能技术开始具备全球竞争力。
在数据基础设施建设领域,我国同样取得突破性进展。截至2025年底,全国累计建成10万余个高质量数据集,总存储容量突破890PB,相当于中国国家图书馆数字资源总量的310倍。这些经过严格清洗标注的数据资产,为人工智能模型训练提供了优质"燃料",推动行业从规模扩张转向质量提升。
当前人工智能应用正从简单的对话交互向复杂决策系统演进,这对词元处理能力提出更高要求。刘烈宏表示,随着多模态大模型和智能体技术的突破,词元调用量将持续攀升,带动整个产业链的价值重构。我国在数据要素市场建设方面的先行探索,为全球人工智能治理提供了重要参考。











