人心向背网人心向背网

天津国家超级计算中心发布了生成人工智能“天河天元大模型”

科技日报记者 陈曦 实习生 龚晓薇。天津天河天元

5月19日,超级在第七届世界智能大会上,计算国家超级计算天津中心正式发布,中心智打造“天河E级智能计算开放创新平台”

计算能力是发布人工智能发展的核心驱动力。

大模型从自然语言处理领域开始,生成谷歌的人工BERT、以OpenAIGPT和百度文心大模型为代表,大模参数规模逐步提升到1000亿元和1000亿元。天津天河天元训练中使用的超级数据量级也显著提高,这带来了模型能力的计算提高,也代表了计算能力消耗的中心智指数级增长。

超级计算可以说是发布计算能力的战斗机,单个计算能力最强,生成因为超级计算作为系统工程,人工超级大脑,每一代超级计算完成数据交换能力升级,系统级软件升级实现整个系统的突破,因此超级计算开发能力成为国家信息技术创新能力的重要象征,特别是计算能力的发展。

天河超级计算机不断挑战世界计算能力的极限,从100亿次到10亿次,再到现在的100亿次。

“在新一代天河超级计算系统中,我们设计实现了柔性系统架构,支持双精度、单精度和半精度集成的计算输出能力,是世界领先的。国家超级计算天津中心首席科学家孟祥飞表示,除了完成传统的高精度科学工程计算外,天河还建立了基于独立E级计算系统架构的智能计算引擎,并建立了大规模的人工智能培训和应用系统支持环境。天河E级智能计算开放创新平台将带来跨模式超级计算能力超过100亿次,支持传统科学工程计算,服务智能混合计算,打造全方位计算能力创新和数字经济高质量发展载体。

由中文数据集支撑的天河天元大模型。

数据是人工智能发展的基石,是工业智能发展中最宝贵的资源。大量的数据对人工智能自我监督学习有很大的帮助。

众所周知,中文大语言模型的数据集非常稀缺。孟祥飞介绍,天津超级计算中心收集整理了网络数据、各种开源培训数据、中国小说数据、古代数据、百科全书数据、新闻数据和专业领域的中医、医学、咨询、法律等数据集,培训数据集总标题达到350B,培训创建了自己的中国语言大模型——天河天元大模型。

同时,大型模型仍在不断培训和改进,并在此基础上启动医疗、工业、法律等领域的专业模型的深度培训。

在深度学习平台的支持下,未来大模型将带动新的产业和服务应用范式,成为产业智能基础。将专家知识图集成到人工智能的统一基础上,可以为跨场景或行业创建“元能力引擎”。该模式将进一步推动各行各业的生产能力和生产效率从“量变到质变”,实现跨越式发展。

以超级计算能力和生成人工智能打造行业专家。

“行业大模型是进一步整合行业数据、知识和专家经验,提高大模型对行业应用的适应性。孟祥飞表示,预训练大模型增强了人工智能的通用性和泛化性。基于大模型,可以通过零样本或小样本进行精细调整,在各种任务中取得更好的效果。大模型“预训练” “精调”等模式带来了新的标准化人工智能研发范式,以更统一、更简单的方式实现人工智能模型的大规模生产。

“这将带来一场由通用人工智能驱动的‘人工智能革命’。孟祥飞说。

以大模型为产业智能升级基础,利用专业数据集,打造更适合行业领域的智能高水平“专家”。同时,人工智能是推动新一轮科技革命和产业变革的巨大力量,推动产业升级,提高领域创新效率和产业生产效率。

未来,以生成人工智能为基础的产业链将成为智能升级过程中可大规模复用的基础设施。在大模型通用性、泛化性和降低人工智能应用门槛的优势下,人工智能也将加快着陆,形成新的机遇。

孟祥飞表示,他希望借此机会与您分享超级计算能力发展和生成人工智能创新的突破,并希望为未来的协调发展创造更多的可能性。让“天河天元大模型”赋能百业,赋能中国高质量发展。

(天津中心供图国家超级计算)。

赞(9864)
未经允许不得转载:>人心向背网 » 天津国家超级计算中心发布了生成人工智能“天河天元大模型”