阿里巴巴申请针对扩散语言模型的训练方法专利, 提升训练后扩散语言模型的推理性能
- 发布日期:2026-04-28 20:24 点击次数:159
国家知识产权局信息显示,阿里巴巴(中国)有限公司申请一项名为“一种针对扩散语言模型的训练方法、平台、设备、介质和产品”的专利,公开号CN121859920A,申请日期为2026年3月。
专利摘要显示,本说明书实施例提供一种针对扩散语言模型的训练方法、平台、设备、介质和产品,该方案可以包括:获取初始扩散语言模型针对样本提示词生成的多个中间预测结果;针对多个中间预测结果中的每一个中间预测结果,确定该预测结果的奖励值;基于该奖励值调整初始扩散语言模型的参数,得到训练后的扩散语言模型。该方案可以有效规避奖励与中间预测结果对应的贡献度不匹配的弊端,以实现对模型优化过程的精细化分层调控,进而可以提升模型的整体训练效果,提升训练后扩散语言模型的推理性能。
天眼查资料显示,阿里巴巴(中国)有限公司,成立于2007年,位于杭州市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本15460.55039万美元。通过天眼查大数据分析,阿里巴巴(中国)有限公司共对外投资了60家企业,参与招投标项目85次,财产线索方面有商标信息5000条,专利信息5000条,此外企业还拥有行政许可19个。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
相关资讯
