聚合国内IT技术精华文章,分享IT技术精华,帮助IT从业人士成长

国产AI大模型探索

2023-04-05 15:35 浏览: 1911078 次 我要评论(0 条) 字号:

“未来国内一定会有自己的AI大模型,并且也一定会诞生自己的ChatGPT。”在谈到打造AI大模型和“中国版ChatGPT”是否现实时,多位投资人都对《每日经济新闻》记者做出了这样的判断。




ChatGPT这一语言AI模型的火爆出圈,引发了普罗大众对AI应用的热情的同时,也引燃了AI大模型的战火。3月15日,OpenAI发布GPT-4,将这一战火再度升级。
站在底层技术角度来看,从科技巨头到互联网大厂,从创业届到学术届,AI大模型正在成为各方抢滩市场的关键。
目前,国内布局AI大模型厂商百度阿里腾讯华为等企业,正在不断夯实通用大模型,打造产业模型,助力AI大模型产业化。
其中,百度以文心大模型+飞桨PaddlePaddle深度学习平台腾讯以hun yuan大模型+太极机器学习平台阿里以通义大模型+M6-OFA华为以盘古大模型+ModelArts,都打造了(自然语言处理)大模型 、(计算机视觉)大模型以及多模态大模型方面。
百度由于多年在AI领域的深耕,其文心大模型涵盖基础大模型、任务大模型、行业大模型的三级体系,打造大模型总量约40个,产业应用也较为广泛,例如电力、燃气、金融、航天等,构建了国内业界较大的产业大模型。
腾讯产业化应用方向则主要是腾讯自身生态的降本增效,其中广告类应用表现出色。
阿里更重技术,例如M6大模型基于阿里云、达摩院打造的硬件优势,可将大模型所需算力压缩到极致;另外其底层技术优势还有利于构建AI的统一底层。
华为的优势则在于其训练出业界首个2000 亿参数以中文为核心的预训练生成语言模型。目前发布了盘古气象大模型、盘古矿山大模型、盘古OCR大模型三项较为重磅的行业大模型。

为了帮助大家进一步了解、学习阿里达摩院、百度等在智能对话预训练模型等方面的研究,DataFun推出了电子书《国产AI大模型探索》。该电子书列举了达摩院、百度、小米、中科院自动化所等国内部分企业、研究所关于大模型的研究成果技术方案落地实践未来发展规划等方面的内容,对于想学习大模型的个人、在大模型研究中遇到技术难点的团队,都有一定的学习、参考、借鉴价值。

电子书目录

阿里

达摩院 SPACE 对话大模型:知识注入与知识利用

大规模预训练模型在机器翻译中应用

阿里多语言翻译模型的前沿探索及技术实践

百度

百度知识增强大模型探索实践

大模型与小模型联动及落地

大模型推动的人机交互对话

小米

NLPCC:预训练在小米的推理优化落地

中科院

基于多模态大模型的人机对话




扫码回复「大模型」免费领取






网友评论已有0条评论, 我也要评论

发表评论

*

* (保密)

Ctrl+Enter 快捷回复