8月7日晚间,拓尔思(300229)披露定增预案,拟募资不超过18.45亿元,进一步发力大模型研发。此前,拓尔思已于6月底发布面向政务、金融、媒体三个行业的专业大模型“拓天大模型”,在AI概念的风口下,今年以来公司股价累计涨幅接近100%。
加码大模型研发
根据预案,拓尔思拟募投项目名为“拓天行业大模型研发及AIGC应用产业化项目”。通过披露募资款项分配,拓尔思详细列明了开发大模型产品所需的投入组成:在18.45亿元的投资中,其中最大的开支是软硬件购置,公司计划投入8.41亿元,紧随其后的是研发人员薪酬和租赁费,投入资金分别为5.1亿元、2.57亿元,此外公司计划投入1.98亿元用于数据资源购买。
【资料图】
就本次定增募投项目,拓尔思表示,该项目拟基于公司的海量高质量行业数据、行业知识体系等知识型资产,在通用大模型的基础上构建拓天行业大模型,并实现生成式AI(AIGC)在媒体、政务、金融等领域的产业化应用。其中,在AIGC商用方面,拓尔思着重提出了公司的三大目标:着力解决目前大模型虚幻生成的问题,提升内容事实核查与修改的能力,构建生成内容全面、准确、可信且具备正确价值观的行业大模型及AIGC应用。
总结来看,拓尔思计划在三年内完成项目建设,公司测算项目内部投资收益率(税后)为13.68%,税后投资回收期为5.96年(含建设期)。拓尔思表示,“项目具有良好的经济效益,对公司发展有较好的促进作用”。
除前述对募投项目的论述之外,本次定增的发行对象、发行价格、股票数量等核心要素均未确定,拓尔思仅常规性表示本次发行对象不超过35名,发行价格不低于定价基准日前20个交易日股票交易均价的80%,发行股票数量不超过发行前总股本的30%。
已发布“拓天大模型”
拓尔思自我定位是人工智能、大数据和数据安全产品及服务提供商。在大模型开发方面,拓尔思置认为公司颇具优势,“公司拥有千亿级‘全、准、新’的无监督训练数据和微调优化知识数据,可针对优势行业训练出高质量的行业大模型”。在AI概念股的高关注度下,拓尔思今年以来股价飙升,年内最大涨幅一度超200%,截至目前仍累计涨约100%。
在本次定增之前,拓尔思已经围绕大模型、AIGC开展研发。据公司此前透露,在2022年,公司已经在人工智能领域开展了6项重要工作,具体包括预训练大模型和专业模型的融合实践、启动公司自有专业模型trsGPT研发、开发具有AIGC能力的虚拟人开放云服务平台等。
在今年6月底,拓尔思正式发布了“拓天大模型”,公司介绍该产品是在基础大模型之上进行训练和精调,面向政务、金融、媒体三个行业的专业大模型。在发布会上,拓尔思表示,该产品可为媒体行业内容生产与搜索推荐、金融行业的智能风控与投研、政府的政策分析与公文辅助写作等垂直领域提供深度赋能,满足行业用户的专业化智能创新需求。
拓尔思介绍,拓天大模型有“十大基础能力”和“四大创新点”。前者包括内容生成、多轮对话、语义理解、跨模态交互、知识型搜索、逻辑推理、安全合规、数学计算、编程能力和插件扩展。后者则包括中文特性增强的可控生成技术、融合搜索引擎的生成结果可信核查、融合稠密向量的跨模态能力加强以及支持外界知识及时更新等。
今年以来已有多家上市公司计划通过定增募资,投入到大模型的研发中。
手笔较大的投资包括云从科技,该公司在今年3月宣布拟定增募资36.35亿元用于云从“行业精灵”大模型研发项目。星环科技在6月宣布,拟定增募资15.21亿元用于建设数据分析大模型建设项目等。此外,包括万兴科技、海天瑞声、因赛集团等公司也在年内披露定增方案,计划加码大模型相关项目建设。
大模型训练成本较高,多家公司密集投入这一领域,进一步造成了算力供应紧张。正在开发金融行业大模型的同花顺即表示,公司正在想办法采购、租赁相关设备,努力提升大模型的训练质量和速度。拓尔思也在接待调研时回应称,针对大模型训练的成本过高等问题,拓天大模型通过外挂知识库的方式接入实时数据,结合自研搜索引擎技术实现专业领域实时数据的融合利用。
关键词: