蒋宁指出 , 国内大模型缺乏原创性突破 , 模型推理能力、大模型生成能力仍有差距 。大规模、高质量的中文语料数据获取难度大是制约国内大模型发展的一大因素 。具体到金融领域 , 其还面临隐私保护、持续稳定、合规可信等多方面的挑战 。
周伯文认为 , 当前AI大模型的训练 , 算法端向神经网络Transformer模型收敛 , 算力端依赖具备大规模并行计算能力的AI服务器集群 , 数据端则需要巨大数据量的大规模数据集投喂 , 如果从AI三要素来看 , 数据稀缺性明显是导致大模型应用落地的一大难题 。诸如金融行业这类对数据安全和用户隐私保护要求极其严格的特定领域 , 也向大模型提出了可信赖、自主可控与强安全等一系列挑战 。
周伯文表示 , 大模型产业化也面临挑战:一是数据规模大 , 且数据质量参差不齐;二是模型的体积大 , 训练难度很高;三是算力规模大 , 性能要求高 。因此 , 大模型研发依赖算法算力和数据的综合支撑 。大模型是未来产业发展的重点 , 但大模型的商业模式值得探讨 。因为大模型的成本壁垒非常高 , 大公司和小企业都有各自的负担 。
垂直整合
在核心问题尚待突破、差距正在弥合的现阶段 , 中国的AI发展要探索一条怎样的发展路径?还有哪些发展机遇?蒋宁指出 , 构建组合式AI系统是发展趋势 , 有效结合各种垂直领域的辨别式模型的可用性和专业性 , 以及生成式大模型的迁移学习和泛化能力强的特点 , 从而在工业界真正发挥大模型的泛化能力优势 。
林建明指出 , 大模型未来在城市、行业、企业等千行百业数智化过程中大有可为 。国内布局大模型要加强自主创新能力 , 从算力、算法、人才等各个层面提升大模型的核心竞争力 , 还要紧密结合国家战略需求和行业发展方向 , 深入探索行业痛点和场景 。
此外 , “要发挥自身技术、场景、用户和行业数据及行业Know-How(行业秘诀)打造垂直领域大模型;以‘通用模型+行业Know-How专用模型’为实体经济赋能 , 建立自身壁垒优势 。”林建明表示 。
周伯文认为 , 大模型产业应从端到端做起 , 慢慢迭代出更大的商业模型 , 或许是更适合的做法 。在具备通用能力的基础之上 , 于垂直领域不断训练、提升大模型的专业能力 , 是未来帮助大模型这项技术发展进步的一种重要手段 。
周伯文指出 , 从理论、技术层面来看 , 差异一定是存在的 。在AI的发展上 , 一方面我们是技术层面的追赶者 , 另一方面我们也很可能成为应用层面的创新者甚至引领者 。中国的AI需要探索一条新的道路 , 即垂直整合从自研通用大模型到应用、用户全场景闭环 , 实现生成式人工智能技术与商业价值“双落地” 。
对于创业竞争 , 周伯文认为 , 可以分成三条路线看待:第一条路线是自己做具备通用能力的底层大模型 , 从技术算法到模型迭代、场景闭环都具备;第二条路线是基于别人的模型(如GPT) , 然后结合自己的行业Know-how去做训练;第三条路线是纯粹做应用 , 是将模型拿来直接使用 , 这种壁垒会较低 。
【“千模大战”热潮下的AI冷思考】
推荐阅读
- C++ 正在向 C 发起“进攻”!TIOBE 7 月榜单发布
- “五年内人类程序员将消失”预言引争议,AI真的那么强大了吗?
- “连体夫妇”走红后,无腿丈夫抛妻弃子另寻他欢,现状令人唏嘘
- “鱼骨线”怎么走?
- 看上去很美的全景天幕 竟成了电动车主夏天“最大的痛”
- 今天才知道!电动车“每日充”和“骑完充”,到底哪种更伤电池?
- 7月起,电动车多地新情况,上路注意“2限1罚”管理,避免被处罚
- “避暑、研学、康养”领跑暑期文旅市场
- 避暑地被高温“攻击”,今夏旅游避暑的正确“打开方式”
- 为什么你穿碎花裙显老、显土?学会这3个“搭配思路”,优雅高级
