财新传媒 财新传媒

阅读:0
听报道

GBAITA 数字经济研究中心

总监:车品觉     专家作者:高璇颖

 

 一、ChatGPT 发布引发业界广泛关注,体现出生产式人工智能巨大的应用潜力

2022年11月,人工智能研究实验室Open AI发布了ChatGPT,带来全世界范围对生成式AI的广泛关注。在ChatGPT上线的5天内,就带来了超过100万的用户增长,3个月内月活用户已突破1亿人,成为史上增长最快的面向消费者的应用。

对比传统的人工智能,ChatGPT具有巨大应用潜力。在自然语言生成方面,ChatGPT能力更强,且更准确快速。依靠更强化的学习训练机制,能够生成更多样化和人性化的回复,并针对人类的反馈数据进行迭代优化,以满足不同场景的应用需求。ChatGPT通过预训练模型的方式获得更广泛的语言数据,并进行各领域的知识迁移。此外,ChatGPT采用自监督学习策略,通过不断与用户交互,利用语言反馈进行自我迭代优化,提升自我对话水平。ChatGPT在基础性数据收集、资源整合、内容生成领域的优势,将极大提高社会生产力,帮助内容创作者激发创作灵感。

ChatGPT的成功得益于深度学习算法的发展、大数据和计算能力的支持、开源社区的贡献及商业应用的推广。微软和OpenAI产研合作模式也成为ChatGPT快速出圈的助推器,微软将Open AI的服务嵌入到自身产品中,并提供了大规模的数据资源,帮助进行模型的预训练和不断迭代,加速了Open AI服务的产品化和商业化。

 

二、ChatGPT的“爆火”,引发国内互联网巨头对大模型和基于模型应用的布局

随着ChatGPT在科技领域激起的浪潮,国内多家互联网巨头也纷纷布局大模型和生成式人工智能赛道。百度早在2019年3月发布预训练模型ERNIE 1.0。2023年3月,百度凭借海量的知识沉淀及丰富的场景,发布了大语言模型、生成式AI产品“文心一言”。在商业化应用方面,已接入超过650家企业,并将在金融、教育、医疗、交通等领域实现商业化赋能,通过百度智能云,帮助企业发布行业大模型。2022年4月,腾讯发布“混元大模型”,覆盖自然语言处理、计算机视觉、多模态等基础模型及NLP预训练模型,并应用于理解广告内容进行精准的广告投放、微信搜一搜、图像/视频生成等内部场景。阿里则布局“通义大模型”,采用深度神经网络技术,实现高精度的语义理解和情感分析,并在金融、医疗、电商等领域实现具体应用。例如,在电商领域,运用于商品推荐、搜索优化、智能客服;在金融领域,运用于智能投资、风险控制等。2023年4月11日,阿里云发布“通义千问”,在多轮对话、多语言支持、文案创作、逻辑推理等领域具备AI能力,为开发者提供个性化开发的插件功能,打造产品生态。2021年4月,华为布局大模型“盘古”,并在医药、气象、电力、金融、矿山等领域打造了行业大模型系列,加速了AI开发的标准化、批量化生产,极大推动了AI的产业化落地。此外,其他科技巨头,如京东、字节跳动、商汤、科大讯飞等也纷纷加入ChatGPT的技术战及大模型的布局中,将从信息获取、社交、内容创造等方面极大提升效率。

结合国内领先科技企业的布局我们发现,以ChatGPT为代表的AIGC竞争本质是大模型储备竞赛,而大模型既推动了辅助式人工智能向通用性人工智能的飞跃,也加速了人工智能的产业化落地。大模型将大算力与强算法相结合,通过预训练与精调结合的方式,极大简化了AI研发生产的范式,降低AI开发门槛,推动传统产业的智能化改造升级。

 

三、大模型的竞争本质上是算力、算法和数据的竞争

在算法和数据方面,国内领先互联网公司凭借长期的结构化和非结构化数据沉淀、机器学习和深度学习算法人才储备,在中文领域生成式AI开发上,与国外并无显著差距。

算力是训练大模型的底层基础,而芯片、半导体等硬件产品能力是算力的基石。在ChatGPT大模型训练的芯片产品能力上,我国相比海外巨头还存在差距。当前,全球GPU市场呈现寡头垄断格局,以英伟达、AMD、英特尔等国际巨头占据绝大部分市场,英伟达A100芯片、H100芯片在全球具有绝对优势。然而受到美国对英伟达和AMD向国内出售高性能芯片计算芯片的限制,我国在算力芯片上受到美国卡脖子。尽管我国在加速推进国产替代步伐,国产芯片如寒武纪、昆仑芯片相比英伟达A100芯片,在性能、稳定性、通用性等方面仍有较大追赶空间。

面对当前算力差距,我国积极推进“东数西算”政策,并在新型数据中心发展领域出台政策,推进算力建设的持续增速。2021年7月,工信部印发《新型数据中心发展三年行动计划(2021-2023年)》 指出,“到2023年底,全国数据中心机架规模 年均增速保持在20%左右,平均利用率力争提升到60%以上,总算力超过200 EFLOPS,高性能算力占比达到10%”。2023年4月,科技部高新司发起成立国家超算互联网联合体,构建一体化的算力服务平台,解决算力分布不均等问题。

此外,各地在加速推进数字基础设施建设。2023年2月,北京昇腾人工智能计算中心组建并落地,与首批47家企业和科研单位签约,提供算力服务,加速北京人工智能产业的发展与落地。2023年4月,上海市经济信息化委印发 《上海市推进算力资源统一调度指导意见》,旨在增强全市可调度智能算力的接入,解决算力均衡,带动产业发展。2023年3月,贵州省大数据局印发《面向全国的算力保障基地建设规划》,从超大规模数据中心集群的规模化、集约化建设方面,为全国提供算力保障。

 

四、监管与规范是生成式人工智能健康、可持续发展的重要保障

在算力建设的持续推进与技术能力的高速发展同时,国家对生成式人工智能的监管已提上日程。2023年4月11日,国家网信办发布《生成式人工智能服务管理办法(征求意见稿)》(下称《管理办法》),对生成式人工智能产业给出较为详尽的规定,包括定义、准入资格、责任义务和处罚措施等。

首先,《管理办法》强调了利用生成式人工智能提供服务前,安全评估及算法备案的前提;其次,对生成式人工智能提供的服务内容提出了基本要求,要求遵守法律法规要求,尊重社会公德、公序良俗,体现社会主义核心价值观,不得利用算法、数据、平台等优势实施不公平竞争等。同时,还强调了个人信息安全和数据隐私保护。此外,《管理办法》也提出了明确的违规处罚条款,视情节严重程度处以警告、通报批评、罚款及追究刑事责任等。目前尽管《管理办法》还处在征求意见阶段,但我们不难看出,国家对生成式人工智能技术发展、以及背后所蕴含的生产力潜力的重视和关注。对从事算法设计、训练模型选择、模型生成与优化、以及提供服务的行业开发者、服务提供者起到了规范作用,引导用户和从业者以更加理性和科学的态度应对生成式人工智能为生产生活带来的便利及效率提升。

当前,对生成式人工智能的监管规范已成为全球共识。相比而言,海外采取了更为激进的“一刀切”监管政策。欧洲多国都出于对数据安全及隐私方面的担忧,对GhatGPT予以封禁。2023年3月31日,意大利宣布封禁ChatGPT。当地时间4月12日,要求其开发公司OpenAI公开对数据的处理逻辑、明确用户和非用户享有的权利,要求对用户年龄进行筛查,并向外界告知对用户个人数据的使用情况。此外,德国、法国、爱尔兰、西班牙等欧洲国家也对ChatGPT采取类似严格的监管。

欧盟立法者希望在2021年《人工智能法案》的基础上,加入针对ChatGPT等人工智能工具的规则以规范其应用,呼应扩大对人工智能的监管范围。在美国,马斯克等业界知名人士也呼吁Open AI停止对比GPT-4更强大的模型开发至少6个月。

总体来看,面对人工智能带来的全球性技术与产业发展巨大机遇,我们坚持发展与监管并举。一方面,要看到ChatGPT对产业效率与企业活力的牵引作用,做好引导扶持;另一方面,监管也要紧跟技术发展步伐,明确规范,从而实现人工智能产业的有序、高质量和可持续发展。

 

【更多数字经济干货,请关注公众号“数字经济全球观察”】

 

话题:



0

推荐

数字经济发展研究中心

数字经济发展研究中心

8篇文章 70天前更新

数字经济发展研究中心总干事:车品觉(太平绅士、红杉资本中国基金会专家合伙人、香港特区政府数字经济发展委员会委员);专家组:唐诚、Sherry Gao、Kevin Tang

文章
  • 个人分类
全部文章 8篇
  • 文章归档
2023年 8篇