联邦学习(Federated Learning)

联邦学习是分布式AI 训练技术,多个参与方(如医院、企业)在不共享本地数据(保护隐私)的情况下,共同训练一个全局模型。其流程为:各参与方用本地数据训练模型,仅上传模型参数/梯度至服务器,服务器聚合参数后下发更新,重复至模型收敛。联邦学习解决“数据孤岛”和隐私保护问题(如医疗数据不可共享但需联合训练诊断模型),在金融(联合风控)、医疗(多中心病历分析)等数据敏感领域应用,是AI合规发展的关键技术。

强化学习(Reinforcement Learning,RL)

强化学习是智能体(如机器人、游戏AI)通过与环境交互试错,学习最优行为策略以最大化累积奖励的AI方法。其核心要素包括状态(环境信息)、动作(智能体行为)、奖励(环境反馈)、策略(状态到动作的映射)。AlphaGo(围棋 AI)通过深度强化学习(结合深度学习与RL)击败人类冠军,自动驾驶车辆通过RL学习复杂路况下的决策(如换道策略),机器人通过RL掌握抓取、行走等技能。强化学习擅长解决序列决策问题,是实现自主智能的核心方法。

生成式 AI(Generative AI)

生成式AI 是能创建新内容(文本、图像、音频、视频、代码等)的AI技术,与判别式AI(如分类模型)不同,其通过学习数据分布生成逼真、新颖的输出。主流模型包括GPT(文本生成)、DALL-E(文本到图像)、Midjourney(图像生成)、Suno AI(音乐生成),基于Transformer构和扩散模型(DiffusionModels)。生成式AI在内容创作(如广告文案、设计草图)、代码开发(如 GitHub Copilot)、教育(如个性化学习材料生成)等领域爆发式应用,重塑创意产业。

大语言模型(LargeLanguage Model,LLM)

大语言模型是参数规模达数十亿至数万亿的预训练语言模型,通过在海量文本数据上训练,具备理解、生成文本、回答问题、逻辑推理等能力。其核心是“规模即智能”:更大参数(如GPT-4 数超万亿)、更多数据(如训练数据含数万亿token)带来更强泛化能力,支持零样本或少样本学习(无需大量微调数据即可适配新任务)。典型代表有 GPT系列、LLaMA、文心一言、讯飞星火,在智能对话、内容生成、知识问答等场景主导应用,是生成式 AI 的核心引擎。

边缘计算(Edge Computing)

边缘计算是在靠近数据源头的边缘设备(如路由器、摄像头、车载终端)进行数据处理的技术,与云计算(集中式处理)相比,降低延迟(如自动驾驶需毫秒级响应)、减少云端带宽消耗、增强数据隐私(本地处理敏感数据)。边缘AI指在边缘设备部署轻量化AI 模型(如通过模型压缩技术减小模型大小),实现本地实时推理(如智能摄像头本地识别人脸、工业传感器本地检测设备故障)。边缘计算与云计算协同(云边协同),支撑自动驾驶、工业互联网等低延迟AI应用。

数字孪生(Digital Twin)

数字孪生是物理实体(如工厂、城市、人体)的数字化镜像,通过传感器实时采集物理实体数据,在虚拟空间构建动态模型,实现监控、模拟、预测功能。AI技术为数字孪生提供分析能力:机器学习预测设备故障(如风机数字孪生预测维护)、计算机视觉识别实体状态(如城市数字孪生监控交通流量)。数字孪生在智能制造(如宝马工厂数字孪生优化生产)、智慧城市(如新加 坡数字孪生城市规划)、医疗(如患者数字孪生模拟治疗方案)等领域应用,实现“虚实交互、以虚控实”​。

可解释性AI(Explainable AI , XAI)

可解释性AI 指能解释其决策过程和结果的AI模型,解决深度学习“黑箱”问题(如模型为何判定某张图像为“猫”)。其方法包括模型内在可解释(如线性回归、决策树,结构简单易理解)、模型事后解释(如LIME 通过扰动输入观察输出变化解释单个预测,SHAP基于博弈论量化特征重要性)。XAI 在高风险领域(如医疗诊断AI需解释病因判断依据、司法AI需说明量刑建议理由)至关重要,提升用户信任度,确保AI决策公平、可靠。

人工智能伦理(AI Ethics)

人工智能伦理研究AI 技术引发的伦理道德问题,包括算法偏见(如招聘 AI对女性的歧视)、隐私侵犯(如人脸识别滥用)、就业冲击(如自动化导致失业)、自主武器伦理、AI 策责任归属(如自动驾驶事故责任认定)等。其目标是制定准则规范AI发展,确保技术“向善”​,如欧盟《人工智能法案》限制高风险AI 应用(如社会评分),企业伦理框架(如谷歌 AI 原则) 约束技术滥用。AI伦理是平衡技术创新与社会公平的关键,需跨学科协作(技术、法律、哲学)建立全球共识。

多模态AI(Multimodal AD)

多模态 AI 指能处理和理解多种类型数据(文本、图像、音频、视频、传感器数据等)的AI模型,模拟人类多感官协同认知(如同时看、听、说)。其核心是模态融合:早期方法为特征拼接,现通过Transformer统一建模多模态数据(如CLIP 将文本和图像映射到同一向量空间,实现“以文搜图”)。多模态 AI在智能助手(如同时处理语音指令和视觉场景)、自动驾驶(融合摄像头、雷达、地图多模态数据)、医疗(结合CT影像、病历文本、基因数据诊断疾病)等场景突破单一模态局限,提升AI 感知与理解能力,是下一代AI的重要发展方向。