科研成果展示
模型研发平台
模型研发平台围绕人工智能技术展开全面建设,致力于推动多领域大数据与人工智能的深度融合,助力各行业智能化发展。
- 平台研发基础与目标:以通用的机器学习与深度学习模型为基石,开发大数据工具库、算法库、模型库,打造集存储、处理、分析、显示、服务于一体的大数据分析与人工智能模型服务平台。
- 平台服务内容:为不同领域业务提供全面的数据分析与方案定制服务,包括问题发现与诊断、态势分析与研判等。融合传统应用场景与人工智能,搭建完整功能体系,改善传统工作模式,为多领域大数据发展提供有力支撑。
- 平台技术支持:支持主流人工智能计算框架与计算资源,方便用户通过加载、执行等功能完成科研任务的代码研发工作。
- 平台研发应用流程:构建完善的人工智能模型研发应用流程,包含数据源配置等四大模块。提供便捷操作页面及专业代码工具,满足多样化用户研发需求。
- 平台生态建设:通过建立开发社区、教学平台,培养智能计算生态圈,丰富各学科工具库,并面向不同场景开发应用,实现产、学、研、用一体化发展。
平台特色
以模型研发为核心,辅以身份认证、综合管理、信息服务、接口等支撑系统,增加大屏可视化系统,支撑多领域场景大数据分析业务应用系统运行。
⚫ 一体化模型研发:模型研发平台旨在为多学科提供不同的学科工具库,快速完成科研任务。建立开发社区和教学平台,支持用户上传、研发、发布模型应用场景,完成“发布-使用-传播”的生态闭环,促进智能计算生态圈的发展与壮大。
⚫ 多语言、多架构计算框架:支持主流计算框架如 PyTorch、TensorFlow、MathWorks 等,不需局限于传统的开发模式,可以跨框架甚至跨语言,充分利用每种框架计算优势。
⚫ 多样化计算资源:提供私有云计算资源,新增 GPU 服务器和 CPU 服务器,以支持核心敏感业务的高性能计算和数据处理。在具体的任务时,可充分地、高效地利用每一种计算资源,而不需过度关注特定资源使用情况。
⚫ 统一资源管理器:统一资源管理器的核心在于高效的利用计算资源完成具体的训练或数据分析任务。为此,模型研发平台实现了一组跨资源的任务调度协议,用以统一且高效地高效使用来自不同平台的计算资源,如内存、CPU、GPU 等。同时,智能调度任务引擎,将决定如何给每一个具体任务分配所需资源,从而最大化各个平台地资源利用率。
⚫ 分系统综合管理:使用基于 Slurm 作业管理的多集群可视化调度与管理子系统,提供一个集中管理多个集群资源的平台,实现对多个集群环境的统一管理和调度,以提高系统的整体性能和可靠性。
⚫ 可靠系统安全保障:通过数据加密、签名等技术手段保证数据完整性,通过用户权限的控制、操作审计和监控、安全配置等技术手段保证操作安全,完善信息安全、网络安全和物理安全的相关措施,以构建健全的平台安全保护体系。
⚫ 多场景应用库:在学科工具库的基础上,进一步形成面向各行业各领域的具体应用,如智能对话机器人、智能环境监测报告等,实现产、学、研、用一体化发展。
平台功能
借助平台我们可以快速搭建针对特定应用场景的人工智能分析处理方案,平台提供了代码编辑工具与代码执行工具,用户可以使用平台编写代码并借助平台的资源实现从数据处理、模型搭建、建模训练到服务部署的全流程应用场景搭建。
一、模型仓库
模型仓库提供了多样的代码方案模板,包含课程实验中通用的模型及统计学习和深度学习模型等,提供模型训练代码及模型服务代码等多流程代码加载及执行方案。
二、工作台
工作台以项目管理列表的形式呈现,根据不同的任务需求创建不同的项目,点击对应项目即可进行模型研发操作。⽤户可以针对不同的需求创建不同的项⽬,实现高效清晰的管理。
三、计算资源
平台提供了可视化的计算资源详情⻚,⻚⾯显示了⽤户等级信息、正在运⾏任务的资源使⽤情况、所有任务的资源使⽤情况、任务创建及运⾏情况和磁盘使⽤情况等,方便用户通览账户下的资源任务情况。
另外,平台提供CPU、GPU、内存、硬盘资源、同时提供一定的集成开发环境(IDE)、执行代码和指标监控的创建/运行数量。用户可以根据资源使用情况部分的信息合理安排计算资源的使用。
四、文件系统
平台文件系统为用户提供了系统化管理及使用平台文件的功能。
应用示例
一、网络舆情环境问题识别与风险分析
该场景通过接入海量微博数据,通过文本语义识别模型,收集全国过去一段时间发生或正在发生的主要环境问题,统计生态环境问题发生的主要类型及时空格局。
二、基于GRU/Transformer的小清河流域水污染溯源分析
该应用针对流域水环境污染复合型和结构性特点突出,但传统的水污染溯源模型代表性有限、计算复杂、分析滞后等难题,利用基于物联网智能感知的连续全量水质和企业污染数据,基于Transformer、门控循环神经网络等深度学习以及余弦相似度等相关分析算法构建了水质迭代估算和“源-汇-体”特征图谱关联分析的水污染溯源分析模型,实现监测数据的实时、并行处理和深度挖掘,可自动进行水质异常研判、“受体-疑似污染源”关联分析以及突发污染事件应急响应,智能识别水污染事件的疑似排污企业、时段和范围等信息。
三、三维空气质量预测分析
该应用针对传统的区域空气质量预测模型计算量大、耗时长等难题,利用源排放清单、卫星遥感、环境监测数据,基于随机森林等算法构建了三维空气质量预测模型,实现对未来大气污染的快速预报、预警和评估,可自动提取并动态展示大气污染物三维空间分布及变化趋势,智能识别可能发生大气污染的时段和区域,准确评估本地源贡献和预期减排效果。
四、自然保护地人类活动遥感监管
本应用场景将以【山东省鲁中山区土壤保持重要区】为例,借助高分辨率遥感监测手段,通过耦合自注意力生成对抗网络CSA-CDGAN与深度残差网络ResNet构建高分辨率遥感图斑智能识别与解译模型,通过训练高精度的遥感变化检测语义分割模型与场景分类模型,实现两期甚至多期自然保护地内人类活动变化图斑的边界提取与类型判读。