建筑行业首个百亿字符知识增强“ChatGPT”上线!身处工地,也有“专家”随行问答新民晚报2023-10-24 15:34新民晚报2023-10-24 15:34
图说:小程序端部分操作界面 采访对象供图
新民晚报讯(通讯员 张英楠 沈俊凯 记者 裘颖琼)记者从上海建工集团获悉,由上海建工四建集团建筑人工智能研究室自主研发的建筑行业首个百亿字符知识增强对话大模型Construction-GPT(Beta版),在10月16日正式上线,预计今年年内开放建筑专业词嵌入、非结构化文件解析等相关API接口供行业使用。
Construction-GPT包含规范标准智能问答与查新、工程图集详图智能搜索、内控技术文件智能查询、私有知识库智能构建4项主要功能,实现了5000多本规范标准、1000多份工程图集、150多份企业内部技术文件的智能解析,技术人员通过对话问答方式,只需5-10秒就能够检索到需要的建筑工程技术资料,即使身处工地现场,也有“行业专家”随行。
近一年来,大语言模型(以下简称“大模型”)已经逐渐成为人工智能领域最热门的技术之一。通俗来讲,大模型指的是一种包含众多参数、由海量数据训练而成的、旨在理解和生成人类语言的人工智能模型。包括chatGPT、“文心一言”、“讯飞星火”在内的通用大模型,可以实现文本总结、机器翻译、情感分析、数据处理等多项功能,众多数字化转型行业也开始引入大模型技术,拓展业务能力与市场生态,比如法律大模型“Lawyer LLaMA”、医疗大模型“灵医”等行业大模型等,都取得了良好的社会效益。
建筑行业是传统行业,当前正处在数字化转型起步时期。在技术资料检索工作中,建筑行业仍然大量采用人工检索方式,效率低下,问题主要集中在——
建筑行业所涉及的规范标准数量庞大,更新速度快,同一个技术内容往往同时涉及多本规范标准要求与管理文件规定,难以全面检索;工程图集规模庞大,对于某一节点详图、构造做法的具体描述位置,难以快速检索;项目技术资料内容繁杂,而且同一个文件往往存在多个版本,难以准确检索。
针对这些痛点,上海建工四建集团建筑人工智能研究室自主研发了建筑行业首个百亿字符知识增强对话大模型Construction-GPT(Beta版),包括平台网页端、小程序端2种形式,供企业内部技术人员使用,利用大模型语言生成与知识推理的技术特性,实现建筑工程技术资料的智能检索。
与传统人工检索方式相比,技术人员能够一次性快速获得多本技术资料中的相关信息,节省了大量时间;和通用大模型相比,Construction-GPT不依赖互联网知识库,同时加载了敏感词过滤算法,为工程技术问题提供更专业、更科学、更合理的解答。以“女儿墙构造详图”为例,可同步检索到多本工程图集涉及女儿墙构造详图的具体位置信息,打开索引资料,了解详细做法。
建筑行业涉及规范标准数量庞大,更新速度快,技术人员常常难以了解规范标准最新修编情况。研发团队特别建立了规范标准动态数据库,利用近似字符串最优匹配算法,开发了规范标准智能查新功能模块,技术人员一键复制粘贴,就可以快速生成最新结果。今后,Construction-GPT还将上线更多实验室功能模块,助力技术人员的高效办公。
除了规范标准、工程图集、公司内部技术文件等公共技术资料外,技术人员往往还需要根据个人存储资料开展相关检索。为此,研发团队自主研发了多模态数据解析算法,技术人员只需要一键上传文件,Construction-GPT就可以自动解析24种文档、图纸、音频格式文件,建立个人专属知识空间,打造个人专属智能知识检索系统。
未来,上海建工四建集团建筑人工智能研究室将根据用户使用反馈结果开展强化学习,进一步优化Construction-GPT模型性能,扩展Construction-GPT产品功能,为一线技术人员的项目管理工作提供有力支撑,推动行业数字化转型升级。
举报/反馈