全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211085688.9 (22)申请日 2022.09.06 (71)申请人 中国建设银行股份有限公司 地址 100033 北京市西城区金融大街25号 申请人 建信金融科技有限责任公司 (72)发明人 陈帆  (74)专利代理 机构 北京同立钧成知识产权代理 有限公司 1 1205 专利代理师 吴莎 刘芳 (51)Int.Cl. G06F 16/2455(2019.01) G06F 16/2453(2019.01) G06F 16/25(2019.01) G06F 16/23(2019.01) G06F 40/205(2020.01) (54)发明名称 结构化数据比对方法、 装置、 电子设备及存 储介质 (57)摘要 本申请涉及数据处理技术领域, 提供一种结 构化数据比对 方法、 装置、 电子设备及存储介质, 该方法包括: 获取结构化数据集合和结构化数据 集合对应的应用场景需求, 结构化数据集合包括 第一结构化数据和第二结构化数据, 第一结构化 数据为基准源 数据, 第二结构化数据为经过变动 后的数据; 基于应用场景需求获取字段比对规 则, 并基于字段比对规则对结构化数据集合进行 解析, 得到比对项编号和排序字段; 基于比对项 编号将结构化数据集合进行分组, 得到至少一组 比对数据; 针对每一组比对数据, 基于排序字段 对比对数据进行排序, 并依次进行比对, 得到比 对结果。 这样, 可 以支持符合各种应用场景需求 的字段比对规则, 并同时支持批量数据的比对, 提高比对效率。 权利要求书2页 说明书14页 附图4页 CN 115357625 A 2022.11.18 CN 115357625 A 1.一种结构化数据比对方法, 其特 征在于, 所述方法包括: 获取结构化数据集合和所述结构化数据集合对应的应用场景需求, 所述结构化数据集 合包括第一结构化数据和第二结构化数据, 所述第一结构化数据为基准源数据, 所述第二 结构化数据为经 过变动后的数据; 基于所述应用场景需求获取字段比对规则, 并基于所述字段比对规则对所述结构化数 据集合进行解析, 得到比对项编号和排序字段; 基于所述比对项编号将所述结构化数据集 合进行分组, 得到 至少一组比对数据; 针对每一组比对数据, 基于所述排序字段对所述比对数据进行排序, 并依次进行比对, 得到比对结果。 2.根据权利要求1所述的方法, 其特征在于, 基于所述字段比对规则对所述结构化数据 集合进行解析, 得到比对项编号和排序字段, 包括: 获取所述字段比对规则中对应的比对字段, 所述比对字段包括类型字段、 函数字段和 编号字段; 基于所述比对字段获取所述结构化数据集合中相应的数据, 并基于所述字段比对规则 对所述数据进行 预处理, 得到所述数据对应的比对项编号和排序字段。 3.根据权利要求2所述的方法, 其特征在于, 基于所述字段比对规则对所述数据进行预 处理, 得到所述数据对应的比对项编号和排序字段, 包括: 基于所述类型字段识别出所述数据中待比对字符串, 并将所述待比对字符串进行拼 接; 所述待比对字符串包括主键 字符串和业 务字符串; 基于所述 函数字段对拼接后的待比对字符串 进行处理, 得到比对字符串; 利用所述编 号字段对所述比对字符串进行组装, 并识别组装后比对字符串对应的比对 项编号和排序字段。 4.根据权利要求1所述的方法, 其特征在于, 基于所述比对项编号将所述结构化数据集 合进行分组, 包括: 获取所述结构化数据集合中每一数据对应的主键字符串, 并基于所述主键字符串和所 述比对项编号对所述结构化数据集 合进行分组。 5.根据权利要求1所述的方法, 其特征在于, 基于所述排序字段对所述比对数据进行排 序, 并依次进行比对, 得到比对结果, 包括: 获取每一组比对数据中的数据条 数, 并判断所述数据条 数是否大于1; 若是, 则基于所述排序字段对所述比对数据进行排序, 并依次进行 比对, 得到比对结 果; 若否, 则基于所述比对数据的来源得到比对结果。 6.根据权利要求5所述的方法, 其特征在于, 基于所述比对数据的来源得到比对结果, 包括: 若所述比对数据来自第一结构化数据, 则确定所述比对数据为被删除的数据; 若所述比对数据来自第二结构化数据, 则确定所述比对数据为 新增的数据。 7.根据权利要求1所述的方法, 其特征在于, 获取结构化数据集合和所述结构化数据集 合对应的应用场景需求, 包括: 利用标准化接口获取不同数据库中的实时数据, 并将所述实时数据进行格式转换, 得权 利 要 求 书 1/2 页 2 CN 115357625 A 2到结构化数据集 合; 针对不同数据库对应的结构化数据集合, 获取每一结构化数据集合对应的应用场景需 求。 8.根据权利要求1 ‑7任一项所述的方法, 其特 征在于, 所述方法还 包括: 在得到所述比对结果后, 判断所述比对结果是否一 致; 若是, 则间隔预设时间, 对所述结构化数据集合再次进行比对, 得到比对结果后覆盖上 一次的比对结果, 以验证比对的准确性; 若否, 则生成告警提 示, 以提醒用户对所述比对结果进行核验。 9.一种结构化数据比对 装置, 其特 征在于, 所述装置包括: 获取模块, 用于获取结构化数据集合和所述结构化数据集合对应的应用场景需求, 所 述结构化数据集合包括第一结构化数据和 第二结构化数据, 所述第一结构化数据为基准源 数据, 所述第二结构化数据为经 过变动后的数据; 解析模块, 用于基于所述应用场景需求获取字段比对规则, 并基于所述字段比对规则 对所述结构化数据集 合进行解析, 得到比对项编号和排序字段; 分组模块, 用于基于所述比对项编号将所述结构化数据集合进行分组, 得到至少一组 比对数据; 比对模块, 用于针对每一组比对数据, 基于所述排序字段对所述比对数据进行排序, 并 依次进行比对, 得到比对结果。 10.一种电子设备, 其特 征在于, 包括: 处 理器, 以及与所述处 理器通信连接的存 储器; 所述存储器存储计算机执 行指令; 所述处理器执行所述存储器存储的计算机执行指令, 以实现如权利要求1 ‑8中任一项 所述的方法。 11.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机执 行指令, 所述计算机执行指令被处理器执行时用于实现如权利要求1 ‑8中任一项所述的方 法。 12.一种计算机程序产品, 其特征在于, 包括程序代码, 当计算机运行所述计算机程序 时, 所述程序代码执 行如权利要求1 ‑8中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115357625 A 3

PDF文档 专利 结构化数据比对方法、装置、电子设备及存储介质

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 结构化数据比对方法、装置、电子设备及存储介质 第 1 页 专利 结构化数据比对方法、装置、电子设备及存储介质 第 2 页 专利 结构化数据比对方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-07 12:40:00上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。