同人识别方法、装置、设备和存储介质.pdf

上传人:七月 文档编号:10120026 上传时间:2021-06-04 格式:PDF 页数:19 大小:908.64KB
收藏 版权申诉 举报 下载
同人识别方法、装置、设备和存储介质.pdf_第1页
第1页 / 共19页
同人识别方法、装置、设备和存储介质.pdf_第2页
第2页 / 共19页
同人识别方法、装置、设备和存储介质.pdf_第3页
第3页 / 共19页
文档描述:

《同人识别方法、装置、设备和存储介质.pdf》由会员分享,可在线阅读,更多相关《同人识别方法、装置、设备和存储介质.pdf(19页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202011052993.9 (22)申请日 2020.09.29 (71)申请人 广州小鹏自动驾驶科技有限公司 地址 510000 广东省广州市黄埔区中新知 识城亿创街1号406房之46 (72)发明人 钟奇孙昌青蔡龙颜 (74)专利代理机构 深圳市深佳知识产权代理事 务所(普通合伙) 44285 代理人 常忠良 (51)Int.Cl. G06F 16/9535(2019.01) (54)发明名称 同人识别方法、 装置、 设备和存储介质 (57)摘要 本发明实施例涉及一种同人识。

2、别方法、 装 置、 设备和存储介质, 其中所述方法包括: 获取各 个业务域的用户信息数据及各个所述用户信息 数据之间的关联关系; 依据所述用户信息数据及 所述关联关系构建无向连通图, 所述无向连通图 中的每一个节点对应一个所述用户信息数据, 每 一条无向边对应一个所述关联关系; 给所述无向 连通图中的每一个连通子图分配唯一标识符。 本 发明实施例通过利用无向连通图实现同人识别, 能够将同一用户在公司全域的行为特征串联在 一起, 消除数据孤岛, 不仅易理解、 易落地, 而且 还可扩展性强、 计算成本低, 有效地解决了现有 技术存在的识别过程繁琐、 技术实现门槛高以及 可落地性差的问题, 具有较高。

3、的推广应用价值。 权利要求书2页 说明书11页 附图5页 CN 112148981 A 2020.12.29 CN 112148981 A 1.一种同人识别方法, 其特征在于, 所述方法包括: 获取各个业务域的用户信息数据及各个所述用户信息数据之间的关联关系; 依据所述用户信息数据及所述关联关系构建无向连通图, 所述无向连通图中的每一个 节点对应一个所述用户信息数据, 每一条无向边对应一个所述关联关系; 给所述无向连通图中的每一个连通子图分配唯一标识符。 2.根据权利要求1所述的同人识别方法, 其特征在于, 在所述给所述无向连通图中的每 一个连通子图分配唯一标识码的步骤之后, 所述方法还包括:。

4、 周期性获取各个业务域新增的用户信息数据及各个所述用户信息数据之间新增的关 联关系; 将新增的所述用户信息数据作为新的节点添加到所述无向连通图中; 依据新增的所述关联关系将所述无向连通图中彼此关联的所述用户信息数据通过所 述无向边相连接; 给所述无向连通图中未分配唯一标识符的连通子图分配唯一标识符; 判断所述无向连通图中是否存在具有两个或多个唯一标识符的连通子图; 若是, 则按照设定规则从所述两个或多个唯一标识符中选择其中一个作为最终的唯一 标识符。 3.根据权利要求2所述的同人识别方法, 其特征在于, 所述按照设定规则从所述两个或 多个唯一标识符中选择其中一个作为最终的唯一标识符的步骤包括:。

5、 从所述两个或多个唯一标识符中选择分配时间最早的一个作为最终的唯一标识符; 或者, 从所述两个或多个唯一标识符中选择分配时间最晚的一个作为最终的唯一标识符; 或者, 从所述两个或多个唯一标识符中随机选择一个作为最终的唯一标识符。 4.根据权利要求1所述的同人识别方法, 其特征在于, 在所述给所述无向连通图中的每 一个连通子图分配唯一标识码的步骤之后, 所述方法还包括: 依据用户信息数据的生成时间, 对每一个连通子图所对应的用户的行为轨迹进行统计 分析, 以确定每一个用户的感兴趣程度; 根据所述感兴趣程度, 向对应的用户推送对应的内容信息或提供对应的客户服务。 5.一种同人识别装置, 其特征在于。

6、, 所述装置包括: 第一获取模块, 用于获取各个业务域的用户信息数据及各个所述用户信息数据之间的 关联关系; 构建模块, 用于依据所述用户信息数据及所述关联关系构建无向连通图, 所述无向连 通图中的每一个节点对应一个所述用户信息数据, 每一条无向边对应一个所述关联关系; 第一分配模块, 用于给所述无向连通图中的每一个连通子图分配唯一标识符。 6.根据权利要求5所述的同人识别装置, 其特征在于, 所述装置还包括: 第二获取模块, 用于在所述给所述无向连通图中的每一个连通子图分配唯一标识码的 步骤之后, 周期性获取各个业务域新增的用户信息数据及各个所述用户信息数据之间新增 的关联关系; 添加模块,。

7、 用于将新增的所述用户信息数据作为新的节点添加到所述无向连通图中; 权利要求书 1/2 页 2 CN 112148981 A 2 关联模块, 用于依据新增的所述关联关系将所述无向连通图中彼此关联的所述用户信 息数据通过所述无向边相连接; 第二分配模块, 用于给所述无向连通图中未分配唯一标识符的连通子图分配唯一标识 符; 判断模块, 用于判断所述无向连通图中是否存在具有两个或多个唯一标识符的连通子 图; 若是, 则按照设定规则从所述两个或多个唯一标识符中选择其中一个作为最终的唯一 标识符。 7.根据权利要求6所述的同人识别装置, 其特征在于, 所述判断模块包括判断子模块, 所述判断子模块用于: 。

8、从所述两个或多个唯一标识符中选择分配时间最早的一个作为最终的唯一标识符; 或者, 从所述两个或多个唯一标识符中选择分配时间最晚的一个作为最终的唯一标识符; 或者, 从所述两个或多个唯一标识符中随机选择一个作为最终的唯一标识符。 8.根据权利要求5所述的同人识别装置, 其特征在于, 所述装置还包括: 分析模块, 用于在所述给所述无向连通图中的每一个连通子图分配唯一标识码的步骤 之后, 依据用户信息数据的生成时间, 对每一个连通子图所对应的用户的行为轨迹进行统 计分析, 以确定每一个用户的感兴趣程度; 服务模块, 用于根据所述感兴趣程度, 向对应的用户推送对应的内容信息或提供对应 的客户服务。 9。

9、.一种计算机设备, 包括存储器和处理器, 所述存储器存储有计算机程序, 其特征在 于, 所述处理器执行所述计算机程序时实现如权利要求14中任一项所述的同人识别方 法。 10.一种包含计算机可执行指令的存储介质, 所述计算机可执行指令由计算机处理器 执行, 以实现如权利要求14中任一项所述的同人识别方法。 权利要求书 2/2 页 3 CN 112148981 A 3 同人识别方法、 装置、 设备和存储介质 技术领域 0001 本发明实施例涉及大数据处理技术领域, 尤其涉及一种同人识别方法、 装置、 设备 和存储介质。 背景技术 0002 随着互联网技术的日渐成熟, 人们的消费和行为习惯发生了巨大。

10、的变化, 人们连 入互联网的方式也呈多元发展。 在日常生活中, 用户可以随时随地的通过手机APP、 PC、 微信 小程序、 H5、 O2O中的任意一种方式去连入某公司不同域的业务系统, 使得用户能够浏览、 查 询或咨询相关感兴趣的内容。 相应的, 该公司不同域的业务系统中就会产生同一个用户的 不同行为特征数据。 在未进行处理前, 这些行为特征数据彼此之间可能是孤立的, 不仅无法 利用起来, 而且还不便于管理, 所以出于加强数据管理的目的, 很多公司会建立以 “人” 为中 心的 “一人一档” 数据管理业务, 简单来说就是会将各种业务系统中的行为特征数据进行汇 聚起来, 然后将同一个用户在该公司全。

11、域的行为特征数据串联在一起, 消除数据孤岛。 这个 过程需要应用到同人识别技术, 也就是需要从大量的行为特征数据中快速确定哪些行为特 征数据是属于同一个用户的。 目前, 现有技术中, 业界较多的是通过MapReduce以置信度为 基础, 再通过多轮迭代收敛的方式来实现同人识别的。 MapReduce是一种编程模型, 用于大 规模数据集(大于1TB)的并行运算。 概念 “Map(映射)” 和 “Reduce(归约)” 是它们的主要思 想, 都是从函数式编程语言里借来的, 还有从矢量编程语言里借来的特性。 它极大地方便了 编程人员在不会分布式并行编程的情况下, 将自己的程序运行在分布式系统上。 然。

12、而, 采用 这种方式进行的同人识别存在诸多弊端, 比如实现过程较为繁琐、 技术实现的门槛较高、 可 落地性较差等等。 0003 因此, 对现有的同人识别技术进行改进, 以克服上述缺陷, 或者是研究一种全新的 同人识别技术就显得非常有必要。 发明内容 0004 本发明实施例公开了一种同人识别方法、 装置、 设备和存储介质, 能够引导车辆行 驶, 进而提高用户驾车到达目的地的效率。 0005 第一方面, 提供了一种同人识别方法, 所述方法包括: 0006 获取各个业务域的用户信息数据及各个所述用户信息数据之间的关联关系; 0007 依据所述用户信息数据及所述关联关系构建无向连通图, 所述无向连通图。

13、中的每 一个节点对应一个所述用户信息数据, 每一条无向边对应一个所述关联关系; 0008 给所述无向连通图中的每一个连通子图分配唯一标识符。 0009 进一步地, 所述同人识别方法中, 在所述给所述无向连通图中的每一个连通子图 分配唯一标识码的步骤之后, 所述方法还包括: 0010 周期性获取各个业务域新增的用户信息数据及各个所述用户信息数据之间新增 的关联关系; 说明书 1/11 页 4 CN 112148981 A 4 0011 将新增的所述用户信息数据作为新的节点添加到所述无向连通图中; 0012 依据新增的所述关联关系将所述无向连通图中彼此关联的所述用户信息数据通 过所述无向边相连接;。

14、 0013 给所述无向连通图中未分配唯一标识符的连通子图分配唯一标识符; 0014 判断所述无向连通图中是否存在具有两个或多个唯一标识符的连通子图; 0015 若是, 则按照设定规则从所述两个或多个唯一标识符中选择其中一个作为最终的 唯一标识符。 0016 进一步地, 所述同人识别方法中, 所述按照设定规则从所述两个或多个唯一标识 符中选择其中一个作为最终的唯一标识符的步骤包括: 0017 从所述两个或多个唯一标识符中选择分配时间最早的一个作为最终的唯一标识 符; 0018 或者, 0019 从所述两个或多个唯一标识符中选择分配时间最晚的一个作为最终的唯一标识 符; 0020 或者, 0021。

15、 从所述两个或多个唯一标识符中随机选择一个作为最终的唯一标识符。 0022 进一步地, 所述同人识别方法中, 在所述给所述无向连通图中的每一个连通子图 分配唯一标识码的步骤之后, 所述方法还包括: 0023 依据用户信息数据的生成时间, 对每一个连通子图所对应的用户的行为轨迹进行 统计分析, 以确定每一个用户的感兴趣程度; 0024 根据所述感兴趣程度, 向对应的用户推送对应的内容信息或提供对应的客户服 务。 0025 第二方面, 提供了一种同人识别装置, 所述装置包括: 0026 第一获取模块, 用于获取各个业务域的用户信息数据及各个所述用户信息数据之 间的关联关系; 0027 构建模块, 。

16、用于依据所述用户信息数据及所述关联关系构建无向连通图, 所述无 向连通图中的每一个节点对应一个所述用户信息数据, 每一条无向边对应一个所述关联关 系; 0028 第一分配模块, 用于给所述无向连通图中的每一个连通子图分配唯一标识符。 0029 进一步地, 所述同人识别装置还包括: 0030 第二获取模块, 用于在所述给所述无向连通图中的每一个连通子图分配唯一标识 码的步骤之后, 周期性获取各个业务域新增的用户信息数据及各个所述用户信息数据之间 新增的关联关系; 0031 添加模块, 用于将新增的所述用户信息数据作为新的节点添加到所述无向连通图 中; 0032 关联模块, 用于依据新增的所述关联。

17、关系将所述无向连通图中彼此关联的所述用 户信息数据通过所述无向边相连接; 0033 第二分配模块, 用于给所述无向连通图中未分配唯一标识符的连通子图分配唯一 标识符; 说明书 2/11 页 5 CN 112148981 A 5 0034 判断模块, 用于判断所述无向连通图中是否存在具有两个或多个唯一标识符的连 通子图; 若是, 则按照设定规则从所述两个或多个唯一标识符中选择其中一个作为最终的 唯一标识符。 0035 进一步地, 所述同人识别装置中, 所述判断模块包括判断子模块, 所述判断子模块 用于: 0036 从所述两个或多个唯一标识符中选择分配时间最早的一个作为最终的唯一标识 符; 003。

18、7 或者, 0038 从所述两个或多个唯一标识符中选择分配时间最晚的一个作为最终的唯一标识 符; 0039 或者, 0040 从所述两个或多个唯一标识符中随机选择一个作为最终的唯一标识符。 0041 进一步地, 所述同人识别装置还包括: 0042 分析模块, 用于在所述给所述无向连通图中的每一个连通子图分配唯一标识码的 步骤之后, 依据用户信息数据的生成时间, 对每一个连通子图所对应的用户的行为轨迹进 行统计分析, 以确定每一个用户的感兴趣程度; 0043 服务模块, 用于根据所述感兴趣程度, 向对应的用户推送对应的内容信息或提供 对应的客户服务。 0044 第三方面, 提供了一种计算机设备,。

19、 包括存储器和处理器, 所述存储器存储有计算 机程序, 所述处理器执行所述计算机程序时实现如上任一所述的同人识别方法。 0045 第四方面, 提供了一种包含计算机可执行指令的存储介质, 所述计算机可执行指 令由计算机处理器执行, 以实现如上任一所述的同人识别方法。 0046 与现有技术相比, 本发明实施例具有以下有益效果: 0047 通过利用无向连通图实现同人识别, 能够将同一用户在公司全域的行为特征串联 在一起, 消除数据孤岛, 不仅易理解、 易落地, 而且还可扩展性强、 计算成本低, 有效地解决 了现有技术存在的识别过程繁琐、 技术实现门槛高以及可落地性差的问题, 具有较高的推 广应用价值。

20、。 附图说明 0048 为了更清楚地说明本发明实施例或现有技术中的技术方案, 下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍, 显而易见地, 下面描述中的附图仅仅是本 发明的一些实施例, 对于本领域普通技术人员来讲, 在不付出创造性劳动性的前提下, 还可 以根据这些附图获得其它的附图。 0049 图1是本发明实施例一提供的一种同人识别方法的流程示意图; 0050 图2是本发明实施例一中无向连通图构建过程的示意图; 0051 图3是本发明实施例二提供的一种同人识别方法的流程示意图; 0052 图4是本发明实施例二中无向连通图构建过程的示意图; 0053 图5是本发明实施例二中无向连。

21、通图构建过程的示意图; 0054 图6是本发明实施例三提供的一种同人识别方法的流程示意图; 说明书 3/11 页 6 CN 112148981 A 6 0055 图7是本发明实施例四提供的一种同人识别装置的功能模块示意图; 0056 图8是本发明实施例五提供的一种计算机设备的结构示意图。 具体实施方式 0057 本发明实施例公开了一种同人识别方法、 装置、 设备和存储介质, 能够快速高效地 实现同人识别, 提供一个用户维度完整的信息视图, 以更好地支持用户画像、 潜客挖掘引擎 等下游需求。 0058 下面将结合附图和实施例对本发明的技术方案作进一步的详细说明。 可以理解的 是, 此处所描述的具。

22、体实施例仅仅用于解释本发明, 而非对本发明的限定。 另外还需要说明 的是, 为了便于描述, 附图中仅示出了与本发明相关的部分而非全部结构。 0059 实施例一 0060 有鉴于上述现有的同人识别存在的缺陷, 本发明人基于从事大数据算法处理多年 丰富的实务经验及专业知识, 并配合学理的运用, 积极加以研究创新, 以期创设一种易理 解、 易落地、 可扩展性强以及计算成本低的同人识别方法, 使其更具有实用性。 在经过不断 的研究、 设计并反复试作及改进后, 终于创设出确具实用价值的本发明。 0061 请参阅图1, 图1是本发明实施例公开的一种同人识别方法的流程示意图。 如图1所 示, 该同人识别方法。

23、可以包括以下步骤: 0062 S101、 获取各个业务域的用户信息数据及各个所述用户信息数据之间的关联关 系。 0063 需要说明的是, 所述用户信息数据指的是用户的标识ID(比如设备ID、 手机号码、 IP地址等), 当然根据需要还可以包括浏览时间、 浏览内容等。 0064 由于同一个用户的业务数据可以通过手机APP、 PC、 微信小程序、 H5、 O2O等方式连 入公司不同域的业务系统, 然后每个业务系统都会给该用户一个标识ID去区分不同用户, 那么该用户在不同域的业务系统中就会存在多个不同的标识ID, 为了消除数据孤岛, 本实 施例需要将该用户在公司全域的用户信息数据串联在一起。 006。

24、5 另外, 海量的数据里必然会存在除我们需要的数据之外的杂质, 因此在获取到数 据后, 我们需要对数据进行清洗, 以去除噪声, 才能保证数据的可靠性。 一般来说, 噪音的清 洗方式很多, 比如分箱法、 聚类法和回归法, 不同的去噪方法具有不同的优势, 且也均基本 能够对数据中存在的噪音进行全方位的清理, 但由于现有技术中已多有实现, 且也不是本 实施例的设计重点, 在此就不再一一赘述。 0066 S102、 依据所述用户信息数据及所述关联关系构建无向连通图, 所述无向连通图 中的每一个节点对应一个所述用户信息数据, 每一条无向边对应一个所述关联关系。 0067 需要说明的是, 本实施例先将所有。

25、用户信息数据一一看成是无向连通图上的节 点, 若任意两个用户信息数据之间存在关联关系, 则将存在关联关系的两个用户信息数据 在无向连通图上的所对应的节点用一条无向边进行连接, 从而形成一个完整的无向连通图 结构。 0068 S103、 给所述无向连通图中的每一个连通子图分配唯一标识符。 0069 需要说明的是, 在无向连通图中, 当所有存在关联关系的节点连接了无向边后, 原 本相互之间独立的节点便形成了一个个连通子图。 一个连通子图里可能存在两个或多个具 说明书 4/11 页 7 CN 112148981 A 7 有无向边的节点, 也可能只存在一个节点, 但每一个连通子图里的所有节点均视为同一。

26、个 用户通过不同连入方式在公司不同域的业务系统中留下的行为轨迹。 0070 出于便于区别不同的连通子图的目的, 本实施例将通过GID生成器给每个连通子 图赋予一个稳定、 唯一、 持久的GID(Group ID即组ID), 用来标识每个连通子图。 具体的, 在 GID生成过程中可能涉及新增、 融合等操作, 其中融合指的是原本独立的两连通子图存在关 联关系后合并成一个连通子图, 从而将两个GID整合为一个GID的操作。 本实施例的所有操 作历史都能完整追溯, 为后续的数据分析挖掘提供精准统一的视图。 0071 为了更加清晰的展现本发明实施例的方案实施过程, 下面以一具体实例进行详细 介绍。 007。

27、2 如图2, 假设业务从2020年06月01日开始, 当天从APP的日志、 CRM数据表、 网页日 志、 手机绑定关系等渠道获取到d1、 d3、 ls1、 ls2、 ls3、 m2、 u1、 u2这8条用户信息数据及对应 的6条关联关系, 其中, d代表设备(device), ls代表从网页端登录各个平台的用户唯一标 识, m代表手机号, u代表用户ID。 0073 通过基于该8条用户信息数据及对应的6条关联关系构建无向连通图, 我们可以看 到其中d3和ls3暂时是孤立节点, d1、 u1、 m2、 ls1彼此连通, ls2、 u2彼此连通, 因此, 这一天有 四个连通子图, GID生成器分别。

28、为这4个连通子图分配唯一标识符, 即GID: 0074 G1(d1, u1, m2, ls1), G2(ls2, u2), G3(d3), G4(ls3); 0075 如此, 同一用户在公司不同域的所有业务系统的所有行为都可以用同一个GID, 比 如G1, 来表示, 这样可以将用户的行为串联起来, 为后续数据分析挖掘提供上帝视角。 0076 本发明实施例提供一种同人识别方法, 通过利用无向连通图实现同人识别, 能够 将同一用户在公司全域的行为特征串联在一起, 消除数据孤岛, 不仅易理解、 易落地, 而且 还可扩展性强、 计算成本低, 有效地解决了现有技术存在的识别过程繁琐、 技术实现门槛高 以。

29、及可落地性差的问题, 具有较高的推广应用价值。 0077 实施例二 0078 请参阅图3, 图3是本发明实施例公开的另一种同人识别方法的流程示意图。 本实 施例在实施例一提供的技术方案的基础上, 在给所述无向连通图中的每一个连通子图分配 唯一标识符之后, 对该方法做了进一步优化。 与上述各实施例相同或相应的术语的解释在 此不再赘述, 具体的, 本实施例提供的的方法还可以包括如下步骤: 0079 周期性获取各个业务域新增的用户信息数据及各个所述用户信息数据之间新增 的关联关系; 0080 将新增的所述用户信息数据作为新的节点添加到所述无向连通图中; 0081 依据新增的所述关联关系将所述无向连通。

30、图中彼此关联的所述用户信息数据通 过所述无向边相连接; 0082 给所述无向连通图中未分配唯一标识符的连通子图分配唯一标识符; 0083 判断所述无向连通图中是否存在具有两个或多个唯一标识符的连通子图; 0084 若是, 则按照设定规则从所述两个或多个唯一标识符中选择其中一个作为最终的 唯一标识符。 0085 基于上述优化, 如图3所示, 本实施例提供的一种同人识别方法, 具体可以包括如 下步骤: 说明书 5/11 页 8 CN 112148981 A 8 0086 S201、 获取各个业务域的用户信息数据及各个所述用户信息数据之间的关联关 系。 0087 S202、 依据所述用户信息数据及所。

31、述关联关系构建无向连通图, 所述无向连通图 中的每一个节点对应一个所述用户信息数据, 每一条无向边对应一个所述关联关系。 0088 S203、 给所述无向连通图中的每一个连通子图分配唯一标识符。 0089 S204、 周期性获取各个业务域新增的用户信息数据及各个所述用户信息数据之间 新增的关联关系。 0090 需要说明的是, 公司不同域的业务系统中每天都会新增一些用户信息数据, 该些 用户信息数据需要定时进行维护, 即需要归类到无向连通图中。 其中, 获取的周期时长可以 为一小时、 十二小时、 一天, 本申请中对周期时长的取值不加以限定。 0091 S205、 将新增的所述用户信息数据作为新的。

32、节点添加到所述无向连通图中。 0092 需要说明的是, 周期获取的新增数据中可能存在已经归类好的用户信息数据和/ 或关联关系, 因此需要先将已经归类好的用户信息数据和/或关联关系进行剔除, 以得到未 归类的用户信息数据和/或关联关系, 然后需要将该些未归类数据进行整合。 具体的, 先将 未归类的用户信息数据作为新的节点添加到所述无向连通图中。 0093 S206、 依据新增的所述关联关系将所述无向连通图中彼此关联的所述用户信息数 据通过所述无向边相连接。 0094 需要说明的是, 在将未归类的用户信息数据作为新的节点添加到所述无向连通图 中后, 根据未归类的关联关系, 需要将无向连通图中存在关。

33、联关系的节点通过无向边连接, 使得无向连通图中原本孤立的由单一节点组成的较小的连通子图合并到较大的连通子图 中, 或者是两个或多个较大的连通子图融合为一个更大的连通子图。 0095 S207、 给所述无向连通图中未分配唯一标识符的连通子图分配唯一标识符。 0096 需要说明的是, 未分配GID的连通子图指的是由新增的用户信息数据和/或关联关 系组成的连通子图。 同样的, 通过GID生成器给该新增的连通子图赋予一个稳定、 唯一、 持久 的GID, 以标识该连通子图。 0097 S208、 判断所述无向连通图中是否存在具有两个或多个唯一标识符的连通子图; 若是, 则执行步骤S209, 若否, 则结。

34、束本流程。 0098 需要说明的是, 由于原本孤立的连通子图均具有对应的一个GID, 则在合并后的连 通子图中会存在多个GID, 这非常不便于后续的数据整合与分析, 因此只需要保留其中一个 GID。 0099 S209、 按照设定规则从所述两个或多个唯一标识符中选择其中一个作为最终的唯 一标识符。 0100 在本实施例中, 具体关于保留哪一个GID是可选择的, 比如根据GID的分配时间(生 成时间)或遵从某种既定逻辑。 0101 优选的, 所述步骤S209可进一步包括如下步骤: 0102 从所述两个或多个唯一标识符中选择分配时间最早的一个作为最终的唯一标识 符; 0103 或者, 0104 从。

35、所述两个或多个唯一标识符中选择分配时间最晚的一个作为最终的唯一标识 说明书 6/11 页 9 CN 112148981 A 9 符; 0105 或者, 0106 从所述两个或多个唯一标识符中随机选择一个作为最终的唯一标识符。 0107 需要说明的是, 以分配时间为例, 由于每个GID的分配是有先后顺序的, 因此我们 可以遵从先分配则优先等级高的逻辑, 规定在后续的连通子图合并过程中, 从诸多的GID中 选择分配时间最早的, 也即优先等级最高的GID作为最早的GID。 0108 为了更加清晰的展现本发明实施例的方案实施过程, 下面将在实施例一所举实例 的基础上进行进一步的完善。 0109 先假设。

36、实施例一所举实例中GID的分配时间从早到晚依次为: G1、 G2、 G3、 G4; 0110 如图4, 2020年06月02日新增的节点及关联关系为: (d3, u3), (m5), (ls3, u2), 现需 要将这些节点加到前一天固化下来的无向连通图中。 0111 首先, 由于新增了(d3, u3)这条无向边的关联关系, 无向连通图中的d3不再是孤立 的节点, 且由于d3已经有了GID, 即G3, 因此不再分配新的GID, 而是复用已有的G3, 即得G3 (d3, u3); 0112 其次, 由于新增了(ls3, u2)这条无向边的关联关系, ls3也不再是孤立节点, 但ls3 在前一天就。

37、已经出现过, 且已分配有GID, 即G4, 因此此时面临着G2(ls2, u2)和G4(ls3)合并 的问题。 示例性的, 由于G2的分配时间早于G4, 则为了让GID尽量稳定, 当G2需要与G4合并 时, 将留下分配时间更早的G2作为连通子图(ls2, u2, ls3)的GID; 0113 最后, 由于新增的m5在这一天没有别的节点与之存在关联关系, 因此暂时将其作 为孤立节点至于无向连通图中, 然后GID生成器为这个节点分配GID, 即得G5(m5)这一个连 通子图; 0114 如此, 这一天同人识别的结果是: G1(d1, u1, m2, ls1), G2(ls2, u2, ls3), 。

38、G3(d3, u3), G5(m5); 0115 如图5, 2020年06月03日新增的节点及关联关系为: (ls1, u2), (m5, u3), (ls3, u7), (d6, u6), 现需要将这些节点加到前一天固化下来的无向连通图中。 0116 首先, 依据(ls1, u2)这一条关联关系可将G1(d1, u1, m2, ls1)和G2(ls2, u2, ls3)这 两个连通子图融合成一个更大的连通子图, G1的分配时间比G2早, 所以留下G1作为融合后 的连通子图(d1, u1, m2, ls1, ls2, u2, ls3)的GID; 0117 其次, (m5, u3)这一条关联关系。

39、可将G3(d3, u3)这个连通子图和原本是孤立节点的 G5(m5)融合成一个更大的连通子图, G3的分配时间比G5早, 所以留下G3作为融合后的连通 子图(m5, u3, d3)的GID; 0118 再者, 对于(ls3, u7)这条关联关系, 由于ls3已经是连通子图G1的节点, 因此新增 的节点u7将加入G1中; 0119 最后, 对于(d6, u6)这条关联关系, d6和u6均为新增的节点, GID生成器将为这2个 节点分配新的GID, 即G6(d6, u6); 0120 如此, 这一天同人识别的结果是: G1(d1, u1, m2, ls1, ls2, u2, ls3, u7), G。

40、3(m5, u3, d3), G6(d6, u6)。 0121 本发明实施例除了具备实施例一的有益效果之外, 还解决了在初始之日起每天都 会存在的新增数据的归类问题, 即通过定期将新增的用户信息数据和/或关联关系合并到 说明书 7/11 页 10 CN 112148981 A 10 先前固化下来的无向连通图中, 可使得每个人的所有行为轨迹最终都尽量地整合到一个连 通子图中, 可提升数据分析的准确性。 0122 实施例三 0123 请参阅图6, 图6是本发明实施例公开的另一种同人识别方法的流程示意图。 本实 施例在实施例一提供的技术方案的基础上, 在给所述无向连通图中的每一个连通子图分配 唯一标。

41、识符之后, 对该方法做了进一步优化。 与上述各实施例相同或相应的术语的解释在 此不再赘述, 具体的, 本实施例提供的的方法还可以包括如下步骤: 0124 依据用户信息数据的生成时间, 对每一个连通子图所对应的用户的行为轨迹进行 统计分析, 以确定每一个用户的感兴趣程度; 0125 根据所述感兴趣程度, 向对应的用户推送对应的内容信息或提供对应的客户服 务。 0126 基于上述优化, 如图6所示, 本实施例提供的一种同人识别方法, 具体可以包括如 下步骤: 0127 S301、 获取各个业务域的用户信息数据及各个所述用户信息数据之间的关联关 系。 0128 S302、 依据所述用户信息数据及所述。

42、关联关系构建无向连通图, 所述无向连通图 中的每一个节点对应一个所述用户信息数据, 每一条无向边对应一个所述关联关系。 0129 S303、 给所述无向连通图中的每一个连通子图分配唯一标识符。 0130 S304、 依据用户信息数据的生成时间, 对每一个连通子图所对应的用户的行为轨 迹进行统计分析, 以确定每一个用户的感兴趣程度。 0131 需要说明的是, 如果通过对用户的行为轨迹进行统计分析得知一个用户近期较为 频繁的以各种连入方式访问公司不同域的业务系统, 则说明该用户是感兴趣的, 因此可列 为高度可成交客户进行对待。 0132 S305、 根据所述感兴趣程度, 向对应的用户推送对应的内容。

43、信息或提供对应的客 户服务。 0133 需要说明的是, 关于什么样的感兴趣程度推送何种内容信息或提供何种客户服务 的做法, 具体可以采用阈值匹配的方式, 即当感兴趣程度达到某个阈值时, 执行该阈值所对 应的客服操作, 比如推送购车优惠消息、 最近网点和/或人工客服电话联系。 0134 本发明实施例除了具备实施例一的有益效果之外, 还由于分析了用户的行为轨 迹, 能够获悉用户的感兴趣程度, 使得可更有针对性的进行内容推送和客户服务, 提高了用 户的使用体验。 0135 实施例四 0136 请参阅附图7, 为本发明实施例六提供的一种同人识别装置的功能模块示意图, 该 装置适用于执行本发明实施例提供。

44、的同人识别方法。 该装置具体包含如下功能模块: 0137 第一获取模块41, 用于获取各个业务域的用户信息数据及各个所述用户信息数据 之间的关联关系; 0138 构建模块42, 用于依据所述用户信息数据及所述关联关系构建无向连通图, 所述 无向连通图中的每一个节点对应一个所述用户信息数据, 每一条无向边对应一个所述关联 关系; 说明书 8/11 页 11 CN 112148981 A 11 0139 第一分配模块43, 用于给所述无向连通图中的每一个连通子图分配唯一标识符。 0140 优选的, 上述装置还包括: 0141 第二获取模块, 用于在所述给所述无向连通图中的每一个连通子图分配唯一标识。

45、 码的步骤之后, 周期性获取各个业务域新增的用户信息数据及各个所述用户信息数据之间 新增的关联关系; 0142 添加模块, 用于将新增的所述用户信息数据作为新的节点添加到所述无向连通图 中; 0143 关联模块, 用于依据新增的所述关联关系将所述无向连通图中彼此关联的所述用 户信息数据通过所述无向边相连接; 0144 第二分配模块, 用于给所述无向连通图中未分配唯一标识符的连通子图分配唯一 标识符; 0145 判断模块, 用于判断所述无向连通图中是否存在具有两个或多个唯一标识符的连 通子图; 若是, 则按照设定规则从所述两个或多个唯一标识符中选择其中一个作为最终的 唯一标识符。 0146 优选。

46、的, 上述装置中, 所述判断模块包括判断子模块, 所述判断子模块用于: 0147 从所述两个或多个唯一标识符中选择分配时间最早的一个作为最终的唯一标识 符; 0148 或者, 0149 从所述两个或多个唯一标识符中选择分配时间最晚的一个作为最终的唯一标识 符; 0150 或者, 0151 从所述两个或多个唯一标识符中随机选择一个作为最终的唯一标识符。 0152 优选的, 上述装置还包括: 0153 分析模块, 用于在所述给所述无向连通图中的每一个连通子图分配唯一标识码的 步骤之后, 依据用户信息数据的生成时间, 对每一个连通子图所对应的用户的行为轨迹进 行统计分析, 以确定每一个用户的感兴趣程。

47、度; 0154 服务模块, 用于根据所述感兴趣程度, 向对应的用户推送对应的内容信息或提供 对应的客户服务。 0155 本发明实施例提供一种同人识别装置, 通过利用无向连通图实现同人识别, 能够 将同一用户在公司全域的行为特征串联在一起, 消除数据孤岛, 不仅易理解、 易落地, 而且 还可扩展性强、 计算成本低, 有效地解决了现有技术存在的识别过程繁琐、 技术实现门槛高 以及可落地性差的问题, 具有较高的推广应用价值。 0156 上述装置可执行本发明任意实施例所提供的方法, 具备执行方法相应的功能模块 和有益效果。 0157 实施例五 0158 图8为本发明实施例五提供的一种计算机设备的结构示。

48、意图。 图8示出了适于用来 实现本发明实施方式的示例性计算机设备12的框图。 图8显示的计算机设备12仅仅是一个 示例, 不应对本发明实施例的功能和使用范围带来任何限制。 0159 如图8所示, 计算机设备12以通用计算设备的形式表现。 计算机设备12的组件可以 说明书 9/11 页 12 CN 112148981 A 12 包括但不限于: 一个或者多个处理器或者处理单元16, 系统存储器28, 连接不同系统组件 (包括系统存储器28和处理单元16)的总线18。 0160 总线18表示几类总线结构中的一种或多种, 包括存储器总线或者存储器控制器, 外围总线, 图形加速端口, 处理器或者使用多种。

49、总线结构中的任意总线结构的局域总线。 举 例来说, 这些体系结构包括但不限于工业标准体系结构(ISA)总线, 微通道体系结构(MAC) 总线, 增强型ISA总线、 视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。 0161 计算机设备12典型地包括多种计算机系统可读介质。 这些介质可以是任何能够被 计算机设备12访问的可用介质, 包括易失性和非易失性介质, 可移动的和不可移动的介质。 0162 系统存储器28可以包括易失性存储器形式的计算机系统可读介质, 例如随机存取 存储器(RAM)30和/或高速缓存存储器32。 计算机设备12可以进一步包括其它可移动/不可 移动的、 易。

50、失性/非易失性计算机系统存储介质。 仅作为举例, 存储系统34可以用于读写不 可移动的、 非易失性磁介质(图8未显示, 通常称为 “硬盘驱动器” )。 尽管图8中未示出, 可以 提供用于对可移动非易失性磁盘(例如 “软盘” )读写的磁盘驱动器, 以及对可移动非易失性 光盘(例如CD-ROM, DVD-ROM或者其它光介质)读写的光盘驱动器。 在这些情况下, 每个驱动 器可以通过一个或者多个数据介质接口与总线18相连。 存储器28可以包括至少一个程序产 品, 该程序产品具有一组(例如至少一个)程序模块, 这些程序模块被配置以执行本发明各 实施例的功能。 0163 具有一组(至少一个)程序模块42。

展开阅读全文
内容关键字: 同人 识别 方法 装置 设备 存储 介质
关于本文
本文标题:同人识别方法、装置、设备和存储介质.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/10120026.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1 
 


收起
展开