基于虚拟对象的目标事件触发方法及装置.pdf

上传人:南*** 文档编号:14252329 上传时间:2023-11-24 格式:PDF 页数:17 大小:939.49KB
收藏 版权申诉 举报 下载
基于虚拟对象的目标事件触发方法及装置.pdf_第1页
第1页 / 共17页
基于虚拟对象的目标事件触发方法及装置.pdf_第2页
第2页 / 共17页
基于虚拟对象的目标事件触发方法及装置.pdf_第3页
第3页 / 共17页
文档描述:

《基于虚拟对象的目标事件触发方法及装置.pdf》由会员分享,可在线阅读,更多相关《基于虚拟对象的目标事件触发方法及装置.pdf(17页完成版)》请在专利查询网上搜索。

1、(19)国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 202310795861.2(22)申请日 2023.07.01(71)申请人 世优(北京)科技有限公司地址 100020 北京市朝阳区日坛北路17号院2号楼4层4017(72)发明人 张青辉陈朋杰(51)Int.Cl.H04N 21/43(2011.01)H04N 21/439(2011.01)H04N 21/81(2011.01)H04N 21/845(2011.01)G10L 13/08(2013.01)(54)发明名称基于虚拟对象的目标事件触发方法及装置(57)摘要本申请提供了一种基于虚拟。

2、对象的目标事件触发方法及装置,其中,该方法包括:获取虚拟对象的待播放的文本内容,从所述文本内容中提取与目标事件相关联的关键字,在所述关键字的位置设置第一触发标记;将设置了所述第一触发标记的所述文本内容转换为待播放的语音数据,从所述待播放的语音数据中提取多个语音特征;获取用于驱动所述虚拟对象的驱动数据,从所述驱动数据中提取多个驱动特征,并将所述多个语音特征和所述第二触发标记映射到所述多个驱动特征上;基于映射后的所述多个驱动特征来驱动所述虚拟对象,并在识别到所述第三触发标记时,触发所述目标事件。本申请解决了虚拟对象直播时交互节点和直播数据流的画面内容不一致的技术问题。权利要求书2页 说明书10页 。

3、附图4页CN 116506674 A2023.07.28CN 116506674 A1.一种基于虚拟对象的目标事件触发方法,其特征在于,包括:获取虚拟对象的待播放的文本内容,从所述文本内容中提取与目标事件相关联的关键字,在所述关键字的位置设置第一触发标记;将设置了所述第一触发标记的所述文本内容转换为待播放的语音数据,从所述待播放的语音数据中提取多个语音特征,其中,所述多个语音特征中的部分语音特征携带有与所述第一触发标记对应的第二触发标记;获取用于驱动所述虚拟对象的驱动数据,从所述驱动数据中提取多个驱动特征,并将所述多个语音特征和所述第二触发标记映射到所述多个驱动特征上,其中,映射后的所述多个驱。

4、动特征中的部分驱动特征携带有与所述第二触发标记对应的第三触发标记;基于映射后的所述多个驱动特征来驱动所述虚拟对象,并在识别到所述第三触发标记时,触发所述目标事件。2.根据权利要求1所述的方法,将所述多个语音特征和所述第二触发标记映射到所述多个驱动特征上,包括:通过对所述多个语音特征和所述多个驱动特征进行插值来使得所述多个语音特征和所述多个驱动特征在时间上对齐;在对齐后的所述多个驱动特征上设置与所述第二触发标记所在的时间点对应的所述第三触发标记。3.根据权利要求2所述的方法,通过对所述多个语音特征和所述多个驱动特征进行插值来使得所述多个语音特征和所述多个驱动特征在时间上对齐,包括:将所述多个语音。

5、特征和所述多个驱动特征映射到同一时间轴上;利用线性插值方法,在所述时间轴上对所述多个语音特征和所述多个驱动特征分别进行插值操作,以在时间上对齐所述多个语音特征和所述多个驱动特征。4.根据权利要求3所述的方法,利用线性插值方法,在所述时间轴上对所述多个语音特征和所述多个驱动特征分别进行插值操作,以在时间上对齐所述多个语音特征和所述多个驱动特征,包括:确定所述多个语音特征在所述时间轴上的第一时间点的位置,根据所述第一时间点的位置,分别计算所述多个语音特征中两个相邻语音特征之间的线性权重,并基于所述线性权重进行插值操作;确定所述多个驱动特征在所述时间轴上的第二时间点的位置,根据所述第二时间点的位置,。

6、在所述多个驱动特征中两个相邻驱动特征之间进行插值操作,使得所述多个驱动特征在时间上对齐所述多个语音特征。5.根据权利要求1所述的方法,基于映射后的所述多个驱动特征来驱动所述虚拟对象,并在识别到所述第三触发标记时,触发所述目标事件,包括:针对映射后的所述多个驱动特征中的每个驱动特征,识别该驱动特征是否存在相应的所述第三触发标记;在存在所述第三触发标记的情况下,根据该驱动特征来驱动所述虚拟对象,使所述虚拟对象执行相应的动作,并触发所述目标事件;在不存在所述第三触发标记的情况下,直接根据该驱动特征来驱动所述虚拟对象。6.根据权利要求5所述的方法,其特征在于,根据该驱动特征来驱动所述虚拟对象,使权利要。

7、求书1/2 页2CN 116506674 A2所述虚拟对象执行相应的动作,并触发所述目标事件,包括:通过映射函数将该驱动特征映射到所述虚拟对象的控制参数上;基于所述控制参数和触发所述目标事件的触发指令,来生成所述虚拟对象的直播数据流。7.根据权利要求1所述的方法,其特征在于,从所述待播放的语音数据中提取多个语音特征,包括:从所述待播放的语音数据中提取多个语音特征,得到语音特征向量矩阵;在所述语音特征向量矩阵中的与所述第一触发标记的位置对应的语音特征向量上设置所述第二触发标记。8.根据权利要求1所述的方法,其特征在于,从所述文本内容中提取与目标事件相关联的关键字,在所述关键字的位置设置第一触发标。

8、记,包括:使用字符串匹配方法从所述文本内容中查找所述关键字在所述文本内容中的出现位置;在所述出现位置上设置所述第一触发标记,其中,所述第一触发标记设置在所述关键字后。9.一种基于虚拟对象的目标事件触发装置,其特征在于,包括:获取模块,被配置为获取虚拟对象的待播放的文本内容,从所述文本内容中提取与目标事件相关联的关键字,在所述关键字的位置设置第一触发标记;语音转换模块,被配置为将设置了所述第一触发标记的所述文本内容转换为待播放的语音数据,从所述待播放的语音数据中提取多个语音特征,其中,所述多个语音特征中的部分语音特征携带有与所述第一触发标记对应的第二触发标记;映射模块,被配置为获取用于驱动所述虚。

9、拟对象的驱动数据,从所述驱动数据中提取多个驱动特征,并将所述多个语音特征和所述第二触发标记映射到所述多个驱动特征上,其中,映射后的所述多个驱动特征中的部分驱动特征携带有与所述第二触发标记对应的第三触发标记;触发模块,被配置为基于映射后的所述多个驱动特征来驱动所述虚拟对象,并在识别到所述第三触发标记时,触发所述目标事件。10.一种计算机可读存储介质,其上存储有程序,其特征在于,在所述程序运行时,使得计算机执行如权利要求1至8中任一项所述的方法。权利要求书2/2 页3CN 116506674 A3基于虚拟对象的目标事件触发方法及装置技术领域0001本申请涉及数据处理技术领域,具体而言,涉及一种基于。

10、虚拟对象的目标事件触发方法及装置。背景技术0002随着计算机技术和互联网技术的进步,虚拟对象在生活、娱乐等领域提供了多项功能和服务。例如,在数字直播间中利用虚拟对象进行实时讲解是一种应用方式。然而,虚拟对象在进行直播讲解时需要在特定的情境下触发一些与业务相关的指令。例如,在虚拟对象进行讲解时,当其提到某个产品时,用户界面会弹出该产品的购买链接或相关推荐。因此,在虚拟对象的讲解过程中,如何准确触发相应的业务行为,以确保虚拟对象的讲解与触发指令的同步,成为亟待解决的技术问题。0003在一些相关技术中,虚拟对象执行自动讲解时,当遇到需要触发直播间内交互的节点时,直播运营人员根据直播内容或预定的时间,。

11、在后台手动触发相应的交互。然而,由于人为触发的误差,可能导致交互节点与直播流内容不一致,触发过早或延迟。甚至人为失误可能导致指令未能准确触发。0004在另一些相关技术中,采用定时任务的方式,在预定的时间执行脚本以触发直播间内交互行为对应的触发指令。然而,由于虚拟对象直播流画面的出现时间难以准确预估,且虚拟对象直播剧本内容可能随时调整,这增加了准确预估的难度。因此,采用定时任务在指定画面触发指令的方案可能导致画面和指令触发时机的不一致问题。0005针对上述的问题,目前尚未提出有效的解决方案。发明内容0006本申请实施例提供了一种基于虚拟对象的目标事件触发方法及装置,以至少解决现有技术中由于触发目。

12、标事件的触发指令存在时间上的误差导致虚拟对象直播时交互节点和直播数据流的画面内容不一致的技术问题。0007根据本申请实施例的一个方面,提供了一种基于虚拟对象的目标事件触发方法,该方法包括:获取虚拟对象的待播放的文本内容,从所述文本内容中提取与目标事件相关联的关键字,在所述关键字的位置设置第一触发标记;将设置了所述第一触发标记的所述文本内容转换为待播放的语音数据,从所述待播放的语音数据中提取多个语音特征,其中,所述多个语音特征中的部分语音特征携带有与所述第一触发标记对应的第二触发标记;获取用于驱动所述虚拟对象的驱动数据,从所述驱动数据中提取多个驱动特征,并将所述多个语音特征和所述第二触发标记映射。

13、到所述多个驱动特征上,其中,映射后的所述多个驱动特征中的部分驱动特征携带有与所述第二触发标记对应的第三触发标记;基于映射后的所述多个驱动特征来驱动所述虚拟对象,并在识别到所述第三触发标记时,触发所述目标事件。0008根据本申请实施例的另一方面,还提供了一种基于虚拟对象的目标事件触发装说明书1/10 页4CN 116506674 A4置,包括获取模块,被配置为获取虚拟对象的待播放的文本内容,从所述文本内容中提取与目标事件相关联的关键字,在所述关键字的位置设置第一触发标记;语音转换模块,被配置为将设置了所述第一触发标记的所述文本内容转换为待播放的语音数据,从所述待播放的语音数据中提取多个语音特征,。

14、其中,所述多个语音特征中的部分语音特征携带有与所述第一触发标记对应的第二触发标记;映射模块,被配置为获取用于驱动所述虚拟对象的驱动数据,从所述驱动数据中提取多个驱动特征,并将所述多个语音特征和所述第二触发标记映射到所述多个驱动特征上,其中,映射后的所述多个驱动特征中的部分驱动特征携带有与所述第二触发标记对应的第三触发标记;触发模块,被配置为基于映射后的所述多个驱动特征来驱动所述虚拟对象,并在识别到所述第三触发标记时,触发所述目标事件。0009在本申请实施例中,获取虚拟对象的待播放的文本内容,从所述文本内容中提取与目标事件相关联的关键字,在所述关键字的位置设置第一触发标记;将设置了所述第一触发标。

15、记的所述文本内容转换为待播放的语音数据,从所述待播放的语音数据中提取多个语音特征;获取用于驱动所述虚拟对象的驱动数据,从所述驱动数据中提取多个驱动特征,并将所述多个语音特征和所述第二触发标记映射到所述多个驱动特征上;基于映射后的所述多个驱动特征来驱动所述虚拟对象,并在识别到所述第三触发标记时,触发所述目标事件。通过上述方案,解决了现有技术中由于触发目标事件的触发指令存在时间上的误差导致虚拟对象直播时交互节点和直播数据流的画面内容不一致的技术问题。附图说明0010构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在。

16、附图中:图1是根据本申请实施例的一种基于虚拟对象的目标事件触发方法的流程图;图2是根据本申请实施例的另一种基于虚拟对象的目标事件触发方法的流程图;图3是根据本申请实施例的一种提取多个驱动特征的方法的流程图;图4是根据本申请实施例的一种将语音特征和第二触发标记映射到驱动特征上的方法的流程图;图5是根据本申请实施例的一种驱动虚拟对象并触发目标事件的方法的流程图;图6是根据本申请实施例的一种基于虚拟对象的目标事件触发装置的结构示意图;图7示出了适于用来实现本公开实施例的电子设备的结构示意图。具体实施方式0011需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附。

17、图并结合实施例来详细说明本申请。0012需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。0013除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表说明书2/10 页5CN 116506674 A5达式和数值不限制本申请的范围。同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。对于相关领域普通。

18、技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。应注意到 :相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。0014实施例1本申请实施例提供了一种基于虚拟对象的目标事件触发方法的流程图,如图1所示,该方法包括以下步骤:步骤S102,获取虚拟对象的待播放的文本内容,从所述文本内容中提取与目标事件相关联的关键字,在所述关键字的位置设置第。

19、一触发标记。0015使用字符串匹配方法从所述文本内容中查找所述关键字在所述文本内容中的出现位置;在所述出现位置上设置所述第一触发标记,其中,所述第一触发标记设置在所述关键字后。0016本实施例中,提取与目标事件相关联的关键字可以帮助确定虚拟对象需要执行的具体动作或触发的事件。这些关键字可以是指令、触发条件或特定内容的标识符。此外,通过在关键字的位置设置第一触发标记,可以准确标记与目标事件相关的部分。这有助于在后续步骤中进行进一步的处理和驱动。0017步骤S104,将设置了所述第一触发标记的所述文本内容转换为待播放的语音数据,从所述待播放的语音数据中提取多个语音特征,其中,所述多个语音特征中的部。

20、分语音特征携带有与所述第一触发标记对应的第二触发标记。0018首先,将包含第一触发标记的文本内容传入语音合成系统,该系统将文本转换为相应的语音数据。这个过程可以使用文本到语音(TTS)技术来完成,其中文本被转换成具有自然语音的音频。接着,使用语音信号处理技术,对待播放的语音数据进行分析和处理,以提取多个语音特征。最后,将提取得到的语音特征组织成一个特征向量矩阵。根据第一触发标记的位置,定位到与其对应的语音特征向量,并在该向量上设置第二触发标记。第二触发标记可以是一个特殊的标记值或者标记位,用于表示该语音特征向量与第一触发标记相关联。0019本实施例中,将提取得到的语音特征组织成特征向量矩阵,并。

21、根据第一触发标记的位置定位到与其对应的语音特征向量。在该向量上设置第二触发标记,用于表示该语音特征向量与第一触发标记的关联。这样的标记设置可以帮助标识和处理特定事件或信息,为后续的分析和应用提供更精确的定位和参考。0020步骤S106,获取用于驱动所述虚拟对象的驱动数据,从所述驱动数据中提取多个驱动特征,并将所述多个语音特征和所述第二触发标记映射到所述多个驱动特征上,其中,映射后的所述多个驱动特征中的部分驱动特征携带有与所述第二触发标记对应的第三触发标记。0021首先,获取驱动数据,并从驱动数据中提取多个驱动特征。0022驱动数据可以是各种形式的输入数据,例如传感器数据、用户输入等。从驱动数据。

22、说明书3/10 页6CN 116506674 A6中提取多个驱动特征,以捕捉与驱动行为相关的有用信息。驱动特征可以包括但不限于时间、位置、速度、方向、力度、声音、图像等方面的特征。0023接着,将所述多个语音特征和所述第二触发标记映射到所述多个驱动特征。0024通过对所述多个语音特征和所述多个驱动特征进行插值来使得所述多个语音特征和所述多个驱动特征在时间上对齐;在对齐后的所述多个驱动特征上设置与所述第二触发标记所在的时间点对应的所述第三触发标记。0025例如,将所述多个语音特征和所述多个驱动特征映射到同一时间轴上;利用线性插值方法,在所述时间轴上对所述多个语音特征和所述多个驱动特征分别进行插值。

23、操作,以在时间上对齐所述多个语音特征和所述多个驱动特征。具体地,确定所述多个语音特征在所述时间轴上的第一时间点的位置,根据所述第一时间点的位置,分别计算所述多个语音特征中两个相邻语音特征之间的线性权重,并基于所述线性权重进行插值操作;确定所述多个驱动特征在所述时间轴上的第二时间点的位置,在所述多个驱动特征中两个相邻驱动特征之间进行插值操作,使得所述多个驱动特征在时间上对齐所述多个语音特征。0026本实施例通过对多个语音特征和多个驱动特征进行插值,可以将它们在时间轴上对齐。这样做的好处是能够确保语音特征和驱动特征在相同的时间点上对应,从而实现更准确的数据分析和处理。此外,对齐语音特征和驱动特征可。

24、以提高数据的一致性。通过插值和对齐,可以确保语音特征和驱动特征之间的相关性和一致性,从而更好地理解和分析数据。最后,在对齐后的驱动特征上设置与第二触发标记所在时间点对应的第三触发标记。这有助于在特定时间点进行标记或识别特定事件,从而更好地理解和利用数据。0027步骤S108,基于映射后的所述多个驱动特征来驱动所述虚拟对象,并在识别到所述第三触发标记时,触发所述目标事件。0028针对映射后的所述多个驱动特征中的每个驱动特征,识别该驱动特征是否存在相应的所述第三触发标记;在存在所述第三触发标记的情况下,根据该驱动特征来驱动所述虚拟对象,使所述虚拟对象执行相应的动作,并触发所述目标事件;在不存在所述。

25、第三触发标记的情况下,直接根据该驱动特征来驱动所述虚拟对象。例如,通过映射函数将该驱动特征映射到所述虚拟对象的控制参数上;基于所述控制参数和触发所述目标事件的触发指令,来生成所述虚拟对象的数据流。0029本实施例中,基于映射后的多个驱动特征,能够驱动虚拟对象执行相应的动作。通过将驱动特征与虚拟对象的控制参数相关联,可以实现对虚拟对象的精确控制和操作。此外,通过检测驱动特征中是否存在对应的第三触发标记,可以确定是否需要触发特定的事件或操作。这有助于在适当的时机触发虚拟对象的目标事件,使得触发的目标事件和直播视频流的内容相匹配。0030实施例2本申请实施例提供了另一种基于虚拟对象的目标事件触发方法。

26、的流程图,如图2所示,该方法包括以下步骤:步骤S202,从待播放的文本内容中提取与目标事件相关的关键字,并在关键字位置设置第一触发标记。0031获取待播放的虚拟对象的文本内容。针对目标事件,确定与之相关的关键字。这些关键字可以是指令、触发条件或特定内容的标识符。关键字的选择应该能够准确地表示目说明书4/10 页7CN 116506674 A7标事件。例如,可以是“链接”或“红包”等。然后,使用字符串匹配方法,从文本内容中查找关键字的出现位置。例如,可以使用字符串搜索算法,如KMP算法或正则表达式等。在关键字的位置设置第一触发标记,以便后续步骤能够准确地识别与目标事件相关的部分。完成关键字提取和。

27、第一触发标记设置后,文本内容中的关键字位置将被准确标记,以便后续步骤能够根据这些标记进行进一步处理和驱动。0032步骤S204,将设置了第一触发标记的文本内容转换为待播放的语音数据,并提取多个语音特征。0033将获取的文本内容传入语音合成系统。语音合成系统使用文本到语音(TTS)技术,将文本转换为相应的语音数据。这个过程可以通过调用适当的语音合成API或库来实现。语音合成系统会根据输入的文本内容生成具有自然语音的音频。随后,使用语音信号处理技术对待播放的语音数据进行分析和处理,以提取多个语音特征。0034最后,将提取得到的多个语音特征组织成一个特征向量矩阵。每个语音特征可以表示为一个向量,将这。

28、些向量按照时间顺序排列,形成一个特征向量矩阵。这样的特征向量矩阵将提供有关语音数据的详细信息,为后续的处理和驱动步骤提供基础。通过执行以上步骤,能够将设置了第一触发标记的文本内容转换为携带有与第一触发标记对应的第二触发标记的特征向量矩阵。0035步骤S206,获取用于驱动虚拟对象的驱动数据,并从中提取多个驱动特征。0036如图3所示,提取多个驱动特征的方法可以包括如下步骤:步骤S2062,获取用于驱动虚拟对象的驱动数据。0037获取用于驱动虚拟对象的驱动数据,其中,驱动数据可以是各种形式的输入数据,如传感器数据、用户输入等。0038步骤S2064,从获取的驱动数据中提取多个驱动特征。0039驱。

29、动特征是与驱动行为相关的有用信息,用于控制虚拟对象的行为。驱动特征包括但不限于:时间,指示当前的时间戳或时间段,用于控制虚拟对象在不同时间点执行不同的动作。位置,指示虚拟对象的位置信息,可以是二维坐标或三维坐标,用于控制虚拟对象在空间中的移动。速度,指示虚拟对象的运动速度,用于控制虚拟对象的运动快慢。方向,指示虚拟对象的朝向或运动方向,用于控制虚拟对象的朝向或路径。力度,指示虚拟对象的力度或强度,用于控制虚拟对象的力量大小或动作幅度。声音,指示声音特征,如音量、音调等,可以用于控制虚拟对象的声音表现。图像,指示虚拟对象的视觉特征,如颜色、形状等,可以用于控制虚拟对象的外观。0040在一些实施例。

30、中,对于时间、位置、速度、方向等连续型的特征,可以进行统计分析,如计算均值、方差、最大值、最小值等。对于声音、图像等离散型的特征,可以采用相应的信号处理或图像处理方法,如频谱分析、颜色直方图等。0041将提取得到的多个驱动特征转换成特征向量或特征向量的形式,以便后续使用。特征向量可以是一维数组或矩阵,其中每个元素对应一个驱动特征的值。对于每个驱动特征,可以根据实际需求进行标准化或归一化处理,以确保它们具有相似的尺度或范围。这样可以避免某些特征对模型或系统的影响过大。在提取特征的过程中,可以根据需要进行特征选择或降维处理,以减少数据维度和冗余,提高计算效率和模型性能。0042步骤S208,将语音。

31、特征和第二触发标记映射到驱动特征上。说明书5/10 页8CN 116506674 A80043如图4所示,将语音特征和第二触发标记映射到驱动特征上的方法包括以下步骤:步骤S2082,获取第二触发标记的位置信息。0044第二触发标记是用于标记与目标事件相关的标记。通过识别和定位第二触发标记在特征向量矩阵中的位置,可以确定与目标事件相关的触发时机。0045步骤S2084,将第二触发标记映射到驱动特征上。0046根据第二触发标记的位置,可以定位到与其对应的驱动特征向量,并在该向量上设置第三触发标记。第三触发标记可以是一个特殊的标记值或者标记位,用于表示该驱动特征向量与第二触发标记相关联。映射后的驱动。

32、特征可以是一维数组或矩阵,其中每个元素对应一个驱动特征的值。0047为了实现驱动特征的映射,需要进行数据对齐或插值操作,以使语音特征和驱动特征在时间上保持一致。可以使用插值方法将语音特征和驱动特征映射到同一时间轴上,并在对齐后的驱动特征上设置与第二触发标记所在的时间点对应的第三触发标记。0048具体地说,首先通过插值方法对齐语音特征和驱动特征。在语音特征上,根据已知的时间点或时间段,获取相应的语音特征值。在驱动特征上,找到与该时间点或时间段最接近的位置,并使用插值方法计算出该位置的驱动特征值。然后,将插值后的驱动特征值与语音特征值进行对齐,使它们在时间上保持一致。0049假设驱动特征为Y,可以。

33、使用以下公式对驱动特征Y进行插值操作:0050其中,Y(tnew)是插值后的驱动特征在时间点 tnew处的值,ci是插值多项式的系数,ti是原始驱动特征的第i 个样本点所对应的时间点,tj是原始驱动特征的第j 个样本点所对应的时间点,n表示插值中使用的数据点的数量,即原始驱动特征的样本点个数。0051在本实施例中,通过上述插值对齐方法,可以将语音特征和驱动特征映射到同一时间轴上,使它们在时间上保持一致。这样可以确保语音和驱动特征的对应关系准确无误。在另外一些实施例中,还可以通过近邻数据点的插值计算,使驱动特征值在时间上平滑变化。这有助于减少突变和噪声对特征分析的干扰,使得特征更加连续和可靠。0。

34、052接着,在插值对齐之后,设置第三触发标记。例如可以通过以下公式来设置第三触发标记:0053其中,Yi,j 表示驱动特征矩阵中第 i 行、第j 列的元素,Yi,j表示原始驱动特征矩阵中对应位置的元素,w表示权重,f(j)表示第三触发标记,ttrigger为第二触发标记的位置。0054本实施例,通过数据对齐或插值操作,可以将语音特征和驱动特征在时间上对齐,使它们具有相同的时间分辨率。这有助于在后续的分析和处理过程中保持数据的一致性和可比性。通过在对齐后的驱动特征上设置第三触发标记,可以表示该驱动特征与第二触发标记相关联。这样可以标记出与语音特征对应的驱动特征的位置,方便后续的特征分析和处理。说。

35、明书6/10 页9CN 116506674 A90055步骤S210,基于映射后的多个驱动特征来驱动虚拟对象,并触发目标事件。0056如图5所示,驱动虚拟对象并触发目标事件的方法包括以下步骤:步骤S2102,获取映射后的多个驱动特征。0057获取映射后的多个驱动特征,这些特征可以包括位置、速度、加速度等。这些特征反映了虚拟对象的状态和行为。为了将驱动特征应用于虚拟对象,本实施例采用了基于机器学习的驱动模型。0058步骤S2104,将驱动特征应用于虚拟对象,并检测是否存在第三触发标记。0059对于每个驱动特征,检测是否存在相应的第三触发标记。如果存在第三触发标记,可以根据该驱动特征来驱动虚拟对象。

36、。例如,将驱动特征映射到虚拟对象的控制参数上,以生成虚拟对象的视频流。同时,根据第三触发标记生成目标事件,以触发相关的交互或动作。然后,基于虚拟对象的视频流和目标事件,生成最终的直播视频流。如果不存在第三触发标记,可以直接根据该驱动特征来驱动虚拟对象,生成直播视频流。0060为了实现虚拟对象的渲染显示,可以利用虚拟对象渲染引擎来加载图片。在此基础上,可以根据触发的目标事件指令加载相应的伪图像即目标事件视频帧,以在客户端显示该目标事件视频帧,以避免由于目标事件触发指令导致虚拟对象视频流在客户端显示异常的情况发生。具体而言,通过获取基于驱动数据生成的虚拟对象的视频流以及基于目标事件触发指令生成的伪。

37、图像,将它们合成为直播数据流。0061在一些实施例中,还可以在生成直播数据流的过程中,进行平滑处理。具体而言,可以根据像素在虚拟对象的视频流的最后一帧中的位置和运动向量计算出它在目标事件视频帧中的推断位置。然后,基于像素在目标事件视频帧中的推断位置、以及像素在目标事件视频帧中的实际位置,推断出待插入的中间帧的像素值。0062目标事件视频帧中的推断位置可以基于像素在虚拟对象的视频流的最末一帧中的初始横坐标位置和纵坐标位置、虚拟对象的视频流中最末一帧的运动向量函数、目标事件视频帧中的运动向量函数、偏置参数和权重参数来得到。例如,可以基于以下公式得到:0063其中,x 和y表示像素的初始横坐标位置和。

38、纵坐标位置。MVcurrent_end(x,y)表示虚拟对象的视频流的最末一帧中的运动向量函数,用于计算像素在虚拟对象的视频流中的位置偏移。Biasx 和Biasy表示第一偏置参数和第二偏置参数,用于对推断位置进行微调,避免可能的偏移或畸变因素。MVtarget(x,y)表示目标事件视频帧中的运动向量函数,用于表示像素在目标事件视频帧中的运动特征。Weightx和Weighty表示目标事件视频帧中像素位置推断时的第一权重参数和第二权重参数,用于调整推断位置时对目标事件视频帧中的运动向量的依赖程度。其中,Biasx、Biasy、Weightx和Weighty可以通过深度学习方法得到。0064本实。

39、施例中引入了运动向量和权重参数,通过分析虚拟对象的视频流、目标事件视频帧以及它们之间的像素运动,可以更准确地推断待插入中间帧的像素位置。这样做有助于提高直播视频流的质量和准确性,使生成的直播视频流更加流畅和自然。0065 本实施例中,通过以上方式,可以对每个驱动特征进行判断,确定是否存在第三触发标记,并采取相应的驱动方式。这样能够实现对虚拟对象的精确控制,并根据需要触发目标事件,为用户提供更丰富和互动性强的虚拟环境体验。说明书7/10 页10CN 116506674 A100066实施例3本申请实施例提供了一种基于虚拟对象的目标事件触发装置的结构示意图,如图6所示,该装置包括:获取模块62、语。

40、音转换模块64、映射模块66和触发模块68。0067获取模块62被配置为获取虚拟对象的待播放的文本内容,从所述文本内容中提取与目标事件相关联的关键字,在所述关键字的位置设置第一触发标记;语音转换模块64被配置为将设置了所述第一触发标记的所述文本内容转换为待播放的语音数据,从所述待播放的语音数据中提取多个语音特征,其中,所述多个语音特征中的部分语音特征携带有与所述第一触发标记对应的第二触发标记;映射模块66被配置为获取用于驱动所述虚拟对象的驱动数据,从所述驱动数据中提取多个驱动特征,并将所述多个语音特征和所述第二触发标记映射到所述多个驱动特征上,其中,映射后的所述多个驱动特征中的部分驱动特征携带。

41、有与所述第二触发标记对应的第三触发标记;触发模块68被配置为基于映射后的所述多个驱动特征来驱动所述虚拟对象,并在识别到所述第三触发标记时,触发所述目标事件。0068需要说明的是:上述实施例提供的基于虚拟对象的目标事件触发装置,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的基于虚拟对象的目标事件触发装置与基于虚拟对象的目标事件触发方法实施例属于同一构思,其具体实现过程详见方法实施例,此处不再赘述。0069实施例4图7示出了适于用来实现本公开实施例的。

42、电子设备的结构示意图。需要说明的是,图7示出的电子设备仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。0070如图7所示,该电子设备包括中央处理单元(CPU)1001,其可以根据存储在只读存储器(ROM)1002中的程序或者从存储部分1008加载到随机访问存储器(RAM)1003中的程序而执行各种适当的动作和处理。在RAM 1003中,还存储有系统操作所需的各种程序和数据。CPU1001、ROM 1002以及RAM 1003通过总线1004彼此相连。输入/输出(I/O)接口1005也连接至总线1004。0071以下部件连接至I/O接口1005:包括键盘、鼠标等的输入部分1006;。

43、包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1007;包括硬盘等的存储部分1008;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1009。通信部分1009经由诸如因特网的网络执行通信处理。驱动器1010也根据需要连接至I/O接口1005。可拆卸介质1011,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1010上,以便于从其上读出的计算机程序根据需要被安装入存储部分1008。0072特别地,根据本公开的实施例,下文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计。

44、算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1009从网络上被下载和安装,和/或从可拆卸介质1011被安装。在该计算机程序被中央处理单元(CPU)1001执行时,执行本申请的方法和装置中限定的各种功能。在一些实施例中,电子设备还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。说明书8/10 页11CN 116506674 A110073需要说明的是,本公开所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读。

45、存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CDROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,。

46、其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。0074附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的。

47、一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。0075描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单。

48、元的名称在某种情况下并不构成对该单元本身的限定。0076作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。0077上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现如下述实施例中所述的方法。例如,所述的电子设备可以实现上述方法实施例的各个步骤等。0078上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分。

49、或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。0079在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有说明书9/10 页12CN 116506674 A12详述的部分,可以参见其他实施例的相关描述。0080在本申请所提供的几个实施例中,应该理解到,所揭露的终端设备,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,。

50、例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。0081所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。0082另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述。

展开阅读全文
内容关键字: 基于 虚拟 对象 目标 事件 触发 方法 装置
关于本文
本文标题:基于虚拟对象的目标事件触发方法及装置.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/14252329.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1 
 


收起
展开