影视动画配音节奏特征自动提取系统设计
发布时间:2021-10-02 04:39
配音节奏特征对于影视动画人物理解与情绪表达尤为重要,基于此,设计影视动画配音节奏特征的自动提取系统。配音采集模块采用TLV320AIC23音频接口芯片,该芯片内部集成A/D和D/A转换器,可对采集的影视动画配音音频进行模数转换,将获取的模拟信号传输至节奏特征提取模块。节奏特征提取模块以TMS320VC5509 DSP芯片为核心,采用优化后的哈佛结构,利用配音节奏特征提取算法提取影视动画配音节奏特征。配音节奏特征提取算法中,通过快速傅里叶变换确定复数域信息,确定发音点检测信号,以及各帧发音点检测信号函数的自相关函数。基于上下文的节拍周期推导算法推导配音片段节拍周期。基于发音点检测信号函数,通过HMM模型可推算节拍出现的详细时间点并进行节拍跟踪,确定节拍速度特征。实验结果显示,所设计系统可准确划分影视动画配音情绪类型,且能耗较低。
【文章来源】:现代电子技术. 2020,43(18)北大核心
【文章页数】:5 页
【部分图文】:
系统硬件结构设计
TLV320AIC23单片音频接口芯片数据传输字长包括16位、24位和32位,可满足6~98 kHz之间的采样频率。EPM240采用具有非易失性的CPLD架构,将传统可编程逻辑成本与功耗分别降低50%和90%,而密度和性能则提升400%和200%。EPM240的具体作用是提供一种解决方案来确保2种总线协议转换过程中成本最低。在配音采集模块中AIC23芯片的具体作用为数据转换,利用A/D转换器将4路配音信号转换为数字信号,经由数据传输协议传输至EPM240内,利用其串并协议转换,将各AIC23芯片的串行数据转换为并行数据,供MCU读取处理。处理后的数据被EPM240转换为I2S协议数据,返回至AIC23芯片内,利用D/A转换器转为模拟量信号,传输至节奏特征提取模块内。1.3 节奏特征提取模块
VC5509与AIC23的连接
【参考文献】:
期刊论文
[1]一种基于卷积神经网络特征表征的语音情感识别方法[J]. 姜芃旭,傅洪亮,陶华伟,雷沛之. 电子器件. 2019(04)
[2]利用谐波显著度和语者音色特征的混合语音中目标人基频轨迹提取[J]. 后方帅,黎美琪,刘若伦. 声学技术. 2019(04)
[3]基于注意力机制的LSTM语音情感主要特征选择[J]. 胡婷婷,冯亚琴,沈凌洁,王蔚. 声学技术. 2019(04)
[4]基于卷积神经网络的孤立词语音识别[J]. 侯一民,李永平. 计算机工程与设计. 2019(06)
[5]结合时变滤波和时频掩码的语音增强方法[J]. 成帅,张海剑,孙洪. 信号处理. 2019(04)
[6]基于语谱图提取深度空间注意特征的语音情感识别算法[J]. 王金华,应娜,朱辰都,刘兆森,蔡哲栋. 电信科学. 2019(07)
[7]基于语音心理声学分析的驾驶疲劳检测[J]. 李响,李国正,石俊刚,彭理群. 仪器仪表学报. 2018(10)
[8]基于自编码特征的语音增强声学特征提取[J]. 张涛,任相赢,刘阳,耿彦章. 计算机科学与探索. 2019(08)
[9]采用低维特征映射的耳语音向正常音转换[J]. 周健,窦云峰,刘荣敏,王华彬,陶亮. 声学学报. 2018(05)
[10]疲劳及紧张状态管制员通话语音反应特征研究[J]. 张兴俭,袁乐平,赵嶷飞. 中国安全科学学报. 2018(06)
本文编号:3418022
【文章来源】:现代电子技术. 2020,43(18)北大核心
【文章页数】:5 页
【部分图文】:
系统硬件结构设计
TLV320AIC23单片音频接口芯片数据传输字长包括16位、24位和32位,可满足6~98 kHz之间的采样频率。EPM240采用具有非易失性的CPLD架构,将传统可编程逻辑成本与功耗分别降低50%和90%,而密度和性能则提升400%和200%。EPM240的具体作用是提供一种解决方案来确保2种总线协议转换过程中成本最低。在配音采集模块中AIC23芯片的具体作用为数据转换,利用A/D转换器将4路配音信号转换为数字信号,经由数据传输协议传输至EPM240内,利用其串并协议转换,将各AIC23芯片的串行数据转换为并行数据,供MCU读取处理。处理后的数据被EPM240转换为I2S协议数据,返回至AIC23芯片内,利用D/A转换器转为模拟量信号,传输至节奏特征提取模块内。1.3 节奏特征提取模块
VC5509与AIC23的连接
【参考文献】:
期刊论文
[1]一种基于卷积神经网络特征表征的语音情感识别方法[J]. 姜芃旭,傅洪亮,陶华伟,雷沛之. 电子器件. 2019(04)
[2]利用谐波显著度和语者音色特征的混合语音中目标人基频轨迹提取[J]. 后方帅,黎美琪,刘若伦. 声学技术. 2019(04)
[3]基于注意力机制的LSTM语音情感主要特征选择[J]. 胡婷婷,冯亚琴,沈凌洁,王蔚. 声学技术. 2019(04)
[4]基于卷积神经网络的孤立词语音识别[J]. 侯一民,李永平. 计算机工程与设计. 2019(06)
[5]结合时变滤波和时频掩码的语音增强方法[J]. 成帅,张海剑,孙洪. 信号处理. 2019(04)
[6]基于语谱图提取深度空间注意特征的语音情感识别算法[J]. 王金华,应娜,朱辰都,刘兆森,蔡哲栋. 电信科学. 2019(07)
[7]基于语音心理声学分析的驾驶疲劳检测[J]. 李响,李国正,石俊刚,彭理群. 仪器仪表学报. 2018(10)
[8]基于自编码特征的语音增强声学特征提取[J]. 张涛,任相赢,刘阳,耿彦章. 计算机科学与探索. 2019(08)
[9]采用低维特征映射的耳语音向正常音转换[J]. 周健,窦云峰,刘荣敏,王华彬,陶亮. 声学学报. 2018(05)
[10]疲劳及紧张状态管制员通话语音反应特征研究[J]. 张兴俭,袁乐平,赵嶷飞. 中国安全科学学报. 2018(06)
本文编号:3418022
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/3418022.html