一、一种新的MDCT快速算法(论文文献综述)
周晶[1](2019)在《移动端音乐播放器系统设计与音频处理算法研究》文中进行了进一步梳理针对传统手机音乐播放器缺少基于音乐内容识别功能,音频编解码速度慢、播放界面交互性不好等问题,本文就移动端音乐播放器设计和音频处理算法进行研究,以便用户获得更好的音乐音质体验和更加流畅和便捷的操作。针对音乐播放器缺少音乐识别功能和界面交互性不好的问题,在对当前Android系统下的音乐播放器研究和开发现状进行总结与分析的基础上,采用软件工程语言对需要研发的音乐播放器进行了功能和性能需求分析;面向音乐播放器需求,给出了其系统架构的整体设计思路,完成了包括播放器UI、菜单、播放列表、基本播放功能、在线音乐搜索与后台服务等模块的详细设计;播放器数据库采用SQLite,完成了音乐播放器数据库逻辑设计和物理模型。在基于音乐内容的识别方面,给出了改进的基于时间色度图像的音频指纹识别算法,实验证实识别率高达90%以上可以有效的应用于移动终端中的音乐检索与识别;针对编解码速度慢的问题,采用改进的MDCT/IMDCT算法,实验结果表明,在保证一定音质品质下,编解码速度有一定的提升,通过MPEG组织推荐的MP3测试码流测试,该算法满足实时播放要求,提高音质真实度与音频处理速度。基于以上音乐播放器系统设计,相关音频处理算法,完成了播放器系统的软件编码实现和系统测试。测试结果表明,设计和开发的音乐播放器满足需求分析中给出的性能需求和功能需求,实现基于内容的音频识别,播放器拥有占用资源少,播放音质好,操作界面良好、播放稳定等特点。
王志峰[2](2019)在《数字音频重采样与重压缩反取证技术研究》文中进行了进一步梳理已有的数字音频取证方法主要关注的是方法的准确性,而忽略了方法本身的安全性。即方法的准确性是建立在没有恶意攻击的前提之下。事实上,具有相关专业知识的篡改者完全可以在篡改操作过程中或者篡改操作之后通过某种手段来隐藏篡改操作的痕迹。即通过某种攻击策略来保持、纠正或者删除某篡改操作可能留下的相关统计特性来攻击现有的取证方法,在取得满意的效果同时使得现有的取证方法失效。数字音频反取证技术是数字音频取证安全分析的重要组成部分。它可以从安全的角度去评估现有的取证技术,从而促进现有取证技术的发展与完善。通过鉴别数字音频是否经过重采样与重压缩篡改操作,可以对数字音频是否真实做出初步的判断。重采样与重压缩是最为典型的两类伪造行为。这两类行为的检测是数字音频取证的重要组成部分,其地位在取证领域中举足轻重。本文在这一研究背景下以现有的数字音频取证技术为切入点,对数字音频重采样与重压缩两个方面进行反取证技术研究和探索。具体的研究工作可分为以下三个方面:1.数字音频信号经过重采样操作后,其频谱宽带在重采样之后会有明显的变化,对此本文提出一种基于能量不一致性的重采样取证算法,采用对数能量比这一统计量,即通过重采样前后带宽能量之间的对数比值来判断是否经过重采样操作。2.通过分析重采样操作原理,本文对基于频谱周期性统计特征的数字音频重采样取证方法提出了一种反取证算法。我们采用了双通道攻击方式,也就是说同时修改数字音频信号的低频和高频中的相关内容。实验结果验证了本文所提的反取证方法可以有效地隐藏重采样操作遗留下的周期性痕迹,使得相关取证方法检查准确率下降20%,且经过反取证攻击之后的语音依旧保持较高的听觉质量。3.通过对现有主流MP3重压缩取证方法进行剖析,发现这些取证方法大多基于MDCT系数的差异性进行检测。因此,本文提出一种基于帧结构破坏的数字音频重压缩反取证算法,通过对不同压缩速率的MP3文件进行反取证的攻击。实验结果表明本文所提出的反取证算法可以使特定的重压缩取证算法失效。
黄其娟[3](2019)在《AAC音频转码检测技术研究》文中指出多媒体技术的发展给人们生活带来诸多便利,但其信息的真实性与可靠性问题也日益突出。由此数字多媒体取证应运而生并得到快速发展,音频取证也随之不断发展。鉴定音频内容的真实性与可靠性成为了目前研究的热点问题之一。数字音频转码检测是音频取证的重要组成部分之一。数字音频转码存在两种形式,一是相同格式下音频码率之间的转码即音频的双压缩,二是不同格式下音频格式之间的转码。作为目前较为流行的AAC音频,是本课题研究的重点。本课题从量化环节出发,利用编解码参数的变化,主要研究了AAC音频转码检测算法,对相同格式下音频转码的检测以及不同格式下音频转码的检测进行了探索研究。本文从以下三个方面展开研究工作:1、对AAC编解码原理进行深入剖析,详细介绍了AAC编码过程中的重要组成模块,为后续的研究工作提供一定的理论基础。并在此基础上,建立了相同格式以及不同格式下转码音频的基础数据库。2、通过研究发现随着AAC音频压缩次数的增加,比例因子也会随之发生改变。本文利用AAC音频再次压缩之后特征值的变化差异,提出了两种基于比例因子的AAC转码音频检测算法。一是基于比例因子差值的AAC双压缩音频检测算法,实验结果表明,所提算法特征较现有算法有较好的检测性能,低码率转高码率AAC音频检测率达99.91%,同码率音频压缩间检测率达97.98%。在不同编码器、不同时长以及不同噪声干扰下的实验结果同时也证明了该算法特征的有效性。二是基于比例因子转移概率的AAC音频压缩历史检测算法。实验结果表明,本文算法可以有效进行AAC音频压缩历史的检测。其低码率转高码率AAC音频检测率达96.70%,同码率间检测率达92.16%。对比实验证明了该算法具有较好性能。3、通过研究发现AAC音频压缩后将留下一定的量化痕迹,移除若干采样点后该量化痕迹在一定程度上被抹除。在对量化痕迹进行理论分析的基础上,我们利用移除采样点前后AAC音频QMDCT系数固定范围内系数变化的差异,提出了两种基于QMDCT系数的AAC转码音频检测算法。一是基于QMDCT系数的AAC双压缩音频检测算法。实验结果表明,所提特征能有效检测AAC转码音频,其低码率转高码率AAC音频检测率达99.84%,同码率间检测率达98.60%。二是基于QMDCT系数的不同格式音频转码检测算法,分别进行了AAC音频转码历史的检测以及待测音频原始格式的检测。实验结果表明,所提特征能较为准确的检测AAC音频是否经过转码操作,其平均检测准确率为99.28%。并能对其经过何种转码进行准确分类,其平均检测准确率达97.68%。
汪洲[4](2019)在《改进的JPEG图像二维DCT编解码技术研究》文中进行了进一步梳理JPEG是网络中最常见的图像存储格式,因其高压缩比而被广泛应用于互联网中,其标准的核心为DCT算法,将图像分块为不重叠的8×8模块进行单独处理,因此会在模块边界产生伪影即块效应。改进的离散余弦变换(MDCT)在信号处理领域起着重要作用,相比于DCT算法,MDCT虽然算法复杂度更高,但由于其重叠变换的性质,在信号处理领域能获得更好的效果。为了解决JPEG图像的边界效应,本文采用二维MDCT算法替代JPEG标准中的DCT算法,并在此基础上改进JPEG的压缩编码过程。主要研究内容如下:(1)分析JPEG图像压缩标准及其流程,剖析其核心的量化与熵编码过程。对JPEG标准的图像压缩过程进行详细分解,对其霍夫曼编码步骤进行实验性测试说明,同时用实验来测试JPEG标准的压缩性能,讨论JPEG标准的局限性。(2)分析DCT算法和MDCT算法的特点,提出新的MDCT快速算法。由于MDCT算法与DCT算法不同的重叠性质,使得其计算复杂度更高并且软硬件的实现更困难,因此提出了两种MDCT快速算法以减少计算复杂度并提高软硬件实现可能性,即基于2×2的MDCT快速算法和MDCT转换为DCT-Ⅱ的间接算法,并对两种算法与传统DCT行列式算法进行复杂度的对比,对比结果:两种改进的MDCT快速算法复杂度均低于传统的行列式算法,并且MDCT转换为DCT-Ⅱ的间接算法复杂度是最低的。(3)MDCT算法由于重叠的性质其输出只有输入的1/4大小,因此改进JPEG标准的量化过程并设计新的量化表,提出改进的JPEG图像压缩、重构方法。通过矩阵运算进行理论分析,采用两类实验测试重构方法与效果:一类是选取不同分辨率的灰度图像分别使用DCT和MDCT算法进行JPEG标准下的图像压缩重构实验,对压缩重构的图像峰值信噪比和程序运行时间进行对比;其二是使用不同类型的灰度与彩色图像分别进行两种压缩重建实验比较压缩重构效果。两种实验结果表明:随着图像分辨率的提升,MDCT代替DCT算法带来的时间成本提升在增大但峰值信噪比提升变化不大;图像内容越复杂、细节越多,无论彩色或者灰度图像,使用MDCT算法代替DCT算法带来的峰值信噪比提升更高。本文通过对JPEG标准的分析得知DCT算法带来的块效应成为了JPEG发展的限制,而采用MDCT算法代替DCT算法需要对标准中量化、图像重建过程做出相应改进,同时必须使用快速算法代替行列式算法以降低时间成本,对改进的标准进行理论分析并用实验验证。结果表明:MDCT算法替代JPEG标准中的DCT算法后,图像的分辨率越高,算法的时间成本提升越高,但压缩重建图像的峰值信噪比提升幅度基本不变;图像内容越复杂、细节越多的图像得到的压缩重建效果提升更高。
赵晓涵[5](2018)在《结合EVS的立体声编解码算法研究》文中研究表明随着IP网络的迅速发展,多媒体业务日益增长,由于音频带宽较窄和非语音信号处理效果欠佳等限制因素,现有语音编解码器提供的语音质量已经无法满足用户的需求。为了适应未来宽带移动通信,编解码器应支持高清、全频带语音和音频。沉浸通信,在线直播等场合也要求新一代编解码器支持立体声信号,并实现高品质下的编解码和传输。目前最先进的全频带语音通信编解码器——增强型语音服务编解码器(EVS)通过改进语音和音频编码技术大幅提升了通话服务质量,其通过提供全频带音频传输使得声音质量接近原声体验,并改善了语言清晰度及聆听舒适度。但EVS目前尚不支持立体声信号处理,为了更为广泛的应用在日常生活中,EVS急需增加立体声信号处理技术。编解码技术经过多年的发展,出现了多种基于不同原理的立体声信号处理技术,这些技术已经趋向于成熟,且或多或少具有专利问题,因此需要探索新的发展方向。主成分分析(PCA)技术被广泛地应用在数据降维,与编解码器的思想具有一致性。本文结合EVS设计了基于PCA的立体声音频编解码算法,所设计的算法模块包括信号预处理模块、主成分分析模块、量化模块和参数立体声处理模块等。算法设计完成后本文从压缩效果、音频的重建音质和空间感等方面对该立体声编解码算法进行了测评。测试结果证明,本文所设计的基于PCA的立体声编解码算法有着较高的可行性和较大的发展空间。
孙航[6](2017)在《基于在线学习模型的目标跟踪算法研究》文中指出近年来,随着计算机硬件设备的迅速发展和进步,图像采集设备逐渐在人类生活的各个领域得到了广泛应用,从而使得计算机视觉领域中以运动目标图像为研究对象的目标跟踪技术受到国内外研究人员的广泛关注。目标跟踪技术是一门融合了数字图像处理、模式识别、机器学习、数理统计、生物学以及心理学等多方面前沿理论的跨学科综合技术。目标跟踪技术作为计算视觉领域中的核心技术之一,目前已经融入到人类生活的各个方面,特别是在智能视频监控、人机交互以及军事国防建设等领域有广阔的应用前景。在计算机视觉系统中,准确地跟踪目标是后续目标识别和行为分析的基础,但是由于被跟踪的目标周围环境的复杂性以及目标自身外观的多变性,研究一种具有普适性的目标跟踪算法仍然是一种非常具有挑战性的工作。在此背景下,本论文主要在深入研究现有在线目标跟踪算法的基础之上,针对目标外观模型的在线建模和学习过程中存在的缺点和不足,提出了三个在线跟踪算法提高了目标跟踪的鲁棒性。本文的主要研究内容如下:压缩感知跟踪算法是一种在压缩域进行目标外观模型的建立和更新,再利用模型进行目标定位的检测跟踪算法。然而,压缩感知跟踪算法采用单一分类器进行目标跟踪,如果选择定位的区域产生漂移,分类器将会变得越来越不准确最终导致目标丢失。此外压缩感知跟踪算法采用恒定的学习率更新分类器,如果目标经历一段较长时间的严重遮挡,分类器中目标特征将被遮挡特征所取代,从而导致目标的丢失。为了解决上述问题,本文提出一种基于混合分类器决策的压缩感知跟踪算法。在跟踪的过程中,该跟踪算法采用混合分类器决策模型对目标进行定位,并且针对混合分类决策模型提出了使用动态的学习率对外观模型进行更新的策略。从而有效提高了跟踪算法处理遮挡、背景混杂等干扰因素的能力。L1稀疏表示是一种生成模式的跟踪算法,可以有效的适应目标外观的变化,但是却丢失了目标的背景信息。而压缩感知跟踪是一种判别模式的算法,可以有效利用目标的背景信息,但是在跟踪过程中缺乏一种有效的机制对跟踪结果进行评价。为了利用两类跟踪算法的优点进行融合跟踪,本文提出一种融合L1稀疏表示检测的压缩感知跟踪算法。主要创新点在于通过采用L1稀疏表示方法对判别模式的分类器的跟踪结果进行检测反馈,并根据检测结果选择不同阶段的分类器对目标进行跟踪。与此同时,针对不同阶段分类器的跟踪过程中稀疏表示字典中模板更新问题,使用一个二阶段的模版更新策略来保持字典中最具有代表性的模板。从而使得融合跟踪算法在复杂环境下具有更好的鲁棒性。近年来,基于核化相关滤波的跟踪算法(KCF)在精度、成功率以及速度上战胜了以前提出的大部分跟踪算法。然而,当目标经历剧烈外观变化时,固定每帧进行滤波器更新的KCF跟踪算法容易在定位目标时容易产生漂移。此外,KCF跟踪算法在经历长时间的遮挡等干扰因素的影响下,滤波器模型会丢失真实的目标外观,从而导致目标丢失后无法重新定位。为解决上述问题,本文提出一种基于多阶段学习的相关滤波跟踪算法,主要创新在于:提出了包括全局阶段滤波器模型、一致性阶段滤波器模型以及初始阶段滤波器模型的多阶段学习滤波器模型并行的对目标进行跟踪;在此基础上,采用向前向后跟踪的方式选择“纯洁”的训练样本对一致性阶段滤波器进行更新,从而使得三个滤波器模型对应的外观模型存在互补的关系。实验结果表明,多阶段学习的滤波器模型不仅可以有效的缓解KCF跟踪算法的漂移问题,而且可以在局部范围内实现目标丢失后的重新定位。
邓峰,鲍长春,鲍枫[7](2013)在《基于AAC比特流的音频信号Hiss噪声抑制方法》文中指出基于AAC比特流,提出了一种压缩域音频Hiss噪声抑制方法。该方法的输入为含噪音频的AAC比特流,输出为增强音频的AAC比特流。首先,利用修正的绝对中值标准差(MMAD,modified median absolute deviation)估计Hiss噪声,其次,利用修正的离散傅里叶变换(MDFT,modified discrete Fourier transform)计算听觉掩蔽阈值参数,最后,根据参数软阈值方法得到增强的AAC比特流,并用于AAC解码器得到最终的增强音频信号。主观和客观测试结果表明,所提出的方法能有效去除AAC解码音频信号中的Hiss噪声,其性能明显优于现有的几种Hiss噪声消除方法。
胥迪云[8](2012)在《基于一阶矩的改进型离散余弦变换快速算法研究》文中认为改进型离散余弦变换(Modified discrete cosine transform,MDCT)是一种很好的时频分析工具,并且在音频编解码、图像编码及光谱图像分析和数字图像水印等领域中得到广泛应用,具有非常重要的理论和应用价值。根据刘建国教授提出的一阶矩的无乘法快速计算思想,本论文使用了一阶矩来实现改进型离散余弦变换的快速计算。该方法首先通过给定变换将改进型离散余弦变换标准形式转化为一阶矩,然后引入一阶矩的无乘法快速算法来计算转化后的一阶矩,从而实现了改进型离散余弦变换的高效快速运算。根据该方法,文中设计了两种脉动阵列M1与M2来实现改进型余弦变换运算,两种阵列结构简单、无需乘法器和存储器,有利于采用大规模集成电路的实现。此设计具有算法统一,结构简单,易于扩展,速度相对较快,并且可以满足计算任意长度改进型离散余弦变换的特点。最后本文通过与国内外经典的三种快速算法进行比较,从计算时间和加法乘法个数两方面结果数据分析得出,基于一阶矩的改进型余弦变换计算更快,该方法具有广阔的应用前景。
王文龙[9](2011)在《音频解码系统算法的优化及在DSP上的定点化研究》文中研究表明随着单片机、DSP、ARM等嵌入式芯片的出现,音频编解码技术发展迅猛。当前音频编解码正朝着高压缩比、高保真的方向发展,国际上相继出现了多种格式标准,如MPEG-1, AAC, AC-3等。在众多音频标准中,Huffman解码和IMDCT (Inverse Modified Discrete Cosine Transform,修正的离散余弦逆变换)处理一直是音频解码的重要组成部分,在解码过程中占有较高的比重。本文主要对音频解码过程中的Huffman快速查表算法和快速IMDCT处理算法进行研究,在原有算法的基础上进行进一步的优化,提高了查表效率和计算效率。本文所做的主要工作如下:(1)分析了音频解码系统和解码算法的国内外研究现状,分别比较了多篇文献中的解码系统和解码算法的性能。(2)分析了编码过程中的心理感知特性和掩蔽效应,通过仿真实验进一步验证了声音的掩蔽性能。详细分析了音频解码系统的解码流程,主要研究了Huffman解码算法的查表方式和IMDCT处理过程。(3)在Huffman直接查表法的基础上提出了一种快速Huffman查表算法。针对Huffman码表的特点,在对Huffman码表按码字大小重排序时,根据代码以“0”开头或以“1”开头将Huffman码表分成两类。在解码时先进行起始位判断,若是“0”查找以“0”开头的表,若是“1”则查找以“1”开头的表,再根据码字的码长确定它在Huffman码表中的位置。理论分析表明本文提出的快速查表算法比原算法的查表时间减少了一半。(4)对计算数长为N的IMDCT处理算法进行了改进,在IMDCT处理中N取4的倍数的基础上提出N取8的倍数,推导了N点IMDCT序列公式,把N点IMDCT处理转化为四个N/8点的离散正余弦变换。改进的优化算法比N取4的倍数的原算法减少了计算周期,提高了计算效率。(5)对基于TMS320C5416的音频解码的定点化问题进行了研究。在解码过程中,对浮点运算密集的步骤进行定点化处理,将可替换的部分用定点运算替换,并对定点后的结果进行仿真分析。仿真结果表明定点化前后音频的波形差别不大,符合音质要求。
闫保中,刘泥石[10](2011)在《一种有效的MDCT/IMDCT快速算法》文中进行了进一步梳理提出了一种输入序列长度为N=5×2m的改进型的离散余弦变换(MDCT)的有效算法,可以有效减少数据量,提高计算机储存和运算效率.首先将序列长度为N的MDCT转化为N/2的离散余弦变换IV型(DCT-IV),然后将后者转化为长度为N/2的离散余弦变换II型(DCT-II),最后再通过加法和乘法运算实现快速计算过程.同时,分析该算法的算术复杂度.结果表明,较之传统方法,提出的算法能使常用窗型下的MDCT算术复杂度降低20%以上,实现了音频和语音编码领域的运算效率的提高.
二、一种新的MDCT快速算法(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、一种新的MDCT快速算法(论文提纲范文)
(1)移动端音乐播放器系统设计与音频处理算法研究(论文提纲范文)
摘要 |
abstract |
1 绪论 |
1.1 研究背景及意义 |
1.1.1 课题背景 |
1.1.2 研究意义 |
1.2 国内外研究现状 |
1.3 本文研究内容 |
2 系统相关技术 |
2.1 Android系统架构 |
2.2 Android关键技术 |
2.2.1 Android消息处理机制 |
2.2.2 Media Player类 |
2.2.3 Android数据库 |
2.3 音频处理相关技术 |
2.3.1 音频压缩技术 |
2.3.2 音频指纹识别技术 |
3 系统需求分析 |
3.1 系统可行性分析 |
3.1.1 技术可行性分析 |
3.1.2 经济可行性分析 |
3.2 系统功能需求分析 |
3.2.1 播放列表管理功能需求 |
3.2.2 文件管理功能需求 |
3.2.3 基本播放控制功能需求 |
3.2.4 在线音乐播放与下载功能需求 |
3.2.5 高品质音质压缩功能 |
3.2.6 音乐识别功能需求 |
4 音频处理算法 |
4.1 MDCT/IMDCT算法 |
4.1.1 MDCT/IMDCT算法工作原理 |
4.1.2 改进的MDCT算法 |
4.1.3 改进的IMDCT算法 |
4.1.4 计算过程 |
4.1.5 计算结果 |
4.2 音频指纹识别算法 |
4.3 改进的音频指纹匹配算法 |
4.3.1 时间色度图像 |
4.3.2 时间色度图像的参数 |
4.3.3 局部特征提取 |
4.3.4 特征点 |
4.3.5 判别指纹 |
4.3.6 指纹算法实验结果 |
5 音乐播放器的详细设计 |
5.1 系统的软件整体架构设计 |
5.1.1 系统整体功能结构 |
5.1.2 系统整体功能流程图 |
5.2 音乐播放器数据库详细设计 |
5.2.1 数据库存储结构设计 |
5.2.2 数据库详细字段设计 |
5.3 音乐播放器的各模块设计 |
5.3.1 菜单功能设计 |
5.3.2 播放列表功能设计 |
5.3.3 基本播放功能的设计 |
5.3.4 在线音乐播放与下载功能设计 |
5.3.5 高品质音质压缩功能设计 |
5.3.6 后台服务功能设计 |
5.4 音乐播放器系统播放界面设计 |
6 系统实现与测试 |
6.1 系统功能实现与测试 |
6.1.1 基本播放控制模块实现与测试 |
6.1.2 播放列表管理模块实现与测试 |
6.1.3 文件管理模块实现与测试 |
6.1.4 在线音乐处理模块实现与测试 |
6.2 音频识别算法测试 |
6.3 初步编解码测试 |
7 总结与展望 |
7.1 总结 |
7.2 展望 |
致谢 |
参考文献 |
(2)数字音频重采样与重压缩反取证技术研究(论文提纲范文)
引言 |
1 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.2.1 图像与视频反取证攻击算法 |
1.2.2 音频反取证攻击算法 |
1.2.3 反取证攻击算法的性能评估 |
1.3 本论文主要工作及结构安排 |
1.3.1 主要工作 |
1.3.2 结构安排 |
2 数字音频重采样取证技术研究 |
2.1 数字信号重采样原理 |
2.2 典型音频重采样取证方法 |
2.3 本文提出的重采样检测方法 |
2.3.1 重采样对功率谱密度的影响 |
2.3.2 基于带宽能量不一致的重采样取证算法 |
2.4 算法性能评估 |
2.4.1 取证算法的实验设置 |
2.4.2 取证实验结果分析 |
2.5 本章小结 |
3 数字音频重采样反取证技术研究 |
3.1 重采样反取证介绍与动机 |
3.2 本文提出的重采样反取证算法 |
3.2.1 重采样反取证提出的基本思想 |
3.2.2 基于双通道策略的重采样反取证算法 |
3.3 反取证算法性能评估 |
3.3.1 反取证算法的实验设置 |
3.3.2 反取证实验结果分析 |
3.3.3 反取证音频质量评价 |
3.4 本章小结 |
4 音频重压缩取证技术研究 |
4.1 MP3 编码原理 |
4.2 MP3 解码原理 |
4.3 典型的重压缩取证算法 |
4.3.1 基于广义本福德定律的MP3 重压缩取证算法 |
4.3.2 基于量化MDCT系数差值的MP3 重压缩取证算法.. |
4.3.3 基于比例因子的MP3 重压缩取证算法 |
4.3.4 其他重压缩相关的取证算法 |
4.4 本章小结 |
5 数字音频重压缩反取证技术研究 |
5.1 重压缩反取证介绍与动机 |
5.2 本文提出的重采样反取证算法 |
5.2.1 MP3 重压缩遗留痕迹分析 |
5.2.2 重压缩反取证算法提出的基本思想 |
5.2.3 基于帧结构破坏的MP3 重压缩反取证算法 |
5.3 反取证算法性能评估 |
5.3.1 反取证算法的实验设置 |
5.3.2 反取证实验结果分析 |
5.4 本章小结 |
6 总结与展望 |
6.1 本文工作总结 |
6.2 研究工作展望 |
参考文献 |
在学研究成果 |
致谢 |
abstract |
摘要 |
(3)AAC音频转码检测技术研究(论文提纲范文)
摘要 |
Abstract |
引言 |
1 绪论 |
1.1 研究背景与意义 |
1.2 音频转码检测研究现状 |
1.2.1 MP3 音频转码检测研究现状 |
1.2.2 AAC音频转码检测研究现状 |
1.2.3 其他格式音频转码检测研究现状 |
1.3 本文的主要研究工作和结构安排 |
2 AAC编解码原理 |
2.1 AAC编码原理 |
2.1.1 心理声学模型与增益控制 |
2.1.2 滤波器组和MDCT |
2.1.3 时域噪声整形、联合立体声编码与预测 |
2.1.4 量化与编码 |
2.2 AAC解码原理 |
2.3 本章小结 |
3 音频数据库及分类器 |
3.1 音频数据库的建立 |
3.1.1 相同格式转码音频数据库 |
3.1.2 不同格式转码音频数据库 |
3.2 分类器 |
3.3 本章小结 |
4 基于比例因子的AAC转码音频检测 |
4.1 比例因子在AAC编码中的应用 |
4.2 基于比例因子差值的AAC双压缩音频检测算法 |
4.2.1 比例因子特性变化分析 |
4.2.2 特征构造 |
4.2.3 实验结果与分析 |
4.3 基于比例因子转移概率的AAC音频压缩历史检测算法 |
4.3.1 特征构造与提取 |
4.3.2 实验结果与分析 |
4.4 本章小结 |
5 基于量化MDCT系数的AAC转码音频检测 |
5.1 AAC音频量化痕迹 |
5.1.1 AAC音频压缩痕迹 |
5.1.2 帧结构破坏对量化痕迹的影响 |
5.1.3 量化痕迹变化理论分析 |
5.2 基于QMDCT系数的AAC双压缩音频的检测 |
5.2.1 特征构造与提取 |
5.2.2 实验结果与分析 |
5.3 基于QMDCT系数的不同格式音频转码的检测 |
5.3.1 特征提取 |
5.3.2 实验结果与分析 |
5.4 本章小结 |
6 总结与展望 |
6.1 本文工作总结 |
6.2 研究工作展望 |
参考文献 |
在学研究成果 |
致谢 |
(4)改进的JPEG图像二维DCT编解码技术研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 选题背景和研究意义 |
1.2 国内外研究现状 |
1.3 本文的主要工作 |
1.4 论文组织结构 |
第二章 JPEG图像压缩标准 |
2.1 引言 |
2.2 JPEG算法介绍 |
2.2.1 编码器 |
2.2.2 解码器 |
2.2.3 交换格式 |
2.2.4 编码类型 |
2.2.5 DCT变换 |
2.2.6 DCT系数的量化 |
2.2.7 Zigzag扫描 |
2.2.8 熵编码 |
2.3 JPEG算法举例 |
2.3.1 JPEG熵编码 |
2.3.2 JPEG实际性能测试 |
2.4 本章小结 |
第三章 一维MDCT算法的维度扩展 |
3.1 MDCT算法 |
3.2 基于2×2 的二维MDCT快速算法 |
3.3 MDCT/IMDCT转化为DCT-Ⅱ的间接算法 |
3.4 本章小结 |
第四章 JPEG标准关于MDCT算法的改动 |
4.1 8×8 模块的MDCT变换 |
4.2 改进的MDCT图像重建方法 |
4.3 改进的图像重建算法的验证 |
4.3.1 编码效率理论验证 |
4.3.2 算法验证 |
4.4 改进的量化表 |
4.5 本章小结 |
第五章 MDCT在 JPEG图像压缩重建中的应用 |
5.1 改进的JPEG压缩重建标准 |
5.2 图像模块边缘处理 |
5.3 实际实验效果对比 |
5.3.1 灰度图像实验对比 |
5.3.2 彩色图像实验对比 |
5.4 本章小结 |
第六章 总结与展望 |
6.1 论文工作总结 |
6.2 未来研究展望 |
参考文献 |
致谢 |
攻读学位期间的研究成果 |
(5)结合EVS的立体声编解码算法研究(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 音频编解码概述 |
1.2 音频编解码标准概述 |
1.3 EVS编解码器简介 |
1.4 立体声技术概述 |
1.5 编解码器质量评价方法 |
1.5.1 客观评价方法 |
1.5.2 主观评价方法 |
1.6 主成分分析 |
1.7 本文课题来源及研究内容 |
第2章 EVS关键技术概述 |
2.1 编码器技术概述 |
2.1.1 编码器工作流程 |
2.1.2 线性预测技术 |
2.1.3 频域编码技术 |
2.1.4 非活跃信号编码 |
2.1.5 动态码率编码 |
2.1.6 带宽扩展 |
2.1.7 暂态判别 |
2.1.8 自适应时频变换 |
2.1.9 量化模块 |
2.2 解码器技术概述 |
2.2.1 解码器工作流程 |
2.2.2 丢帧补偿 |
2.3 本章小结 |
第3章 基于PCA的编解码方案设计 |
3.1 主成分分析的数学思想 |
3.2 主成分分析的基本推导 |
3.3 基于PCA的编解码设计方案 |
3.3.1 矩阵形式设计 |
3.3.2 信号采样方式 |
3.4 改进的基于PCA的编解码器设计方案 |
3.4.1 多帧联合主成分分析 |
3.4.2 低算法延时的多帧联合主成分分析 |
3.5 本章小结 |
第4章 量化设计与滤波器设计 |
4.1 本章概述 |
4.2 降维矩阵的量化设计 |
4.2.1 降维矩阵的性质 |
4.2.2 降维矩阵比特分配 |
4.3 滤波器的设计 |
4.3.1 滤波器设计原理 |
4.3.2 滤波器参数量化 |
4.4 旋转矩阵的量化设计 |
4.4.1 旋转矩阵性质 |
4.4.2 旋转矩阵比特分配 |
4.5 稳态帧的处理 |
4.6 本章小结 |
第5章 基于PCA的 EVS立体声编解码器设计 |
5.1 本章概述 |
5.2 双声道PCA分析 |
5.3 空间听觉理论 |
5.3.1 空间声源理论 |
5.3.2 空间参数的局限性 |
5.4 MDCT域内空间参数的计算 |
5.5 结合PCA的 MDCT域参数立体声模块设计 |
5.6 解码端空间参数综合 |
5.7 子带划分及码率计算 |
5.8 本章小结 |
第6章 结合EVS的双声道编解码器框架及测试 |
6.1 双声道编解码器框架 |
6.1.1 编码器框架和工作流程 |
6.1.2 解码器框架和工作流程 |
6.2 复杂度分析 |
6.3 MUSHRA测试 |
6.3.1 测试设计 |
6.3.2 测试结果 |
6.4 本章小结 |
第7章 总结与展望 |
7.1 本文主要工作总结 |
7.2 未来工作展望 |
参考文献 |
攻读学位期间发表的论文与研究结果清单 |
致谢 |
(6)基于在线学习模型的目标跟踪算法研究(论文提纲范文)
中文摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景和研究意义 |
1.2 国内外研究现状 |
1.3 目标跟踪的难点 |
1.4 主要的研究工作 |
1.5 全文的组织结构 |
第二章 在线目标跟踪相关技术 |
2.1 图像表示 |
2.2 目标模型及跟踪框架 |
2.2.1 生成模式跟踪算法 |
2.2.2 判别模式跟踪算法 |
2.3 运动模型 |
2.4 目标跟踪方法评价指标 |
2.5 本章小结 |
第三章 基于混合分类器决策的压缩感知跟踪算法 |
3.1 引言 |
3.2 压缩感知跟踪及相关理论 |
3.2.1 Haar-like特征和特征提取 |
3.2.2 压缩感知理论 |
3.2.3 压缩感知跟踪算法框架 |
3.3 基于混合分类器决策的压缩感知跟踪 |
3.3.1 混合分类器决策模型 |
3.3.2 分类器的更新策略 |
3.3.3 混合分类器跟踪算法与CT跟踪算法的对比分析 |
3.4 实验结果与分析 |
3.4.1 实验配置 |
3.4.2 定量分析 |
3.4.3 定性分析 |
3.5 本章小结 |
第四章 融合L1稀疏表示检测的压缩感知跟踪算法 |
4.1 引言 |
4.2 L1稀疏表示跟踪及相关理论 |
4.2.1 稀疏表示的理论基础 |
4.2.2 L1稀疏表示跟踪算法 |
4.3 融合L1稀疏表示检测的压缩感知跟踪算法 |
4.3.1 融合稀疏表示的检测跟踪框架 |
4.3.2 决策模型及跟踪算法 |
4.3.3 模版更新策略 |
4.4 实验结果与分析 |
4.4.1 实验配置 |
4.4.2 定量分析 |
4.4.3 定性分析 |
4.5 本章小结 |
第五章 基于多阶段学习的相关滤波目标跟踪算法 |
5.1 引言 |
5.2 核化相关滤波的跟踪及相关理论 |
5.2.1 HOG特征和特征提取 |
5.2.2 KCF跟踪算法框架 |
5.3 基于多阶段学习滤波器模型的跟踪算法 |
5.3.1 多阶段滤波器学习模型 |
5.3.2 一致性阶段滤波器模型 |
5.3.3 多阶段滤波器学习跟踪算法 |
5.4 实验结果与分析型 |
5.4.1 实验配置 |
5.4.2 定量分析 |
5.4.3 定性分析 |
5.5 本章小结 |
第六章 总结与展望 |
6.1 全文总结 |
6.2 未来研究展望 |
参考文献 |
攻博期间发表的科研成果目录 |
致谢 |
(7)基于AAC比特流的音频信号Hiss噪声抑制方法(论文提纲范文)
1 引言 |
2 AAC音频编码器概述 |
3 基于AAC比特流的Hiss噪声抑制方法 |
3.1 长窗Hiss噪声抑制 |
3.1.1 Hiss噪声的估计 |
3.1.2 MDFT谱系数的构建 |
3.1.3 掩蔽阈值的计算 |
3.1.4 阈值函数及掩蔽参数的计算 |
3.2 短窗Hiss噪声抑制 |
3.2.1 短窗Hiss噪声的估计 |
3.2.2 短窗Hiss噪声的抑制 |
4 实验结果及分析 |
5 结束语 |
(8)基于一阶矩的改进型离散余弦变换快速算法研究(论文提纲范文)
摘要 |
Abstract |
目录 |
1 绪论 |
1.1 本论文研究背景及意义 |
1.2 MDCT 的国内外研究现状 |
1.3 本论文的研究内容及组织结构 |
2 MDCT 简介 |
2.1 MDCT 的定义与特性 |
2.2 MDCT 现有快速计算方法 |
2.2.1 基于 DCT 半蝶形 MDCT 快速算法 |
2.2.2 基于 DCT/DST 蝶形 MDCT 快速计算方法 |
2.2.3 基于 DCT 递归式 MDCT 快速计算方法 |
2.3 本章小结 |
3 一阶矩的快速计算方法 |
3.1 矩的研究背景 |
3.2 矩和不变矩 |
3.3 一阶矩的定义及其应用 |
3.4 一阶矩的快速计算方法 M1 |
3.5 一阶矩的快速计算方法 M2 |
3.6 本章小结 |
4 MDCT 的一阶矩实现 |
4.1 MDCT 的一阶矩推导 |
4.2 基于 M1 的 MDCT 算法 |
4.3 基于 M2 的 MDCT 算法 |
4.3.1 基于 M2 的 MDCT 脉动式阵列 |
4.4 本章小结 |
5 实验与比较 |
5.1 加法与乘法复杂度分析 |
5.2 计算时间分析与比较 |
5.3 本章小结 |
6 总结与展望 |
6.1 总结 |
6.2 展望 |
致谢 |
附录 |
参考文献 |
(9)音频解码系统算法的优化及在DSP上的定点化研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 选题目的及意义 |
1.2 国内外研究现状 |
1.3 问题的提出 |
1.4 本文工作与论文结构 |
第二章 音频解码的基本理论 |
2.1 听觉系统的感知特性 |
2.2 音频编解码的分类 |
2.3 MPEG-1层3的解码原理 |
2.3.1 MP3文件格式 |
2.3.2 同步与CRC校验 |
2.3.3 数据解码 |
2.3.4 逆量化与顺序重排 |
2.3.5 立体声处理 |
2.3.6 混叠重建与IMDCT处理 |
2.3.7 频率倒置与子带综合滤波 |
2.4 本章小结 |
第三章 音频解码算法的优化 |
3.1 Huffman模块的解码优化 |
3.1.1 常见Huffman解码算法 |
3.1.2 基于码表特点的Huffman解码快速算法 |
3.2 IMDCT优化 |
3.2.1 利用余弦函数对称性的优化 |
3.2.2 基于递归方法的IMDCT算法的优化 |
3.3 本章小结 |
第四章 音频解码算法在DSP上的定点化研究 |
4.1 C5416芯片的原理 |
4.1.1 C5416处理器 |
4.1.2 C5416的指令系统和定点化方案 |
4.2 解码程序的定点化 |
4.2.1 数的定点表示与浮点表示 |
4.2.2 基本数学运算的浮点到定点转换 |
4.2.3 解码过程的定点化 |
4.2.4 定点化结果的MTALAB仿真与误差分析 |
4.3 在CCS上对定点化结果的验证 |
4.3.1 CCS开发平台介绍 |
4.3.2 解码算法代码定点化 |
4.3.3 仿真结果分析 |
4.4 基于C5416DSP的解码测试 |
4.4.1 测试环境 |
4.4.2 测试内容和结果 |
4.5 本章小结 |
第五章 全文总结 |
5.1 全文总结 |
5.2 进一步的工作 |
参考文献 |
致谢 |
攻读硕士学位期间发表的论文 |
(10)一种有效的MDCT/IMDCT快速算法(论文提纲范文)
1 MDCT到DCT-II的变换 |
2 5×2m模型DCT-II的快速算法 |
3 窗函数的改进 |
4 算法复杂度分析 |
5 结束语 |
四、一种新的MDCT快速算法(论文参考文献)
- [1]移动端音乐播放器系统设计与音频处理算法研究[D]. 周晶. 西安建筑科技大学, 2019(01)
- [2]数字音频重采样与重压缩反取证技术研究[D]. 王志峰. 宁波大学, 2019(06)
- [3]AAC音频转码检测技术研究[D]. 黄其娟. 宁波大学, 2019(06)
- [4]改进的JPEG图像二维DCT编解码技术研究[D]. 汪洲. 江西理工大学, 2019(01)
- [5]结合EVS的立体声编解码算法研究[D]. 赵晓涵. 北京理工大学, 2018(07)
- [6]基于在线学习模型的目标跟踪算法研究[D]. 孙航. 武汉大学, 2017(06)
- [7]基于AAC比特流的音频信号Hiss噪声抑制方法[J]. 邓峰,鲍长春,鲍枫. 通信学报, 2013(05)
- [8]基于一阶矩的改进型离散余弦变换快速算法研究[D]. 胥迪云. 华中科技大学, 2012(07)
- [9]音频解码系统算法的优化及在DSP上的定点化研究[D]. 王文龙. 南京信息工程大学, 2011(10)
- [10]一种有效的MDCT/IMDCT快速算法[J]. 闫保中,刘泥石. 应用科技, 2011(03)