一、无乘法滤波器的优化设计方法(论文文献综述)
许柯[1](2021)在《深度神经网络加速器软硬件协同设计方法研究》文中研究指明深度神经网络(Deep Neural Network,DNN)在计算机视觉、自然语言处理、语音识别等领域取得了显着的成果。然而,高昂的计算和存储成本给基于DNN算法的部署,尤其是面向硬件资源有限的嵌入式设备,带来了巨大的挑战。近几年,关于神经网络压缩的研究逐渐成为学术界和工业界关注的热点方向。然而,部分压缩算法设计并没有与实际的加速器场景相结合,导致算法的理论压缩性能与实际硬件加速效果存在巨大差距。为了解决此问题,本文将模型剪枝、量化的压缩算法与基于现场可编程门阵列(Field-Programmable Gate Array,FPGA)的硬件架构设计相结合,实现了高吞吐率、低延时的DNN加速器。本文采用软硬件协同设计的方法,从硬件约束的压缩算法、算法硬件耦合优化、硬件设计适配压缩算法和系统级的目标检测加速器应用四个层次展开深入研究,主要的创新研究成果包括:(1)从硬件约束的压缩算法层面,本文以优化的遗传算法为基础,结合硬件约束对模型各层的剪枝率和量化位宽实现高效搜索。剪枝阶段,本文提出了基于模型参数量与计算量多目标优化策略,极大地缓解了因模型参数计算密度不同导致的模型剪枝结果不均衡的问题。实验表明,在Image Net数据集上,本文所提出的剪枝方案可以使Res Net50模型的计算量减少80%且没有精度损失;量化阶段,本文提出了基于小样本量化学习的快速评估方法,有效缓解了因量化损失导致的量化搜索评估与微调结果相关性差的问题并极大的提高了混合精度搜索的效率。在CIFAR-10和Image Net数据集上的实验结果表明,本文的混合精度方法优于其他的混合精度和均匀量化方法。(2)从算法硬件耦合优化层面,本文充分利用了剪枝模型的稀疏性和量化模型的数据独立性,提出了先累加后乘法的稀疏卷积(Accumulate-Before-Multiply Sparse Convolution,ABM-Sp Conv)计算方法。将传统的逐点乘累加(Multiply Accumulate,MAC)耦合卷积计算模式,通过合并同类项的方式拆解为累加与乘法操作解耦的两阶段卷积操作,然后根据模型权重的稀疏编码跳过零值计算,从理论上减少了卷积计算阶段乘法的计算次数,提高了稀疏卷积的计算效率和并行能力。(3)从硬件设计适配压缩算法层面,利用ABM-Sp Conv计算方法,本文提出了一个由“大”累加器阵列和“小”乘法器阵列组成的异构稀疏卷积计算单元,使其可以独立地执行累加和乘法两个阶段的卷积计算,以提供更大的灵活性来平衡FPGA片上逻辑和DSP(Digital Signal Processor)资源的利用。其次,本文采用异步的卷积设计,每个计算单元都有本地缓冲区和控制逻辑,可以独立执行具有不同工作负载的卷积任务,缓解了因稀疏数据的不规则性造成的计算负载不均衡的问题。最后,加速器采用全参数化的设计,利用自主开发的自动化设计空间探索引擎实现了从嵌入式平台到高性能FPGA板卡的部署。(4)从系统级的目标检测加速器应用层面,本文实现了一个基于YOLOv2的FPGA实时目标检测加速器系统。首先利用算子融合、剪枝、量化等压缩方法,实现了YOLOv2模型参数量20倍压缩,计算量7倍压缩。压缩模型在PASCAL VOC 2007数据集上保持74.45%的平均查准率均值(mean Average Precision,m AP)。然后,设计了包含最大池化在内的深度流水化稀疏硬件加速器架构。最后,借助参数空间探索将YOLOv2模型部署到Intel Arria-10 GX1150 FPGA板卡上,达到了72帧/秒的实时检测速度。
张帅[2](2021)在《X波段识别通信一体化标签设计》文中研究表明在现代战场环境中,采用雷达识别通信一体化技术可以提高频谱、空间、时间与能量等资源的利用率,充分发挥雷达探测与识别通信技术融合后的优势,实现目标探测识别同时获取目标信息。然而,对于采用该技术的终端仍需研究突破低计算复杂度、低计算功耗、高集成度与低成本等关键技术。近年来,雷达识别通信一体化标签因其低功耗、小型化、低成本、工作时间长等优势得到了国内外研究者们的广泛关注。本文开展在X波段的识别通信一体化标签关键技术研究,完成了标签总体方案、识别通信一体化波形、低计算复杂度解调算法、通信信号处理算法、嵌入式软件、低功耗机制、系统硬件电路研究设计与测试验证,实现了X波段识别通信一体化标签原型样机。本论文主要研究工作如下:1.根据一体化标签的功能与性能指标需求,研究设计识别通信一体化标签系统架构,单标签集成雷达通信复合信号接收处理、发射信号波形生成、微波长距离唤醒低功耗、全球导航卫星系统(Global Navigation Satellite System,GNSS)位置信息感知、基于事件驱动的主控调度机制等多种功能模块,具有低硬件复杂度、低计算复杂度、低功耗、高集成度、小型化等特性。2.研究设计基于正反线性调频的雷达至标签端识别通信一体化波形,并针对此波形设计了基于差值统计量和过零点统计量的两种解调算法。相较于线性调频信号传统的匹配滤波解调算法,这两种算法均占用更少的逻辑资源、具有更低的计算复杂度与功耗,适用于低功耗与低成本的识别通信一体化标签。3.研究设计基于线性调频高阶相位调制的标签至雷达端识别通信一体化波形,并针对此波形设计了基于瞬时相位特征分析的解调算法。进一步为了消除由噪声引起的相位不连续处抖动,研究设计了基于阈值比较的模糊相位重构算法。融合应用这两种算法,提升了低信噪比条件下的解调性能和抗干扰能力。4.完成了X波段识别通信一体化标签硬件系统架构与雷达识别通信、微波唤醒、GNSS导航定位、主控及电源等功能模块及系统电路原理图和版图研究设计,完成了识别通信一体化波形生成、调制解调算法、通信信号处理算法、嵌入式程序等软件设计;通过系统软硬件联调与测试验证,结果表明系统达到了预期技术指标。本文研究成果为低功耗、小型化、高集成度的雷达识别通信一体化标签研究与实现提供了设计依据,有助于推动雷达识别通信一体化技术发展与应用。
潘浩源[3](2020)在《灵活相干光传输系统DSP算法研究》文中研究表明随着互联网用户数目的持续增长和各式新型应用的不断涌现,现有光网络的底层光传输系统的高处理时延、固定带宽的分配和链路速率以及低效的频谱效率难以满足新兴业务低时延、低开销、低复杂度以及灵活动态补偿链路损伤的需求,从而制约光网络向灵巧化、动态化和高效化发展。未来的灵活相干光传输系统迫切需要动态突发光传输、大容量高谱效传输、损伤自适应补偿以及更灵活高效的数字信号处理技术的支持。本文围绕灵活相干光传输系统中的关键技术——突发相干接收线性损伤补偿数字信号处理(DSP,Digital Signal Processing)算法、基于最大后验概率(MAP,Maximum Posterior Probability)的码型相关符号间干扰(ISI,Inter-Symbol Interference)抑制算法以及全盲多损伤抑制DSP算法进行了深入研究,研究工作主要内容如下。1.采用突发相干接收的超100Gbps灵活光传输系统中,存在信道损伤动态变化、激光器瞬态效应等问题,传统DSP算法需要较高的训练序列开销以补偿/跟踪动态变化的信道损伤,但相应的有效速率/频谱效率降低。为适应灵活光传输系统信号接收的突发性,本文提出了一种基于训练序列复用的低开销、低复杂度和低时延突发相干接收线性损伤补偿DSP算法方案。该方案的突发帧结构针对激光器瞬态效应进行特殊设计,训练序列同时用于辅助频偏估计以及蝶形滤波器抽头系数初始化以加快收敛速度。14Gbaud PM-16QAM(Polarization Multiplexing-Quadrature Amplitude Modulation)光突发相干接收系统的仿真和离线实验结果表明:该训练序列复用方案相比于全盲DSP算法方案,性能相当且复杂度降低33.4%;相比全数据辅助方案,具有更高的线宽容忍度且开销从由14.9%下降至5.3%。2.Nyquist-WDM(Wavelength Division Multiplexing)相干光传输技术能够有效提高灵活光传输系统的频谱效率,但Nyquist-WDM系统中Nyquist强滤波损伤和光纤非线性效应会导致强烈的码型相关类ISI,而现有抑制算法复杂度过高难以低成本低功耗地硬件实现。针对上述问题,本文提出了一种基于无乘法欧氏距离近似计算的低复杂度MAP算法,其算法复杂度是传统MAP算法的28.8%。本文通过3×20Gbaud PM-16QAMNyquist-WDM仿真系统对所提算法进行了验证,仿真结果表明所提算法较无MAP算法,光背靠背不同前向纠错(FEC,Forward Error Correction)门限下所需的光信噪比(OSNR,Optical Signal to Noise Ratio)分别降低 1.2dB(@误比特率(BER,Bit Error Ratio)=1.9E-2)和 1.5dB(@BER=3.8E-3);最佳入纤功率提升ldB(7× 100km光纤环路);最大传输距离从1350km增加至1750 km(@BER=1.9E-2);进行1500km传输时,无MAP系统BER在任意入纤功率下均无法小于1.9E-2,而所提MAP算法能够明显提高增强系统性能,入纤功率在(-3.4dBm,1.1dBm)范围内均能够实现BER小于 1.9E-2。3×20Gbaud PM-16QAMNyquist WDM 背靠背和 700 km传输离线实验结果表明,所提MAP算法与传统MAP算法的OSNR容限及抑制光纤非线性损伤的能力相当,较无MAP算法具有1.5 dB的OSNR容限提升以及2.6 dB的入纤功率范围扩展。3.大容量灵活相干光传输系统存在复杂多样的动态线性和非线性损伤,而多损伤复杂关联难以抑制,传统DSP方法难以高效补偿。针对上述问题本文提出了一种基于谱聚类的多损伤抑制算法,并设计了一种基于谱聚类的无数据导引相干接收DSP算法方案。14GBaud PM-16QAM相干光传输系统仿真结果表明,基于谱聚类的多损伤抑制算法能够分别对调制器非线性、光纤非线性以及残余相位噪声进行抑制;多损伤共存时,基于谱聚类无数据导引DSP方案相比于传统全盲DSP方案最大传输距离在不同FEC门限下分别提升200km(7%FEC 门限@BER=3.8E-3)和 300km(20%FEC 门限@BER=1.9E-2)。
陈旺谦[4](2020)在《低阶稀疏FIR滤波器设计》文中研究说明随着数字技术的发展,对于低复杂度低功耗的数字滤波器设计需求也愈加显着,各类数字滤波器优化设计技术在信号系统和通信应用等领域备受关注。与无限脉冲响应(IIR)滤波器相比,有限脉冲响应(FIR)滤波器可以做到绝对线性相位以及不存在稳定性的问题。然而,FIR滤波器的硬件开销和功耗通常要大于相应的IIR滤波器实现,因此低复杂度低功耗的FIR滤波器设计尤其重要。稀疏FIR滤波器的设计优化方法是低复杂度数字滤波器设计技术的一个研究热点。稀疏优化问题实质上是一个L0的范数优化问题,其非凸特性是设计最优稀疏滤波器的难点。另外实验表明,FIR滤波器阶数对于滤波器稀疏性存在影响,提高系数稀疏性往往需要更大的阶数来实现,但随着滤波器阶数增加到一定长度后,并不能继续增加稀疏度,只会引入额外的延迟单元。本文分析了现有的稀疏FIR滤波器设计的方法与研究,并提出了一种在提高FIR滤波器系数稀疏度的前提下,减少滤波器有效长度的设计方法,实现低阶的稀疏FIR滤波器设计。本文的正文主要由两部分组成,分别对应了所提出的两种低阶稀疏FIR滤波器设计方法:(1)对于单级的稀疏FIR滤波器设计,将L0范数的稀疏FIR滤波器设计问题通过二进制编码向量进行编码,将原问题转换成凸优化的子问题,通过所提出的0-1交换算法使得子优化问题的近似误差不断趋向误差的上限值,在此过程中搜索一组最优解,最大化滤波器零系数的个数,并在最大稀疏度的基础上,减少有效长度。(2)将上述单级实现的FIR滤波器分解成为两个子滤波器,重构联级稀疏FIR滤波器设计问题,通过所提出的优化算法对两级子滤波器系数同时进行优化,使得联级实现的系数稀疏度大于单级的FIR滤波器实现。本文提出的设计算法适合于所有类型的稀疏FIR滤波器设计,实现的结果比现有的稀疏FIR滤波器设计算法性能更优或相当。
冯帅栋,陈立家,刘名果[5](2018)在《基于随机结构的无乘法无限冲激响应数字滤波器设计方法》文中研究表明针对现有的无乘法无限冲激响应(IIR)数字滤波器设计方法存在结构固定、滤波器性能不佳的问题,提出了一种基于随机结构的无乘法IIR数字滤波器设计方法。该方法使用加入移位器的稳定二阶子系统直接进行无乘法滤波器的结构设计。首先,无乘法数字滤波器的结构编码被随机创建;然后,利用一种加入成功父代选择框架的差分进化算法(SPS-DE)对生成的无乘法滤波器结构进行优化。该方法实现了无乘法滤波器结构的多样化设计,而且SPS-DE算法因采用成功父代选择框架机制,具有很好的种群开发与勘探能力,在无乘法滤波器的结构优化上取得了很好的效果。与现有的无乘法IIR数字滤波器设计方法相比,该方法设计的无乘法IIR滤波器通带波纹减小了43%,阻带最大衰减下降了40.4%。实验结果表明所提方法设计的无乘法IIR滤波器满足结构要求并且拥有优良的性能。
冯帅栋[6](2018)在《基于随机结构的无乘法数字滤波器设计》文中认为数字滤波器是一种能够处理电子传输信号的数字滤波系统,它能够传输有效频段的信号,将无用频段的信号过滤掉。因此,数字滤波器具有消除干扰,降低信号噪声的特性,它被广泛应用于图像识别、音频处理、电视雷达、遥感探测、航空、生物医学等各个领域。数字信号通常需要经过高速的实时处理,但是数字滤波器中因为乘法器的存在使得硬件电路的实现变得复杂和困难,而且乘法器的复杂性和其运算特性通常会限制数字滤波器的性能。因此,数字滤波器的无乘法化设计成为了其提升运算速度的关键所在。现有的无乘法无限脉冲响应(Infinite Impulse Response,IIR)数字滤波器设计方法都是基于已知的数字滤波器结构,将乘法器的系数量化为二次幂的和或者差对数字滤波器实现无乘法化设计。但这种方法设计出来的无乘法数字滤波器不能满足结构要求,而且性能不佳。因此,设计一种结构随机且性能优良的无乘法IIR数字滤波器是本文所要解决的问题。本文设计了一种加入移位器的二阶子系统,并将其作为一个基本单元。然后根据设计的生成指令,子系统依次被按序连接,直到一个完整的无乘法数字滤波器的结构形成。最后利用一种加入成功父代个体选择框架的差分进化算法(Improving Differential Evolution with a Successful-Parent-Selecting Framework,SPS-DE)对生成的数字滤波器结构进行优化。为了验证本文方法的可行性,本文利用多种演化算法对无乘法数字滤波器进行设计并和SPS-DE算法设计的结果进行对比,然后将本文方法与现有的无乘法IIR数字滤波器设计方法做了对比分析,充分验证了本文方案的有效性。本文的研究工作主要有以下几个方面:(1)介绍了现有的无乘法数字滤波器的实现方法;(2)提出了二阶子系统并设计了生成指令,介绍了如何根据生成指令添加子系统到滤波器系统中生成无乘法数字滤波器的结构;(3)对指令进行编码,介绍了利用SPS-DE算法对生成的无乘法数字滤波器结构进行优化的过程;(4)设计了无乘法数字滤波器的结构参数和演化算法的对比实验,并对实验结果做了具体分析;(5)对研究内容做了总结并提出了未来的研究展望。通过对实验结果进行分析,本文提出的无乘法IIR数字滤波器设计方法明显优于现有的设计方法,利用本文方法设计的无乘法IIR数字滤波器性能优良,达到了设计要求。本文的方法无需对乘法器系数进行转换量化,可以直接利用加入移位器的二阶子系统设计无乘法数字滤波器,然后利用SPS-DE算法对数字滤波器的结构进行优化并得到了很好的效果。本文为无乘法IIR数字滤波器设计提供了一种有效的新方法并且为有关研究开拓了新的思路。
杨玉庆[7](2011)在《3GPP LTE下行接收系统的数字信号处理与VLSI实现研究》文中进行了进一步梳理随着个人移动通信日新月异的发展,人们已经不满足于简单的语音通信。越来越多的业务如移动互联网,可视通话,流媒体,移动电视等,逐渐成为了市场上新的热点。在这些应用的促使下,移动通信技术正在向更高数据率的方向发展。从目前的发展来看,第三代合作计划(3rd Generation Partnership Project,3GPP)推出的长期演进技术(Long Term Evolution, LTE)以其高数据率、高频谱利用率和灵活性、低延迟、应用设备广泛等的特性在下一代移动通信标准的竞争中脱颖而出,成为准4G技术的主流标准。作者在对3GPP LTE系统的发展历史及现状进行分析和调研的基础上,发现在3GPP LTE的推广和普及中存在着以下的挑战:1)移动终端的功耗和成本的降低。与3G的移动终端相比,LTE的移动终端需要进行在更高的工作频率上(LTE标准支持的最大信号带宽为20 MHz)进行更多的数字信号处理(Digital Signal Processing, DSP)操作,如快速傅里叶变换(FFT)和多输入多输出(MIMO)信号检测等。这些操作会导致LTE移动终端在DSP部分消耗更多的能量。对于以手持式设备和消费电子产品为主要应用的技术而言,降低移动终端中DSP部分的功耗和运算复杂度具有重要意义。2)对多模多协议的支持。3 GPP LTE的应用必然面临着与3G协议如WCDMA和TD-SCDMA共存的局面;多模多协议的移动终端正在逐步成为主流。如何从芯片设计的角度对多模多协议进行支持是下一代移动终端设计的难点。其中,数字前端是目前各种多模架构中必不可少的一个部分,并且由于其工作频率高,运算量大,是多模多协议移动终端需要解决的首要问题之一。针对以上两个技术难点,本文研究了3GPP LTE下行接收系统中DSP技术及其VLSI实现的关键技术,设计了低复杂度高性能的关键信号处理模块,并从系统级对性能-运算复杂度可伸缩性的LTE下行接收系统进行了分析和建模。数字前端是沟通射频模拟前端和基带处理器的桥梁,能够实现采样率转换(SRC),信道滤波,匹配滤波等功能,其运算量大,支持的模式多,是移动终端DSP部分的重要模块。本文研究了支持3GPP LTE/WCDMA/TD-SCDMA的多模多协议数字前端的低复杂度设计,主要工作包括高效的SRC和信道滤波的设计与实现以及3 GPP LTE主同步信号(PSS)的高效搜索。本文提出了以最低运算复杂度为目标的SRC因子分解算法,与现有算法相比,能节省约40%的运算。本文在数字前端中还研究了PSS信号(频域Zadoff-Chu序列)的冗余特性,并根据该特性设计了高效的PSS信号匹配滤波器。与传统的结构相比,该结构能够节省63.5%的复数乘法运算和46.5%的复数加法运算。快速傅里叶变换(FFT)/反变换(IFFT)处理器是MIMO-OFDM系统中的进行OFDM调制解调的关键处理模块,对系统的性能和芯片的功耗和面积具有很大影响。本文设计了基于24和23混合基算法的4路并行延迟反馈型128~2048点流水线FFT/IFFT处理器,并改进了针对多路并行结构的无乘法旋转因子计算方法。借助于计算机辅助的最优搜索,改进后的方法能够以更少的常系数乘法器完成FFT/IFFT处理器中旋转因子的计算。采用了本文提出的无乘法旋转因子计算方法的128点4路并行FFT/IFFT处理器的功耗和面积都要优于已发表的结果。MIMO技术是下一代移动通信中的关键技术。本文对MIMO信号检测的低功耗算法和芯片实现方法进行了研究,从算法和硬件架构的角度对MIMO信号检测器进行了分析,明确了制约吞吐率和能量效率的关键因素。本文改进了现有的度量值优先MIMO信号检测算法,为算法增加了预中止的特性,并提出了新型的格点枚举策略。在新型的枚举策略下,部分欧几里得距离的计算可以通过增量累加的方式实现。由于增量计算的复杂度显着低于直接计算,这使得本文提出的MIMO信号检测算法的运算量与传统算法相比节省20%以上。在VLSI设计中,本文设计了基于流水线区间堆的双向有序队列结构,并优化了MIMO检测器的时序控制,使得本文设计的MIMO信号检测器的性能明显优于已发表的结果。最后,在3GPP LTE下行接收系统的关键DSP模块有了充分认识的基础上本文研究了具有性能-运算复杂度可伸缩性的LTE下行接收系统。本文从性能认知/运算控制/状态判断三个方面对3GPP LTE下行接收系统进行分析,提出了基于等效噪声贡献的伸缩算法,根据系统当前的性能动态调整数据通路(包括FFT/IFFT处理器、信道估计器和MIMO信号检测器)的运算复杂度。通过动态调整,信道估计和MIMO信号检测的运算量能够节省30%以上
沈志[8](2011)在《MC-QAM调制器信号处理关键技术的实现研究》文中进行了进一步梳理本文从介绍数字电视调制器的应用背景出发,对多载波QAM调制技术的实现方案进行了深入分析,在现有学术成果的基础上,对调制器各部分实现结构进行了重新设计及优化,着重解决了以下技术难题:提出了一种适用于各种定点FIR滤波器实现的系数压缩结构。该方法针对传统定点FIR滤波器中系数绝对值差异较大的特点,借鉴浮点数计算思想,通过修改滤波器累加器的位对齐结构,并压缩量化后系数存储位宽的方法,增加了滤波器量化后系数的实际有效量化字长,在不增加硬件位宽及滤波器阶数的前提下,将量化后的FIR滤波器阻带衰减性能提高了1020dB,解决了有限硬件位宽条件下高性能FIR滤波器的设计问题。在此基础上,通过对滤波器系数的整体增益进行细微调整,消除高权重系数的量化误差,将滤波器阻带性能进一步提高了约3dB。对于该方法在不同器件中的具体实现方式,从串行、并行及混合三种角度分别进行了设计。给出了系数预存变采样率滤波器阻带性能降低的原因,并改进了其实现结构。文章对系数预存方式下的任意变采样率滤波器结构进行了深入研究,将其实现过程分解为整数倍插值及小数倍抽取两个等效步骤,在首先详细分析了整数插值因子取值不同所导致的残留频谱幅度大小不同之后,进而研究了小数倍抽取将会导致的带内残留频谱叠加问题,并根据最差极限情况,对插值因子与累积残留频谱的关系进行了修正。而后,通过引入FIR滤波器系数压缩算法,提高了有限量化位宽条件下变采样率滤波器的工作性能;并针对原型插值滤波器系数对称的特点,对存储器进行分解并对地址线翻转,将系数预存储量降低了一半。结果表明该方法以使用系数预存储器的代价,换取了乘法器及加法器数量的指数级下降,只需要使用简单的实现结构,就可以替代传统Farrow结构下高复杂度的实时计算形式变采样率滤波器。对传统半带滤波器设计方法进行了结构改进。在以往研究成果上,利用半带滤波器中一半系数为零的特点,对传递函数进行了低敏感度因子提取,降低了系数量化位宽的需求,同时减少了乘法器的使用数量,优化了半带滤波器的实现结构。并利用乘法器时分复用的串行滤波器设计方法,对乘法器数量进行了进一步压缩,同时利用多个半带滤波器级联完成多级插值,降低了逻辑资源消耗。对比于传统多相滤波器结构,在不降低滤波器性能基础上,将占用资源最大的乘法器数量降低到原先的八分之一。提出了使用高阶滤波器对CIC滤波器的带内衰减进行补偿,实现宽带插值滤波器的设计方法。针对CIC滤波器存在的通带内衰减问题,在传统二阶补偿及锐化设计基础上,将切比雪夫一致逼近方法引入到CIC及CIC补偿级联滤波器的设计过程,将最终二者级联效果设计为最佳等波纹滤波器,从而使得CIC滤波器作为宽通带镜像抑制滤波器的设计方案成为可能。最终测试表明,补偿滤波器的阶数每增加一级,可以使CIC滤波器的带内纹波降低一个量级。推导了基带多载波调制模型的设计算法。针对传统设计方案中仅能在中频进行多载波合成的局限,对基带混频多载波调制算法进行了详细推导,使得以往必须在数字域合成的较高频率载波,在基带载波方式中,使用频带宽度级别的低频率频偏载波即可代替。文章同时对奇数及偶数载波数的异同进行了探讨。而后针对基带混频的结构特点对具体实现过程进行了优化,并给出了优化后的结构模型。提出了无相位截断的DDS设计方法,并最大程度优化了其实现结构。对多载波调制过程中的核心DDS载波合成器的误差来源进行了分析,结合DDS硬件结构,通过在算法上修改相位步进值,消除了传统DDS相位累加器所带来的截断误差,在小幅改动硬件的基础上,避免了DDS相位截断所带来的频带内干扰,使得DDS只需要通过提高幅度量化精度,线性增长系数存储器容量即可提高频带性能,而无须依赖指数增长存储器空间提高相位截断误差精度。该方法使得本设备中的DDS无杂散动态范围提高了17dBc以上;同时通过对查找表时分复用,及差分幅值保存,压缩了2比特的存储器资源消耗;进而引入输出幅值抖动,压低了合成载波近处的噪声谱平面约10dB。本文最后对高密度MC-QAM调制器设备的实现性能进行了测试,与以往设备进行了对比,经过改进后的系统在压缩逻辑资源约30%的基础上,获得了5.5dB的MER指标改善,并且实现了入网实用所要求的各项功能指标。文章最后对下一步研究方向做出了展望。
陈玙,王炳和,江川[9](2009)在《一种IIR数字滤波器无乘法结构的实现算法》文中指出1序言在高速数字信号处理的实时实现中,乘法器的复杂性不仅限制了计算速度,还带来硬件的复杂性。滤波器设计者转而设计一种无乘法器结构的滤波器,这样的结构可通过专门的移位器硬件实现。但在提高滤波速度的同时引入了大量噪声,严重干扰了滤波器输出。因此寻找一种相应的实现算法降低无乘法器结构特有的量化噪声就成为解决问题的关键。
陈力[10](2004)在《二进制整数离散余弦变换无乘法提升阶梯算法》文中研究指明研究了一种基于二进制整数离散余弦变换的无乘法快速和高效算法 ,新算法同时对实现提升阶梯中涉及的系数进行了分式化和截“1”近似 ,对带来的误差进行了实验分析 ,实现了加法器总数的优化 .实验表明通过构造无乘法提升阶梯替代传统的递归平面旋转变换的算法降低了系统的运算复杂度 ,同时提高了算法的实时性 .
二、无乘法滤波器的优化设计方法(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、无乘法滤波器的优化设计方法(论文提纲范文)
(1)深度神经网络加速器软硬件协同设计方法研究(论文提纲范文)
致谢 |
摘要 |
ABSTRACT |
主要符号对照表 |
1 绪论 |
1.1 研究背景及意义 |
1.2 论文研究内容概述 |
1.2.1 神经网络压缩算法概述 |
1.2.2 目标检测算法概述 |
1.2.3 基于OpenCL的FPGA设计方法 |
1.3 论文主要贡献 |
1.4 论文章节组织结构 |
2 神经网络加速器软硬件研究进展 |
2.1 模型剪枝与量化算法研究进展 |
2.1.1 模型剪枝 |
2.1.2 模型量化 |
2.2 神经网络加速器研究进展 |
2.2.1 传统神经网络加速器设计 |
2.2.2 新型神经网络加速器设计 |
2.3 本章小结 |
3 基于多目标优化的模型剪枝搜索算法 |
3.1 引言 |
3.2 多目标模型剪枝理论建模 |
3.2.1 模型内存占用目标 |
3.2.2 模型计算负载目标 |
3.2.3 模型计算密度 |
3.3 多目标优化的模型剪枝搜索框架 |
3.4 面向稀疏架构搜索的遗传算法设计 |
3.4.1 种群初始化方法 |
3.4.2 变异与交叉算子优化 |
3.5 实验结果分析 |
3.5.1 实验设置 |
3.5.2 CIFAR-10的实验结果及分析 |
3.5.3 ImageNet的实验结果及分析 |
3.5.4 消融实验分析 |
3.6 本章小结 |
4 基于强相关性的混合精度量化搜索算法 |
4.1 引言 |
4.2 混合精度量化搜索框架 |
4.3 混合精度量化模块设计 |
4.3.1 基于混合精度的卷积层设计 |
4.3.2 基于混合精度的激活层设计 |
4.4 小样本混合精度量化微调策略 |
4.4.1 卷积微调 |
4.4.2 激活微调 |
4.4.3 批归一化微调 |
4.5 基于遗传算法的混合精度量化搜索 |
4.6 知识蒸馏混合精度量化训练策略 |
4.7 实验结果分析 |
4.7.1 实验设置 |
4.7.2 CIFAR-10的实验结果及分析 |
4.7.3 ImageNet的实验结果及分析 |
4.7.4 消融实验分析 |
4.8 本章小结 |
5 稀疏神经网络加速器软硬件协同设计 |
5.1 引言 |
5.2 基于先累加后相乘的稀疏卷积算法设计 |
5.2.1 ABM-SpConv计算架构 |
5.2.2 量化对计算密度的影响 |
5.2.3 并行性和数据共享探索 |
5.3 硬件加速器架构设计 |
5.3.1 设计挑战 |
5.3.2 整体架构 |
5.4 硬件加速器理论建模 |
5.4.1 性能建模 |
5.4.2 带宽建模 |
5.4.3 资源建模 |
5.5 设计空间探索 |
5.5.1 卷积神经网络模型准备 |
5.5.2 加速器架构搜索 |
5.6 稀疏加速器性能评估 |
5.6.1 实验设置 |
5.6.2 性能与资源分析 |
5.6.3 FPGA加速器性能对比 |
5.7 本章小结 |
6 目标检测加速器软硬件协同设计 |
6.1 引言 |
6.2 YOLOv2模型算法压缩 |
6.2.1 模型算子融合 |
6.2.2 YOLOv2剪枝压缩 |
6.2.3 YOLOv2量化压缩 |
6.3 YOLOv2硬件加速器架构设计 |
6.3.1 整体架构 |
6.3.2 计算内核设计 |
6.3.3 访存设计 |
6.3.4 其他功能单元设计 |
6.4 YOLOv2加速器设计空间探索 |
6.5 YOLOv2加速器性能评估 |
6.5.1 实验设置 |
6.5.2 对比最先进的目标检测加速器 |
6.5.3 实时目标检测加速器系统展示 |
6.6 本章小结 |
7 总结与展望 |
7.1 论文工作总结 |
7.2 未来工作展望 |
参考文献 |
作者简历及攻读博士学位期间取得的研究成果 |
学位论文数据集 |
(2)X波段识别通信一体化标签设计(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状及趋势 |
1.2.1 识别通信一体化系统研究现状及趋势 |
1.2.2 一体化共享波形研究现状及趋势 |
1.3 本文主要工作和组织结构 |
第二章 识别通信一体化标签理论基础 |
2.1 识别通信一体化信号 |
2.1.1 波形复用体制 |
2.1.2 一体化波形设计要素 |
2.1.3 典型雷达信号 |
2.1.4 移相键控通信信号 |
2.2 识别通信一体化标签要素与关键技术 |
2.3 射频收发机前端架构 |
2.3.1 射频接收机前端架构 |
2.3.2 射频发射机前端架构 |
2.4 本章小结 |
第三章 一体化标签功能指标与总体方案 |
3.1 一体化标签应用场景 |
3.2 一体化标签功能与性能指标 |
3.3 一体化标签总体方案 |
3.4 本章小结 |
第四章 一体化波形及解调算法设计 |
4.1 下行链路波形及低计算复杂度解调算法设计 |
4.1.1 正反线性调频一体化波形设计 |
4.1.2 基于匹配滤波的正反线性调频解调 |
4.1.3 基于差值的正反线性调频解调算法设计 |
4.1.4 基于过零点的正反线性调频解调算法设计 |
4.1.5 算法计算复杂度对比 |
4.2 上行链路波形及解调算法设计 |
4.2.1 基于LFM相位调制的一体化波形设计 |
4.2.2 基于瞬时频率/相位特征分析 |
4.2.3 基于相位解模糊误差分析 |
4.2.4 基于瞬时相位一体化信号解调 |
4.3 本章小结 |
第五章 标签硬件电路及软件设计 |
5.1 一体化标签硬件电路设计 |
5.1.1 微波射频前端电路设计 |
5.1.2 射频与基带电路设计 |
5.1.3 主控电路设计 |
5.2 基于FPGA的信号处理设计 |
5.2.1 发送模块设计 |
5.2.2 调制解调模块设计 |
5.2.3 接收模块设计 |
5.3 嵌入式主控程序设计 |
5.4 基于FPGA的 ADF5356 配置 |
5.5 本章小结 |
第六章 识别通信一体化标签系统测试 |
6.1 标签硬件电路测试 |
6.1.1 电源模块测试 |
6.1.2 射频与基带电路模块测试 |
6.1.3 微波射频前端模块测试 |
6.1.4 主控MCU与 GNSS模块调试 |
6.2 标签数字链路功能测试 |
6.3 整机系统调试 |
6.4 本章小结 |
第七章 总结与展望 |
7.1 研究工作总结 |
7.2 后续展望 |
致谢 |
参考文献 |
攻读硕士学位期间取得的成果 |
(3)灵活相干光传输系统DSP算法研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究工作背景及意义 |
1.2 国内外研究现状 |
1.3 主要研究内容及论文结构安排 |
第二章 突发相干接收线性损伤补偿DSP算法研究 |
2.1 引言 |
2.2 突发相干接收线性损伤补偿DSP算法方案设计 |
2.3 低开销、低复杂度和低时延的突发相干接收线性损伤补偿核心DSP算法设计 |
2.3.1 核心DSP算法原理 |
2.3.2 开销、复杂度及时延分析 |
2.4 仿真验证和性能分析 |
2.4.1 光突发相干接收系统仿真模型 |
2.4.2 仿真结果及分析 |
2.5 离线实验验证和结果分析 |
2.5.1 14GBaud PM-16QAM突发相干接收离线实验平台建立 |
2.5.2 离线实验结果及分析 |
2.6 本章小结 |
第三章 基于最大后验概率的低复杂度码型相关ISI抑制算法研究 |
3.1 引言 |
3.2 低复杂度最大后验概率算法设计 |
3.2.1 基于近似欧式距离的低复杂度MAP算法 |
3.2.2 计算复杂度分析 |
3.3 仿真验证和性能分析 |
3.3.1 3×20Gbaud PM-16QAM Nyquist-WDM系统仿真模型 |
3.3.2 算法仿真结果及性能分析 |
3.4 离线实验验证和结果分析 |
3.4.1 3×20Gbaud PM-16QAM Nyquist-WDM离线实验平台 |
3.4.2 离线实验结果及分析 |
3.5 本章小结 |
第四章 基于谱聚类的无数据导引相干接收DSP算法方案研究 |
4.1 引言 |
4.2 基于谱聚类的无数据导引相干接收DSP算法方案 |
4.2.1 基于谱聚类多损伤抑制算法原理 |
4.2.2 无数据导引相干接收DSP算法整体方案 |
4.3 仿真验证和性能分析 |
4.3.1 14GBaud PM-16QAM相干光接收系统仿真模型 |
4.3.2 仿真结果及分析 |
4.4 本章小结 |
第五章 论文总结与展望 |
参考文献 |
略缩语 |
致谢 |
攻读硕士期间发表学术论文 |
(4)低阶稀疏FIR滤波器设计(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景和意义 |
1.2 研究技术与现状 |
1.3 本文组织与结构 |
第二章 单级稀疏FIR滤波器设计 |
2.1 单级设计问题构建 |
2.2 0-1交换算法 |
2.2.1 初始化编码向量 |
2.2.2 0-1交换过程 |
2.2.3 选择规则 |
2.3 仿真实例 |
2.3.1 设计实例1 |
2.3.2 设计实例2 |
2.3.3 设计实例3 |
2.4 本章小结 |
第三章 联级稀疏FIR滤波器设计 |
3.1 联级设计问题构建 |
3.2 前后搜索算法 |
3.2.1 前后搜索过程 |
3.2.2 子问题简化 |
3.2.3 滤波器阶数 |
3.3 设计实例 |
3.3.1 设计实例1 |
3.3.2 设计实例2 |
3.3.3 设计实例3 |
3.4 本章小结 |
总结和展望 |
4.1 工作总结 |
4.2 展望 |
参考文献 |
攻读博士/硕士学位期间取得的研究成果 |
致谢 |
附件 |
(6)基于随机结构的无乘法数字滤波器设计(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 课题研究背景及其意义 |
1.2 国内外的研究现状 |
1.3 论文主要工作和结构安排 |
参考文献 |
第2章 无乘法数字滤波器的设计与演化算法的介绍 |
2.1 数字滤波器的设计简介 |
2.2 数字滤波器的设计指标 |
2.3 数字滤波器设计方法 |
2.3.1 模拟滤波器转换设计数字滤波器 |
2.3.2 演化算法系数标定法 |
2.4 数字滤波器的无乘法设计 |
2.5 演化算法设计无乘法数字滤波器 |
2.5.1 DE算法 |
2.5.2 改进型DE算法 |
2.5.3 PSO算法 |
2.5.4 GA算法 |
2.6 本章小结 |
参考文献 |
第3章 利用SPS-DE算法对无乘法数字滤波器进行设计 |
3.1 无乘法数字滤波器的结构生成方法 |
3.1.1 二阶子系统 |
3.1.2 生成指令 |
3.1.3 指令序列 |
3.2 基于SPS-DE算法的结构优化 |
3.2.1 适应度评价函数 |
3.2.2 种群初始化 |
3.2.3 变异操作 |
3.2.4 交叉操作 |
3.2.5 选择操作 |
3.2.6 成功父代个体选择框架 |
3.3 算法实现流程 |
3.4 本章小结 |
参考文献 |
第4章 实验仿真与结果分析 |
4.1 移位器位数的对比 |
4.2 连接类型概率的对比 |
4.3 子系统个数的对比 |
4.4 SPS-DE算法的仿真参数对比 |
4.4.1 停滞容忍度Q的对比 |
4.4.2 缩放因子F的对比 |
4.4.3 交叉率CR的对比 |
4.5 不同算法设计无乘法数字滤波器 |
4.6 和现有方法设计的无乘法数字滤波器的对比 |
4.7 本章小节 |
参考文献 |
第5章 结论与展望 |
5.1 结论 |
5.2 展望 |
致谢 |
攻读学位期间发表的学术论文目录 |
(7)3GPP LTE下行接收系统的数字信号处理与VLSI实现研究(论文提纲范文)
目录 |
图片目录 |
表格目录 |
摘要 |
ABSTRACT |
第一章 引言 |
1.1 研究背景 |
1.1.1 概述 |
1.1.2 3GPP LTE系统的发展及研究现状 |
1.1.3 OFDM/OFDMA技术 |
1.1.4 多入多出技术(MIMO) |
1.2 论文的选题意义 |
1.3 论文的主要工作与创新点 |
1.4 论文的架构 |
参考文献 |
第二章 LTE下行接收系统分析与建模 |
2.1 3GPP LTE物理层协议概述(下行链路) |
2.1.1 概述 |
2.1.2 帧结构 |
2.1.3 下行物理信道 |
2.1.4 参考信号 |
2.1.5 同步信号 |
2.2 LTE下行接收系统分析与介绍 |
2.2.1 数字前端(Digital Front-End) |
2.2.2 同步模块和小区搜索 |
2.2.3 快速傅里叶变换(FFT) |
2.2.4 MIMO-OFDM信道估计 |
2.2.5 MIMO信号检测 |
2.2.6 信道插值 |
2.3 LTE下行接收主要算法复杂度分析 |
2.4 LTE系统建模 |
2.5 本章小结 |
参考文献 |
第三章 多模多协议数字前端的设计 |
3.1 概述 |
3.2 针对3GPP 3G/B3G的数字前端 |
3.2.1 采样率转换与信道滤波 |
3.2.2 同步信号的搜索 |
3.3 数字前端设计(Ⅰ):采样率转换与信道滤波 |
3.3.1 采样率转换的基本原理 |
3.3.2 数字前端的主要功能模块 |
3.3.3 现有采样率转换因子分解算法概述 |
3.3.4 以复杂度为目标的数字前端设计方法 |
3.3.5 数字前端采样率变换与信道滤波:实现与比较 |
3.4 数字前端设计(Ⅱ):LTE PSS信号的研究与匹配滤波 |
3.4.1 Zadoff-Chu序列的冗余特性研究 |
3.4.2 3GPP LTE PSS信号匹配滤波器的高效实现 |
3.5 本章小结 |
参考文献 |
第四章 FFT/IFFT处理器设计 |
4.1 LTE终端对于FFT/IFFT的要求 |
4.2 FFT/IFFT处理器的研究现状 |
4.3 FFT/IFFT处理器的算法和结构选择 |
4.3.1 FFT算法选择 |
4.3.2 FFT/IFFT处理器的结构选择 |
4.4 128~2048点4路并行流水线FFT/IFFT处理器设计 |
4.4.1 128~2048点混合基算法 |
4.4.2 FFT/IFFT处理器量化与有限字长的确定 |
4.4.3 4路并行FFT/IFFT处理器硬件架构 |
4.4.4 无乘法旋转因子计算方法 |
4.5 实现与验证 |
4.6 本章小结 |
参考文献 |
第五章 MIMO信号检测 |
5.1 MIMO信号检测的研究现状 |
5.1.1 线性检测 |
5.1.2 串行干扰抵消检测 |
5.1.3 最大似然检测 |
5.1.4 球形译码 |
5.2 基于新型枚举策略的预中止的FD-BF算法 |
5.2.1 算法介绍 |
5.2.2 枚举与基于增量累加的PED计算方法 |
5.2.3 算法小结 |
5.3 MIMO信号检测的硬件设计 |
5.3.1 系统分析与框架 |
5.3.2 节点处理模块 |
5.3.3 枚举模块 |
5.3.4 有序队列 |
5.3.5 流水线控制 |
5.4 实现与验证 |
5.5 本章小结 |
参考文献 |
第六章 可伸缩的LTE下行接收系统 |
6.1 具有伸缩性的数字信号处理 |
6.2 具有伸缩性的LTE下行接收系统 |
6.2.1 LTE下行接收系统噪声分析 |
6.2.2 可伸缩的LTE下行接收系统 |
6.2.3 算法仿真及分析 |
6.3 本章小结 |
参考文献 |
第七章 总结与展望 |
在读期间研究成果 |
致谢 |
(8)MC-QAM调制器信号处理关键技术的实现研究(论文提纲范文)
摘要 |
Abstract |
英文缩写符号索引 |
1 绪论 |
1.1 QAM 调制技术 |
1.2 基于IP 的MC-QAM 调制器概述 |
1.3 MC-QAM 调制器信号处理关键技术及研究热点 |
1.4 论文结构安排及创新点 |
2 MC-QAM 调制器体系结构 |
2.1 传统单载波QAM 调制器结构 |
2.2 基于IP 的MC-QAM 调制器实现结构 |
2.3 主要性能指标 |
2.4 本章小结 |
3 FIR 滤波器系数压缩算法的设计与实现 |
3.1 有效量化字长与高阶FIR 滤波器实现局限 |
3.2 优化有效量化字长的传统方法概述 |
3.3 系数压缩FIR 滤波器设计思想与实现结构 |
3.4 系数压缩FIR 滤波器系数量化算法 |
3.5 系数压缩FIR 滤波器性能分析 |
3.6 系数压缩FIR 滤波器增益调整算法 |
3.7 基于FPGA 的资源消耗分析 |
3.8 本章小结 |
4 连续变符号率输出实现优化 |
4.1 变符号率输出的实现方法 |
4.2 变采样率内插滤波器实现概述 |
4.3 系数预存变采样率滤波器结构优化 |
4.4 整数倍插值滤波器设计 |
4.5 小数抽取的频谱误差叠加分析 |
4.6 MC-QAM 变采样率滤波器实现与对比 |
4.7 本章小结 |
5 整数倍插值滤波器优化实现 |
5.1 插值滤波器实现概述 |
5.2 半带滤波器设计优化 |
5.3 CIC 高阶补偿滤波器设计算法 |
5.4 本章小结 |
6 基带多载波调制算法与实现 |
6.1 多载波调制原理 |
6.2 数字载波合成方法概述及杂散分析 |
6.3 无相位截断DDS 设计算法 |
6.4 无相位截断DDS 载波性能分析 |
6.5 基带混频及多载波调制实现 |
6.6 本章小结 |
7 高密度MC-QAM 调制器实现与测试 |
7.1 MC-QAM 中频信号处理框图 |
7.2 MC-QAM 设备功能及实物图 |
7.3 MC-QAM 设备测试结果与对比 |
7.4 本章小结 |
8 总结与展望 |
8.1 总结 |
8.2 展望 |
致谢 |
参考文献 |
附录 1 攻读博士学位期间发表论文目录 |
附录 2 主持与参与项目目录 |
四、无乘法滤波器的优化设计方法(论文参考文献)
- [1]深度神经网络加速器软硬件协同设计方法研究[D]. 许柯. 北京交通大学, 2021(02)
- [2]X波段识别通信一体化标签设计[D]. 张帅. 电子科技大学, 2021(01)
- [3]灵活相干光传输系统DSP算法研究[D]. 潘浩源. 北京邮电大学, 2020(05)
- [4]低阶稀疏FIR滤波器设计[D]. 陈旺谦. 华南理工大学, 2020(02)
- [5]基于随机结构的无乘法无限冲激响应数字滤波器设计方法[J]. 冯帅栋,陈立家,刘名果. 计算机应用, 2018(09)
- [6]基于随机结构的无乘法数字滤波器设计[D]. 冯帅栋. 河南大学, 2018(01)
- [7]3GPP LTE下行接收系统的数字信号处理与VLSI实现研究[D]. 杨玉庆. 复旦大学, 2011(12)
- [8]MC-QAM调制器信号处理关键技术的实现研究[D]. 沈志. 华中科技大学, 2011(07)
- [9]一种IIR数字滤波器无乘法结构的实现算法[A]. 陈玙,王炳和,江川. 2009年西安-上海声学学术会议论文集, 2009
- [10]二进制整数离散余弦变换无乘法提升阶梯算法[J]. 陈力. 汕头大学学报(自然科学版), 2004(03)