“V=π∫y~2dx”的由来

“V=π∫y~2dx”的由来

一、“V=π∫y~2dx”的由来(论文文献综述)

TANG ChunMing,XU MaoZhi,QI YanFeng[1](2015)在《Cryptography on twisted Edwards curves over local fields》文中研究表明Twisted Edwards curves over finite fields have attracted great interest for their efficient and unified addition formula. In this paper, we consider twisted Edwards curves over local fields and introduce a cryptosystem based on quotient groups of twisted Edwards curves over local fields. From the study of formal groups of twisted Edwards curves and twisted Edwards curves over local fields, we give the choice of cryptographic groups.An element in these groups can be uniformly represented by two n digit p-adic numbers, whereas an element in the elliptic curves in Weierstrass form over local fields is represented by a 3n-2 digit p-adic number and a4n-3 digit p-adic number. In the cryptography on elliptic curves in Weierstrass form over local fields, five cases for different input point pairs in computing points addition have to be considered and sometimes points have to be lifted. In the cryptography on twisted Edwards curves over local fields, the addition formula is simple,unified, and complete, which is efficient, does not need lifting points, and is against the side channel analysis.Finally, a speedy point multiplication algorithm and some concrete instances are given.

孟杰,郭建友,李剑,李志攀,梁豪兆,龙文辉,牛一斐,牛中明,尧江明,张颖,赵鹏巍,周善贵[2](2011)在《原子核物理中的协变密度泛函理论》文中研究说明文章介绍了原子核协变密度泛函理论的历史发展、理论框架、对原子核基态和激发态的描述以及在一些交叉学科领域的应用。首先,通过回顾原子核物理研究中的几个重要里程碑并结合二十一世纪原子核物理面临的机遇和挑战,对当前核物理的研究热点和重要课题进行了介绍。随后系统介绍了原子核协变密度泛函理论,内容包括协变密度泛函理论的历史发展、一般理论公式、介子交换模型、点耦合模型、交换项、张量相互作用、物理观测量的计算公式等。协变密度泛函理论的应用包括原子核基态性质和激发态性质的描述以及在核天体物理与标准模型检验中的应用。其中,基态性质包括原子核结合能、半径、单粒子能级、共振态、磁矩、晕现象等。激发态性质包括原子核磁转动、低激发态性质、集体转动、量子相变、集体振动等。在核天体物理与标准模型检验的应用中,主要以核纪年法测算宇宙年龄和Cabibbo-Kobayashi-Maskawa矩阵的幺正性检验等为例,介绍协变密度泛函理论在交叉学科领域的应用。

Chuan-fu YANG,Feng WANG,Zhen-you HUANG[3](2021)在《Ambarzumyan Theorems for Dirac Operators》文中进行了进一步梳理We consider the inverse eigenvalue problems for stationary Dirac systems with differentiable selfadjoint matrix potential. The theorem of Ambarzumyan for a Sturm-Liouville problem is extended to Dirac operators, which are subject to separation boundary conditions or periodic(semi-periodic) boundary conditions,and some analogs of Ambarzumyan’s theorem are obtained. The proof is based on the existence and extremal properties of the smallest eigenvalue of corresponding vectorial Sturm-Liouville operators, which are the second power of Dirac operators.

宋庆凤[4](2012)在《保险投资及契约设计研究》文中提出保险问题中的不确定性主要体现在高度风险、信息不对称等方面.随机情形下的保险问题已得到了深入的研究并且取得了丰硕的成果,然而现实生活中,保险问题的不确定性还包括模糊性、随机性及模糊性与随机性相混合的情况,目前这方面的研究尚属起步阶段.因此,研究不确定环境下的保险问题具有重要的理论意义和实用价值.本文研究不确定环境下的保险投资决策及契约设计问题,提出了更符合实际的保险投资模型和契约模型.具体内容如下:针对现实生活中保险公司索赔既含有随机性又含有模糊性及投资活动和理赔活动同时进行等特点,本文假设个体索赔额为模糊随机变量、投资收益率为模糊变量,分别考虑保险公司拥有单个险种和双险种两种情况,建立了模糊随机环境下的单险种投资模型和双险种投资模型,设计了基于模糊模拟的猴群算法对所建模型进行了求解.研究事先信息不对称情形下的保险契约设计问题,将保险公司关于投保人的平均损失、公共管理机构关于病人的健康状况等的主观估计刻画成模糊变量,把契约变量设计成二维向量,建立了模糊免赔契约模型、模糊共保契约模型和模糊等待时间契约模型,并将上述模型转化为最优控制问题,应用庞特里亚金极大值原理,分别给出了最优解存在的必要条件.针对现实生活中保险公司对投资平均损失只能给出主观估计,且投资者对投资损失、投资收益率及折现率亦只能给出主观估计的情形,建立了模糊投资免赔契约模型,给出了最优投资策略和最优免赔契约.研究了事后信息不对称情形下的保险契约设计问题,在双边道德风险理论框架下,建立了保险雇佣契约模型,分别给出了最优契约以及保险公司和雇佣者的最优努力水平,进一步分析了自信因子和相对重要性因子对最优努力水平及最优契约的影响.

张健[5](2017)在《旋转体体积计算中的微元法思想应用》文中指出通过讨论几类不同数学模型下旋转体体积的计算方法,阐述了"微元法"思想在其中的重要应用价值.特别地,还考虑到两类旋转轴穿过旋转区域内部的情况,并给出了相应的体积计算方法.此外,在利用定积分和二重积分计算外,基于"微元法"给出了一类旋转体体积的曲线积分计算方法,并说明了其一般性.

李湘江[6](2020)在《一类三次李氏卵圆》文中指出提出了李氏卵圆的定义,以及卵圆的卵心,卵圆的长半径、短半径和对称半径等相关概念的定义。给出一类三次方程,并证明其为李氏卵圆方程。推出了某些三次方程为李氏卵圆方程的判定定理,以及一类李氏卵圆的切线方程和法线方程、旋转卵球体的体积公式。

程勇[7](2010)在《陈志坚的《微积阐详》》文中研究说明本文以《微积阐详》作为案例,分析和探讨陈志坚对微积分的理解情况。在分析《微积阐详》的基础之上,将其与同类作品进行比较分析,进而探讨晚清中算家对微积分的理解及其得与失。论文主要分为五章。第一章简要介绍陈志坚及其有关中算方面的成就。数学家必然受到数学传统观念的影响,陈志坚同样不例外。我们在明了陈志坚及其中算成就之后,能够更好地理解他对微积分学习的情况。第二章论述《微积阐详》微分部分的内容。从这部分的内容来看,晚清中算家对微分等基本概念认识比较模糊,而且没有发展。第三章介绍了《微积阐详》积分部分的内容。该书的第五卷是陈志坚微积分工作的亮点,尤其是通过积分求曲线弧长、面积、体积。第四章将《微积阐详》与同类作品进行比较分析,总体上评价《微积阐详》的长处与不足,进而理解中算家对微积分的学习水平。第五章把中算、和算接受微积分的情况进行简要地比较分析。从当时两国的社会背景、政治、政策等多个方面以及中算、和算的特点出发分析中算最终被放弃的原因。以《微积阐详》作为案例,分析中算家在维护中算传统基础前提下对微积分所作的创新工作,并以此进一步审视中算家学习微积分失败的原因,从中得到启示。

简思綦[8](2012)在《吸收布朗运动的拟遍历性及其相关问题》文中认为遍历性和大偏差理论是马尔科夫过程理论中的重要内容,它们之间有着密切的联系。本论文研究的马尔科夫过程一般不具备通常意义下的遍历性,我们主要研究它们的条件遍历性(我们称之为拟遍历性)和大偏差,以及相关问题。首先,我们研究吸收布朗运动的三种拟遍历性质:分布意义下的拟遍历性、分式拟遍历性和Birkhoff意义下平均拟遍历性。我们证明了相应的拟遍历性定理,且分别对应唯一极限概率分布:拟平稳分布、分式拟平稳分布、平均拟平稳分布。却呈现一种相变现象:分式拟平稳分布与拟平稳分布不同。分式拟平稳分布与平均拟平稳分布相同,并且是吸收布朗运动极限扩散过程的唯一平稳分布。这三个极限分布都不同于其对应L2半群的对称测度:区域上的均匀分布。我们还证明了一个具有独立意义的结果:任意Feller马尔科夫过程的每个Yaglom极限一定是拟平稳分布。其次,我们证明了拟遍历速度、分式拟遍历速度和其极限扩散过程的遍历速度都通过Dirichlet特征函数,由初始位置和拉普拉斯算子的Dirichlet特征值刻划。这里的特征值可能是高阶(3阶及以上)的。我们以一维吸收布朗运动为例,说明了以上结论。接着,我们研究了吸收布朗运动形如∫0tV(Xs)ds的偏差不等式。我们给出了V属于Kato类时的偏差不等式,在一定条件下我们给出了条件偏差不等式的负指数界。特别当V有界连续时,与大偏差结果作比较,我们的结果是渐进最优的。最后,我们研究吸收布朗运动经验分布的大偏差行为。我们首先指出其速率函数的唯一极小点就是平均拟平稳分布,而此极小值就是Dirichlet主特征值。然后我们证明了局部一致大偏差下界,给出了新的主特征值变分公式和加强形式的弱大数定律。最后我们给出了吸收布朗运动极限扩散过程的大偏差原理,速率函数是相应Dirichlet型,与吸收布朗运动条件大偏差的速率函数相同。

程引[9](2018)在《基于强化学习的时间序列决策系统设计与应用》文中研究指明机器学习与数据挖掘是近年来国内外学者与业界人士研究的热点课题之一,其中强化学习作为三大类机器学习算法中的重要分支,逐渐受到了研究者们的青睐与工业界人员的重视。相比于监督学习算法在图像识别、自然语言处理等诸多领域大放异彩而言,强化学习算法作为一种应用于时间序列决策系统的通用框架,其优化潜力远未挖掘,理论研究远未完善,工程应用远未展开。这固然与强化学习相对监督学习理论更加复杂、适用场景特质更加迥异、实现方式更加多变等方面有关。但更重要的原因是决策系统设计者缺乏对各种强化学习算法的统一认识,也忽略了各种序列决策任务性质的不同,甚至将强化学习与其他类型算法孤立看待,放弃了提升强化学习性能的有效途径。这些因素共同导致了基于强化学习算法设计出的序列决策系统常常存在训练缓慢、目光短浅、行为反常等共性问题,致使系统难以达到设计者预期效果,更无法成功作用于工程应用。因此如何针对不同任务的特点,有效利用交互信息设计时间序列决策系统,具有重要的理论意义与广阔的工业应用价值。本文针对多种性质不同的时间序列决策任务,采用机理模型、数据驱动、模糊规则和特征提取等方法,分别研究了在已知智能体交互机理、已知智能体交互数据以及智能体交互模型不可知的多种情形下时间序列决策系统的设计和具体应用案例。通过分析决策任务中新增奖励信号序列的获取方式,按照由表达式生成、由历史数据推断以及无法获得奖励信号序列,分别采用基于模型方法、数据驱动方法和无模型方法,以最大化长期回报的期望值为设计目标,通过选取合适的强化学习算法与合理的奖励函数定义,给出相应的时间序列决策系统设计方法。这类设计方法包含以下几个特点:第一,决策系统可以对先验知识进行嵌入,减小了训练开销,提升了实际决策效果;第二,所设计的决策系统在训练结束后进入应用阶段,系统参数固定,只需要做单次前向计算,具有效果稳定、易于部署以及实时性好等特点;第三,针对三种不同情形的时间序列决策系统设计方法并不局限于各自所给出的应用案例,针对不同性质的决策任务,提出的设计方法具有通用性,可以应用于决策对象迥异而奖励信号获取方式相近的各种应用场景。本文的主要研究贡献包括:1.提出了一种强化学习的信息观点,将强化学习中不同类型的算法从相同的角度进行描述。在传统强化学习观点中,不完全强化学习方法、基于值函数强化学习方法、基于策略强化学习方法以及反向强化学习方法分别代表了不同的基本观点。而使用信息观点可以将多臂老虎机、蒙特卡罗方法、时间差分方法、自举方法、适迹法、Actor–Critic方法和反向强化学习方法等算法进行统一描述。这种统一观点有助于理解表面上大相径庭的各类算法的本质区别、找出不同算法的普遍共性,也能方便地比较算法对交互信息的依赖程度。2.针对智能体交互机理已知的时间序列决策任务,提出了一套通过目标分解和模糊推理的知识嵌入奖励函数的设计方法。该方法以非线性、连续状态空间为研究对象,以无人船自主避障和无人船逃逸追踪为应用实例。通过机理建模,建立起研究对象的动态过程,搭建基于机理模型的交互训练平台,从而产生充足的经验样本。根据任务实际需求,分别设计子目标势函数进行奖励塑形。综合子目标分解方法引入模糊推理手段,将人工知识嵌入进强化学习系统,有效提高智能体学习性能。此外知识库可以按需要进一步扩展,具有扩展性好、可解释性强、工程背景直观等优点。3.针对智能体交互机理未知,但交互信息容易获得的时间序列决策任务,提出了一套基于时间序列分析框架的深度强化学习决策系统设计方法。该方法以数据量庞大、机理分析复杂、安全考虑难以在线学习的非线性系统作为研究对象,以大型火电站锅炉机组燃烧优化任务为背景,通过分布式控制系统采集数据,构造系统动态模拟器。使用卷积神经网络将不同属性数据在空间上进行整合,结合使用循环神经网络对系统在时间序列上的变化规律进行学习,对动作向量进行编码,以离散型强化学习算法对决策器进行训练。所设计的决策系统适合于机理难以掌握,但经验样本数据易于获得的场景。为基于数据驱动的时间序列决策任务提供了易于工程实现的解决方案。4.针对智能体交互模型未知,且无法通过交互信息预测状态的时间序列决策任务,提出了一套基于无模型持续性时间序列决策系统的设计方法。该方法以环境模型未知、状态转移难以预测以及决策持续进行的应用场景为研究对象,以互联网广告的实时竞价任务为背景,通过概率分布视角,将片段性决策纳入持续性决策框架下;使用策略初始化方法实现知识嵌入,优化智能体探索范围,提升算法学习速度;使用辅助势函数缓解奖励信号的稀疏性;通过可微半梯度算法求解决策任务。所设计的决策系统不依赖于对环境模型的充分认识,不局限于决策序列的区间长度,能够从更长远角度进行优化,而不过分计较某一段时间内的得失,从而带来更持久的综合效益。

徐伟[10](2018)在《小样本计算机视觉问题的研究》文中进行了进一步梳理随着深度学习的发展,计算机视觉技术有了长足的进步,并在娱乐,安防,工业控制等等各个领域发挥了重要作用。这个巨大进步主要是由于以卷积神经网络(Convolution Neural Network,CNN)为代表的有监督深度学习模型的有效性。但CNN的良好性能需要大量有标签数据集来训练,然而很多计算机视觉问题并不能满足这个要求,并且获取大量有标签样本往往需要高昂的代价。因此对于如何解决小样本计算机视觉问题的研究很有必要。由于计算机视觉问题的复杂性及原始数据的高维性,为了更好的表征样本,样本特征维度也比较高。而在高维的小样本上去训练判别器,容易导致判别器过拟合。因此本文主要目的是针对计算机视觉中的高维小样本问题,设计出若干泛化能力相对较强的判别器。由于在训练过程中,常规计算机视觉问题判别器的输入包括如下几部分:样本,标签,或对应的任务编号(如果是多任务问题)。因此本文从样本学习顺序,样本任务间关联性,样本表征能力,自动扩大样本四个方面以及这些方面相互结合的角度出发去设计泛化能力更强的判别器。具体如下:首先从样本学习顺序角度出发,提出了一种新的计算机学习框架——基于特权信息的自步学习(Self-Paced Learning with Privileged Information,SPL+)。自步学习是一种鲁棒的计算机学习算法框架。受认知学启发,它的判别器先从简单数据开始学习,逐步引入复杂数据从而学得更加成熟的模型。但在自步学习中决定数据难易顺序的课程完全由数据自身决定,不能嵌入先验知识,使得算法容易过拟合。SPL+把特权信息作为先验知识引入到自步学习框架中,去指导自步学习课程的生成。因为有了高层鲁棒特权信息的指导,判别器学习的课程更符合实际情况,从而能得到更鲁棒的模型。在动作识别,场景识别,手写字符识别等计算机视觉应用场景下的大量实验表明SPL+比传统自步学习效果更好。其次从样本任务间关联性的角度出发,提出了一种新的多任务分类框架——基于序列实例和任务的多任务分类(Multi-Task Classification with Sequential Instance and Tasks,MTSIT)。不同于传统多任务分类算法,把实例和任务同等对待;受认知学启发,本文认为任务之间以及任务内实例之间是有难易之分的,所以本文把一个自步算子引入到序列多任务学习(Sequential Multi-Task learning,SeqMT)框架对应的子任务里。SeqMT算法的机理是前一个任务和后一个任务通过共享类似的判别器参数来进行知识迁移。为了高效求解MTSIT,本文提出了一个基于MTSIT错误率上界限的求解算法——任务到实例和实例到任务(Tasks-to-Instances and Instances-to-Tasks,TIIT)。在三个计算机视觉数据集上的大量实验表明了MTSIT的有效性。然后从样本表征能力的角度出发,提出了一种新的图像分类算法——基于多模态自步学习的图像分类(Multi-modal Self-Paced Learning for image classification,MSPL)。自步学习是一种鲁棒的计算机学习算法框架。但是基于自步学习的图像识别无法处理多模态信息。因为图像的视觉特征通常可以从多个模态来表征,如果只利用其中一个模态,可能会丢失其它模态的互补信息。为了克服上面的问题,本文提出了MSPL框架来进行图像识别,它是通过把SPL和多模态学习统一在一个框架下同时学习来实现的。因为MSPL学出来的多模态课程(样本训练顺序)综合考虑了样本层和模态层由难到易信息,所以能学到一个更好的模型。在四个图像数据集上的大量实验表明了MSPL的有效性.最后从自动扩大样本的角度出发,提出了一种新的去雨算法——基于循环一致对抗网络的图像去雨(Image De-raining via a Cycle-Consistent Adversarial Networks,IDCCGAN)。不同于现在经典的图像去雨算法需要大量有雨和背景配对图像,由于使用了循环一致对抗网络,本文用于训练的神经网络不需要有雨和背景配对图像。此外本文还提出了一种名为循环一致属性保真损失函数。把该损失函数引入到循环一致对抗网络中使得本文算法处理后的去雨图像在传统计算机视觉任务下效果更鲁棒。在大量仿真和实际数据集上的实验都表明了本文算法的鲁棒性。

二、“V=π∫y~2dx”的由来(论文开题报告)

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、“V=π∫y~2dx”的由来(论文提纲范文)

(3)Ambarzumyan Theorems for Dirac Operators(论文提纲范文)

1 Introduction
2 Statement of Results
3 The Second Power of Dirac Operators
4 Some Results for the Sturm-Liouville Operator
5 The Characteristic Equations for Operators L2
6 Proof of Theorem

(4)保险投资及契约设计研究(论文提纲范文)

摘要
Abstract
第一章 绪论
    1.1 选题背景和意义
    1.2 国内外研究现状
    1.3 本文的主要工作和创新点
第二章 保险投资模型
    2.1 引言
    2.2 模糊随机单险种投资模型
    2.3 模糊随机双险种投资模型
    2.4 小结
第三章 免赔契约模型
    3.1 引言
    3.2 模糊免赔契约模型
    3.3 模糊投资免赔契约模型
    3.4 小结
第四章 共保契约模型
    4.1 引言
    4.2 模糊共保契约模型
    4.3 最优契约的必要条件
    4.4 算例
    4.5 小结
第五章 等待时间契约模型
    5.1 引言
    5.2 模糊等待时间契约模型
    5.3 最优契约的必要条件
    5.4 算例
    5.5 小结
第六章 雇佣契约模型
    6.1 引言
    6.2 过度自信雇佣契约模型
    6.3 最优契约
    6.4 数值算例
    6.5 小结
附录A 不确定理论基础
总结与展望
参考文献
发表论文与科研项目
致谢

(5)旋转体体积计算中的微元法思想应用(论文提纲范文)

1 引言
2 旋转轴为坐标轴的情况
3 旋转轴不平行于坐标轴的情况
    3.1 二重积分方法
    3.2 曲线积分方法
4 结论

(6)一类三次李氏卵圆(论文提纲范文)

1 定义
2 一类三次李氏卵圆方程
3 三次李氏卵圆的切线方程和法线方程
4 三次李氏卵圆旋转卵球体的体积
5 实例与仿真验证
    5.1 实例
    5.2 仿真验证
6 结语

(7)陈志坚的《微积阐详》(论文提纲范文)

中文摘要
ABSTRACT
引言
    1. 历史背景
    2.研究基础
    3.选题意义和论文框架
第一章 陈志坚及其主要中算成就
    第一节 陈志坚简介
    第二节 陈志坚的主要中算成就
        1. 整数勾股形
        2. 不定方程的研究
        3. 连分数开方
第二章 《微积阐详》微分部分
    第一节 序言和凡例
        1. 序言
        2. 凡例
    第二节 卷一
    第三节 卷二
    第四节 卷三
第三章 积分部分
    第一节 卷四
    第二节 卷五
第四章 《微积阐详》与同类作品比较分析
    第一节《微积阐详》与《代微积拾级》比较分析
        1. 李善兰简介
        2. 微分部分比较
        3. 积分部分比较
        4. 符号和设题特点比较
    第二节《微积阐详》和《万象一原》之间的比较
        1. 夏鸾翔简介
        2. 《微积阐详》与《万象一原》的比较
    第三节《微积阐详》与《西算新法》比较分析
        1. 冯桂芬、陈阳简介
        2. 《微积阐详》与《西算新法直解》比较分析
第五章 中、日两国接受微积分的比较
    第一节 从外史角度比较分析
        1. 背景知识
        2. 中、日出使团
        3. 晚清赴美幼童
        4. 郭嵩焘和马建忠
    第二节 从两国割圆术差异看微积分接受基础情况
结语
参考文献
致谢

(8)吸收布朗运动的拟遍历性及其相关问题(论文提纲范文)

摘要
Abstract
第1章 引言
    1.1 问题背景介绍
    1.2 主要工作和结构安排
第2章 预备知识
第3章 拟遍历行为
    3.1 拟遍历性
    3.2 分式拟遍历性
    3.3 平均拟遍历性
    3.4 极限过程的遍历性行为
第4章 遍历速度和Dirichlet特征值
    4.1 拟遍历速度
    4.2 分式拟遍历速度
    4.3 极限过程遍历速度
    4.4 一维吸收布朗运动
第5章 偏差不等式
    5.1 凸性定理
    5.2 偏差不等式
第6章 大偏差
    6.1 吸收布朗运动的大偏差
    6.2 极限扩散过程的大偏差
第7章 结论
    7.1 本论文的主要工作
    7.2 可进一步开展的研究工作
参考文献
致谢
个人简历、在学期间发表的学术论文与研究成果

(9)基于强化学习的时间序列决策系统设计与应用(论文提纲范文)

摘要
ABSTRACT
主要符号对照表
第一章 绪论
    1.1 研究背景与意义
    1.2 国内外研究现状
        1.2.1 强化学习算法的研究概述
        1.2.2 本研究领域存在的问题
    1.3 本文的研究内容
    1.4 本文的结构安排
第二章 强化学习的理论基础与信息更新观点
    2.1 引言
    2.2 强化学习的核心思想
    2.3 强化学习的构成要素
    2.4 强化学习的分类方式
    2.5 强化学习算法的信息更新观点
        2.5.1 实时更新只有一个状态的回报信息:多臂老虎机
        2.5.2 实验结束更新回报信息:蒙特卡罗方法
        2.5.3 等待下一步真实奖励来近似回报信息:时间差分方法
        2.5.4 等待n步真实奖励来近似回报信息:n步自举方法
        2.5.5 在线更新任意形式的回报信息:适迹法
        2.5.6 用真实回报信息更新策略函数:REINFORCE方法
        2.5.7 用近似回报信息更新策略函数和值函数:Actor–Critic算法
        2.5.8 回报信息完全未知:反向强化学习
    2.6 强化学习算法与其他类型算法的联系
        2.6.1 强化学习转化为有监督学习
        2.6.2 强化学习转化为无监督学习
    2.7 强化学习的局限性
    2.8 本章小节
第三章 基于机理模型的序列决策系统设计
    3.1 引言
    3.2 时间差分方法
        3.2.1 GPI准则
        3.2.2 Q-学习算法
        3.2.3 深度Q-网络
    3.3 交互平台的构建与USV任务描述
        3.3.1 建立基于机理模型的交互平台
        3.3.2 USV避障任务的问题描述
        3.3.3 USV逃逸任务的问题描述
    3.4 奖励塑形与USV避障任务的势函数设计
    3.5 模糊推理与USV逃逸任务的知识嵌入
    3.6 本章小结
第四章 基于数据驱动的序列决策系统设计
    4.1 引言
    4.2 时间序列分析方法
    4.3 研究对象分析与决策任务描述
        4.3.1 燃烧优化任务的实施对象
        4.3.2 燃烧优化任务描述
    4.4 基于数据驱动的预测单元构建
    4.5 决策系统的动作编码设计
    4.6 基于强化学习的决策单元构建
    4.7 序列决策单元的训练与在线优化
    4.8 本章小结
第五章 基于无模型持续任务的序列决策系统设计
    5.1 引言
    5.2 持续性任务的折扣失效问题
    5.3 研究对象与决策任务描述
        5.3.1 实时竞价广告系统的构成
        5.3.2 持续性实时广告竞价任务描述
    5.4 无模型持续性实时广告竞价系统架构
    5.5 基于强化学习的实时广告竞价统一视角
    5.6 实时广告竞价的可微半梯度Sarsa(0)算法
    5.7 基于策略初始化的知识嵌入
    5.8 训练过程与性能分析
        5.8.1 数据描述与参数设定
        5.8.2 竞价策略的比较
        5.8.3 训练过程与策略优化
    5.9 单广告商环境实验结果与性能比较
    5.10 本章小结
第六章 总结与展望
    6.1 本文总结
    6.2 未来展望
参考文献
致谢
攻读学位期间的学术成果目录
攻读学位期间申请的发明专利目录
攻读学位期间参与的项目

(10)小样本计算机视觉问题的研究(论文提纲范文)

摘要
abstract
第一章 绪论
    1.1 研究背景及研究意义
    1.2 国内外研究现状
        1.2.1 自步学习
        1.2.2 多任务学习
        1.2.3 多模态学习
        1.2.4 生成式对抗网络
    1.3 研究动机及本文结构
第二章 基于特权信息的自步学习
    2.1 引言
    2.2 背景知识简介
        2.2.1 自步学习
        2.2.2 特权学习
    2.3 基于特权信息的自步学习
        2.3.1 基本概念
        2.3.2 建模
        2.3.3 优化算法
    2.4 实验结果
        2.4.1 对比算法
        2.4.2 数据集,特征,实验配置和参数选择
        2.4.3 实验结果
        2.4.4 模型分析
        2.4.5 训练时间
    2.5 本章小结
第三章 基于序列实例和任务的多任务分类
    3.1 引言
    3.2 背景知识简介
        3.2.1 多任务学习
        3.2.2 自步学习
    3.3 基于序列实例和任务的多任务分类
        3.3.1 基本概念
        3.3.2 基于序列任务的多任务分类
        3.3.3 基于序列实例和任务的多任务分类
    3.4 优化算法
        3.4.1 任务到实例
        3.4.2 实例到任务
        3.4.3 整个优化过程
        3.4.4 理论分析
    3.5 实验结果
        3.5.1 对比算法
        3.5.2 数据集,特征,实验配置和参数选择
        3.5.3 实验结果
        3.5.4 模型分析
        3.5.5 训练时间
    3.6 本章小结
第四章 基于多模态自步学习的图像分类
    4.1 引言
    4.2 背景知识
        4.2.1 自步学习
        4.2.2 多模态学习
    4.3 基于多模态自步学习的图像分类
        4.3.1 基本概念
        4.3.2 建模
        4.3.3 优化算法
    4.4 实验结果
        4.4.1 对比算法
        4.4.2 数据集,特征,实验配置和参数选择
        4.4.3 实验结果
        4.4.4 模型分析
        4.4.5 对比基于深度学习特征的方法
        4.4.6 训练时间
    4.5 本章小结
第五章 基于循环一致对抗网络的图像去雨
    5.1 引言
    5.2 背景知识
        5.2.1 单幅图像去雨
        5.2.2 生成式对抗网络
    5.3 基于循环一致对抗网络的无配对图像去雨
        5.3.1 基本概念
        5.3.2 建模
        5.3.3 网络结构
    5.4 实验结果
        5.4.1 对比算法
        5.4.2 数据集,实验配置和参数选择
        5.4.3 实验结果
        5.4.4 模型分析
        5.4.5 运行时间对比
        5.4.6 高层任务效果
    5.5 本章小结
第六章 总结与展望
    6.1 全文总结
    6.2 未来工作
        6.2.1 算法方向
        6.2.2 应用方向
参考文献
致谢
攻读学位期间发表的学术论文
攻读学位期间参与的项目

四、“V=π∫y~2dx”的由来(论文参考文献)

  • [1]Cryptography on twisted Edwards curves over local fields[J]. TANG ChunMing,XU MaoZhi,QI YanFeng. Science China(Information Sciences), 2015(01)
  • [2]原子核物理中的协变密度泛函理论[J]. 孟杰,郭建友,李剑,李志攀,梁豪兆,龙文辉,牛一斐,牛中明,尧江明,张颖,赵鹏巍,周善贵. 物理学进展, 2011(04)
  • [3]Ambarzumyan Theorems for Dirac Operators[J]. Chuan-fu YANG,Feng WANG,Zhen-you HUANG. Acta Mathematicae Applicatae Sinica, 2021(02)
  • [4]保险投资及契约设计研究[D]. 宋庆凤. 天津大学, 2012(07)
  • [5]旋转体体积计算中的微元法思想应用[J]. 张健. 大学数学, 2017(04)
  • [6]一类三次李氏卵圆[J]. 李湘江. 甘肃科学学报, 2020(01)
  • [7]陈志坚的《微积阐详》[D]. 程勇. 内蒙古师范大学, 2010(04)
  • [8]吸收布朗运动的拟遍历性及其相关问题[D]. 简思綦. 清华大学, 2012(10)
  • [9]基于强化学习的时间序列决策系统设计与应用[D]. 程引. 上海交通大学, 2018(06)
  • [10]小样本计算机视觉问题的研究[D]. 徐伟. 上海交通大学, 2018(01)

标签:;  ;  ;  ;  ;  

“V=π∫y~2dx”的由来
下载Doc文档

猜你喜欢