一、自动分词软件质量的评价模型(论文文献综述)
刘忠宝,赵文娟[1](2021)在《古籍信息处理回顾与展望》文中认为随着大数据时代的到来,古籍信息处理迎来前所未有的发展良机。此文从技术方法及其演进角度,对古籍数据挖掘、古籍信息系统构建、古籍信息服务等方面进行回顾和总结,并对未来的研究趋势进行展望。研究表明,越来越多的研究人员开始关注该领域并产生不少研究成果,但仍然面临一系列未解难题,如古籍数据挖掘能力不强、古籍信息系统构建效率低下、古籍信息服务水平尚有差距。未来研究应从古籍数字资源共享体系、高性能古籍信息处理模型、古籍信息服务评价等方面展开。此次梳理和展望有助于研究人员全面了解古籍信息处理现状,方便古籍信息资源的研究与利用;有助于推动古籍信息处理多学科融合与国际化合作。
汪天雄[2](2021)在《在线用户评价驱动的产品形态进化设计方法研究》文中提出以用户为中心的产品设计是产品制造企业坚持的重要设计理念,因而缩小产品设计与用户需求之间的差距始终是设计研究的重要目标。感性工学是一种能将用户需求通过科学手法映射为设计要素的技术。在感性工学的研究过程中有三点问题:第一、在产品感性意象空间的建构过程中,感性意象词汇的提取往往来源于杂志、手册或报告,因而没有全面反映消费者真实的情感需求,采集量较少。第二、在感性意象维度的提炼过程中通常采用调研结合因子分析与聚类算法进行降维,产生了数据更新慢、采集效率低的问题。第三、如何将产品的感性意象推导为设计要素,构建产品设计要素与用户感性意象之间的量化映射关系,提高训练与预测的准确度是感性工学研究的关键问题。传统感性工学所采用的线性与非线性模型所建立的映射关系模型通常误差较大,同时也缺乏对许多设计要素组成的产品整体形态耦合性进行分析。鉴于此,本研究结合感性工学理论与研究框架,运用文本挖掘与自然语言处理分析电商平台用户在线评价文本,并从中获取用户真实的感性需求信息,以更快捷、更高效的方式建构产品感性意象空间。通过采用回归型支持向量机建立设计要素与感性需求之间的关联关系,并构建产品形态意象的评价与预测模型。最后,基于交互式遗传算法构建产品形态进化设计系统,生成满足用户偏好的产品创新设计方案,为复杂产品形态设计的研究拓宽了理论边界,同时也降低了产品开发成本和时间,为设计出满足用户需求的产品提供了行之有效的理论参考与思路方法,具有良好的产品设计理论与实践指导意义。本研究完成的主要研究工作如下:(1)获取电动自行车产品网络在线用户评价文本。使用Python软件编写爬虫函数获取网络在线用户评论信息,基于淘宝与京东两大电商平台,选择评论数超过15条且产品形态符合新国标标准的电动自行车产品进行评论爬取,一共选择48款电动自行车产品,共爬取由288510个字组成的评价文本;依据文本预处理规则去除与文本语意无强烈关联的停用词,并应用Jieba工具对评价文本执行分词处理。(2)采用文本挖掘准确分析用户感性意象需求。运用TF-IDF关键词提取方法分析在线用户评价中用户感性意象关键词,完成了 260个产品感性词汇的收集;综合焦点小组与KJ法,合并并简化成67个感性意象词汇;为识别其语意特征,对结果运用WordNet工具检索语意同义词与反义词形成语意网络;通过应用社会地位关系分析网络中具有代表性的感性语意词汇,构建出用户感性意象语意空间;为分析用户感性意象需求与情感满意度之间的关系,采用模糊Kano模型识别并分类用户需求,从中筛选出表现为兴奋型的感性意象需求,分别为“简约的”、“科技的”、“精致的”、“灵巧的”与“时尚”的感性意象需求。(3)建立基于用户情感偏好的产品意象评价模型。采用评价构造法调研出产品吸引用户的形态特征,获得542项产品形态要素,并通过KJ法合并相似要素,构建出产品形态小型数据集,获得28项产品形态设计要素;对产品样本进行语意差异法实验,基于回归型支持向量机建立产品形态要素与用户感性意象之间的映射关联关系,建立符合用户情感认知的产品多维感性意象评价模型;通过与传统BP神经网络算法误差结果的对比论证了所建立评价模型的优势,同时也对模型的精度与性能进行有效验证,从而辅助设计师准确进行市场定位。(4)产品形态进化生成与设计评价。基于所建构电动自行车产品形态数据集,对设计要素进行二进制编码;依据所分析出的用户重点感性诉求,应用模糊层次分析法计算感性诉求的权重,以此调整产品个体适应度;以消费者感性偏好为评价目标,基于交互式遗传算法建立产品意象形态进化设计系统,为有效避免用户在评价中的模糊性和不确定性所引起的个体适应度偏差,并降低用户疲劳程度,采用用户评价犹豫时间来改进个体适应度;利用基于回归型支持向量机的感性意象评价模型进行自动评价,进一步降低并缓解用户评价过程中产生的疲劳;对产品意象形态进化设计结果运用Rhino软件进行三维建模,同时运用模糊综合评价法对产品设计方案的用户满意度进行检验;评价结果验证了本研究所构建的产品意象形态进化设计方法的有效性。本文以用户感性意象语意空间的构建及产品意象形态进化设计为出发点,对满足用户偏好的产品形态进行研究,所取得的研究成果能有效指导企业进行产品形态的创新设计,辅助设计师在产品设计过程中提升设计效率,对企业产品研发具有重要的实践应用价值。与此同时,也对感性工学理论与方法研究进行了有效补充与完善。
刘炳麟[3](2021)在《基于检索式和生成式相结合的聊天机器人研究与实现》文中研究指明新时代的不断发展,计算机技术不断进步,人工智能、大数据等技术高速的发展。深度学习广泛应用于自然语言处理、中文分词技术、词向量技术等领域。同时大量的智能音箱和在线客服进入人们的生活。聊天机器人越来越受欢迎,拥有极大的市场发展潜力。当前在聊天机器人的开发模型设计中,最普遍的深度学习设计方案就是Seq2Seq模型,但是用传统的Seq2Seq模型直接设计聊天机器人,总是会出现许多问题。如无法进行多轮次对话、经常产生无意义的“安全回复”等缺陷等各种问题。对传统模型方案Seq2Seq出现的不足,构建一个全新的聊天机器人对话模型,将双向长短时记忆网络(Bi LSTM)、注意力机制(Attention)、传统Seq2Seq模型和Beam Search算法相结合得到的新的聊天机器人对话模型,同时在此基础上加入一个检索式对话模型。通过生成式对话模型可以跟用户进行日常的闲聊,而检索式模型可以对用户的消息进行检索相似度最好的句子来进行准确的回复。具体的研究工作如下:首先研究了中文自动分词、词性标注和词向量等各种关键知识。在对词语进行表达时,如果两个词语之间意思非常接近,那么简单的采用传统的方式很容易形成歧义。当面对处理数量极大的数据时,会出现向量维度过大的问题。通过自动分词最大限度的消除词语的歧义带来的误差。并使用语言模型将用户输入的文本信息转换成词向量,使得词向量带有语义信息。然后分析了传统Seq2Seq模型在处理长序列问题时丢失部分语义的问题,提出了一种将注意力机制与双向长短时记忆网络模型相结合的方法。在过去的模型中编码器和解码器之间只使用一个长度固定的向量。通过应用注意力机制将编码器输入的消息的中间输出结果保留下来,让模型有选择的学习,当模型进行信息输出时关联输入和输出序列,这样即使是较长的问题依然可以保证信息的完整性。并在最后结合Beam Search算法减少无意义的“安全回复”,让回复更加有效、多样。同时对比LSTM与Bi LSTM得出,如果采用Bi LSTM可以实现语义的双向预测,这样也可以有效的解决了部分语义丢失。而LSTM无法对信息从后到前进行编码。同时在生成式回复模型的基础上结合一个检索式回复模型,针对高校相关信息回复,检索式回复模型更加准确。使聊天机器人同时兼顾日常闲聊和特定领域的信息获取功能。最后实现了一个运行在微信公众号的聊天机器人。将本文提到的模型接入到微信公号平台中去,能够让用户操作方便,符合平时使用习惯。只需要关注微信公众号就可以同聊天机器人进行相关的信息获取和日常闲聊的交流。
谢香腾[4](2021)在《藏语卫藏方言的语音合成技术研究》文中指出语音合成技术是信息处理领域的一项前沿技术。近几年来我国藏文信息技术实现了跨越式发展,对西藏经济社会发展起到积极作用,但藏语语音合成技术的研究还有很大发展空间,这主要是由于缺乏对藏语语音的深入研究,以及受限于资源的匮乏,目前在该研究领域少见一款达到实用效果的语音合成系统,已有的研究成果都处于实验阶段。因此,深入研究并尽早解决藏语语音合成的关键技术,形成整体解决方案是目前在信息处理领域至关重要的研究内容,这将有助于推动西藏文化的发展和繁荣、扩大西藏特色文化的国际影响力、增强我国藏族地区信息化自我发展能力、加速藏语言文字与现代化接轨的步伐。本文是以卫藏方言为主的藏语语音合成的研究,该文首先采用基于HMM模型“参数合成”的传统方法,主要剖析了目前在藏语语音合成前端文本分析中涉及到的相关技术,其主要包括藏语音素分析、拉丁转写、音段标注和韵律标注、藏语发音规律、藏语多音词分析、特殊符号处理、藏文自动分词、词性标注等前端语言模型涉及到的关键问题,最终前端文本分析结果生成一套韵律文本,为后端声学模型提供必要信息。考虑到基于HMM模型“参数合成”的传统方法合成的语音存在不自然、音色不好、可懂度还不够好的缺点,本文最后引入了目前在业界最为流行的“端到端合成”方法,即基于深度学习的“端到端合成”—Tacotron模型。本文研究了基于注意力机制的Encoder-Decoder结构的藏语语音转换模型,通过借鉴主流语言语音转换的模型架构,实现输入为字符、输出为声谱图的藏语语音转换技术。最后经过实验对“端到端合成”深度学习模型的合成效果进行了相应的客观评价和主观评价。通过和基于HMM统计参数合成的MOS评分结果进行比较,可以明显看出采用Tacotron模型合成的效果优于参数合成的效果,分析其评测标准,无论是从语音的音色、自然度和可懂度,基于“端到端合成”的MOS评分结果要大于“参数合成”的评分结果(“端到端合成”得分4.73分(或4.61分)>“参数合成”得分3.96分)。另外通过对主流的“端到端合成”Tacotron模型进行详细分析可以看出,当对模型进行训练25000次后,注意力机制的对齐效果和合成语音的语谱图都取得了较好的效果,不管是对合成的语音进行整体分析,还是从合成语音的音色、自然度和可懂度三个方面分别来剖析,得到的结果都是使用Tacotron模型合成的卫藏方言语音的得分要高于基于统计参数合成语音的得分。因此,基于“端到端”的合成方法在藏语语音合成方面具有研究及应用价值。
剡雅静[5](2021)在《面向留学生汉语朗读的韵律边界预测的研究》文中提出“一带一路”的发展,扩大了来华留学生的规模,汉语在世界语言中的地位越来越高,但留学生在学习汉语时,总是受其母语发音习惯的影响。从汉语文本中预测出韵律结构可以帮助留学生提高汉语水平,使留学生抑扬顿挫地说普通话。本文以留学生为研究对象,分析了汉语文本的句法结构与韵律结构之间的关系,重点研究了韵律词和韵律短语的预测,在此基础上评测了留学生汉语朗读的流利度分数。论文的研究结果对于揭示文本与语音之间的关系、提高留学生口语流利度具有重要的理论意义和应用价值。本论文的主要工作和创新如下:1.建立了一个大规模的文本语料库和一个1300句的留学生录音语料库。文本语料库包含10万句中文语料,标注了词性和韵律边界信息,韵律信息在语言学专家的指导下手工标注。录音语料库共有6位留学生和1位汉语母语说话人参与录制,并从音节、音素的覆盖性和全面性进行了统计评估,最终结果表明,这两个语料库可用于汉语韵律结构预测的研究和留学生汉语朗读语音的评测。2.实现了基于深度学习方法的汉语韵律边界预测。三种预测模型分别为双向长短时记忆网络(Bi-directional Long Short-term Memory,Bi LSTM)模型,序列到序列(Sequence to sequence,Seq2seq)模型和序列到序列加注意力机制(Sequence to sequence with Attention,Seq2seq_Attention)模型。同时,也提出了一种用于汉语韵律短语边界预测的句法层级数(Syntactic Hierarchical Number,SHN)特征,用于描述汉语句子的句法结构和韵律结构之间的关系。结合词性、词长等不同的韵律特征,分别进行了韵律词和韵律短语的边界预测实验。实验结果表明,Seq2seq_Attention模型在韵律词的边界预测中效果表现最好,F1分数为98.14%。加入了句法层级数特征的Seq2seq_Attention模型(Seq2seq_Attention_SHN)对韵律短语的边界预测结果比其他方法更有效,F1分数达到了83.12%。3.评测了留学生汉语朗读的语音流利度。为了验证韵律边界预测方法对留学生口语的提升,在韵律边界预测的实验结果中,选取了100句带韵律边界标注的文本并分别让留学生录音,用语音评测软件系统自动对发音水平进行评价,得到流利度分数(取值范围0~100)。语音评测结果表明,留学生口语流利度分数提升了7.31~15.30,平均提升了12.11,证明了本文的研究工作可以帮助留学生掌握韵律结构,口语表达的更好。
才让卓玛(Tsering Dolma)[6](2021)在《基于语料库的藏语状态词研究》文中研究表明自然语言处理是一门重点研究人与计算机交互中的自然语言理解的学科,在物联网智能服务领域具有重要作用。语法知识库建设作为自然语言处理领域的基础性工程一直是研究人员所关注的核心问题,在机器翻译、问答系统、情感分析构建中起到支撑作用。在机器学习技术和语料库方法于诸多领域取得重要进展的背景下,将其与藏语自然语言处理相结合成为大势所趋。因此,本论文采用基于语料库的实证法,研究藏语状态词,构建适用于自然语言处理的状态词语法知识库,其具有显着的研究意义和应用价值。论文首先对藏文网页资源库建设进行了研究。通过网络爬虫技术从互联网中抓取与物联网相关的文本数据,并经编码识别与转换,藏文分析软件分词,算法框架关键词抽取,基本实现了对关键词的知识抽取。实验结果表明,相比传统的学习方法,自动抽取模型获得了较大的性能提升,效果尚可。其次对状态词进行了多方面的考察。从形式特征出发,分别考察了构成理据、语法特征、认知方式,对其句法功能进行了细致的描写,并从现代句法分析理论将其句法知识进行了形式化描述。论文最后对状态词语法知识库构建作了探索和设计,根据每项词语的属性信息,其概念的确定提供形式化依据,使用Microsoft Access完成建库,并进行初步的逻辑推理和逻辑检验。
王照卫[7](2021)在《基于条件随机场的中文分词方法研究与应用》文中认为随着社会发展越来越快,政府自身和人民群众对政府要求越来越高。原有的公文检索和管理方法已无法支撑现有工作开展,必须采用基于全文检索系统的政府公文管理系统,目前全文检索系统的关键技术是中文分词,本文采用基于统计模型(条件随机场)的自动分词方法,相较于基于词表或者依赖词表的分词方法具备人力成本低、总体效率高的特点。条件随机场(Condition Random Fields,CRF)模型的中文分词应用到政府公文领域,存在两个不足:现有条件随机场模型采用的特征在政府公文语料分词中准确度不高;基于条件随机场模型的中文分词都注重分词准确率,不注重分词后的易歧义标记和歧义消解,导致歧义消解效果不理想,未能有效的提高分词准确率。因此本文提出了一种融合特征方法,能够有效提升分词准确率(评价指标F值)。在融合特征F值提升达到瓶颈后,提出了基于易歧义标记的歧义消解方法,进一步的提升了分词F值。在此基础上,应用以上方法到全文检索系统,有效提升公文检索的准确率。主要工作如下:1、针对现有条件随机场模型特征在政府公文语料分词中准确度不高,提出了面向政府公文领域的中文分词融合特征,融合特征采用了一元5字结合二元3字特征模板,4词位的位置特征,词长特征和字的类型的优化特征的融合。实验结果表明,融合特征能够取得F值92.84%,比其他特征更加有效。2、采用中文分词融合特征方法后,F值提升达到瓶颈,为了进一步提升分词F值,本文提出了基于易歧义标记的歧义消解方法,该方法通过对稳固词串和稳固词、语料平衡、特征平衡的识别,标记易歧义的分词,然后采用互信息、边界熵、稳固词串和稳固词等方法解决歧义消解。实验结果表明,基于易歧义标记的歧义消解方法能有效提高F值,到达94.42%,相比于其他方法,具有较高的分词准确率、召回率和F值。3、在此基础上,将以上两种中文分词方法应用到成都市规划和自然资源局的全文检索系统中。本文通过调查问卷的方式,采集到成都市规划和自然资源局业务人员日常工作对政府公文检索功能的使用情况,根据业务需求,设计了召回率和人工检索代价指标,对比了全文检索系统和原公文查询系统。系统实际使用测试情况表明,全文检索系统相较于原公文查询系统,能有效的返回与检索的关键字相关度高的公文,具有较高的召回率(93.42%)和较低的人工检索代价(3.38)。
多杰才让[8](2021)在《基于深度学习的藏语依存句法分析技术研究》文中研究说明藏语依存句法分析是对藏语句子成分进行有效分析,得出藏语句子成分之间的一种依存关系或者支配关系。其过程主要包括藏语词法分析中的藏文分词、词性标注以及上一层的依存关系分析。因此,藏语依存句法分析是藏语自然语言处理的核心任务,在藏语自然语言处理中起着枢纽的作用。藏语言也是我国独具特色的民族语言,若有相关的工具对其进行自动分析和处理,能为相关研究人员节省前期大量的工作时间从而提供很大的便利。然而,可用于藏语依存句法研究的语料库相对较少,且相关的研究工作跟汉、英相比目前还不够成熟,所以藏语依存句法分析的研究仍需加强。很多学者和研究者对藏语依存句法分析研究时运用了很多的方法,但未曾使用神经网络的方法。针对以上问题,本文的研究从已有的藏语依存句法分析理论和方法出发,深入的分析了藏语依存句法分析的特点,并结合现有的研究成果展开了更符合藏语特点的依存句法分析研究工作。具体研究内容如下:(1)一体化的藏语分词及词性标注策略在藏语依存句法分析中分词和词性标注是必然的存在。因此,根据藏语依存句法分析语料构建的需求。本文通过人工构建藏文分词和词性标记语料,提出了基于Transformer的藏语文本自动分词和词性标记并行处理的方法,为藏语依存句法分析做了前期的铺垫。(2)藏语依存句法树库规范及构建藏语依存句法标注数据非常稀缺,为此本文提出了一种转换算法,将8252条括弧结构的藏语依存句法树转为Co NLL格式语料,降低了人工构建依存树库的成本。在此基础上通过人工标记、分词和词性标记等环节扩充了2771条藏语依存句法树,最终总共构建了11023条藏语依存句法树。最后研究了藏语依存结构,改进并完善了藏语依存标注规范,为藏语依存句法分析奠定了基础。(3)基于深度学习的藏语依存句法分析根据藏语依存句法分析已有的经验和理论基础,并结合藏语句法特征提出了基于转移+深度学习的藏语依存句法分析模型,通过对标注好的藏语句子序列利用栈和队列原理进行转移,将转移结果融入神经网络模型中。经实验,在测试集和验证集上准确率分别为94.59%和86.44%.
王翔宇[9](2020)在《基于领域本体的农药信息语义查询系统研究与实现》文中研究表明农药是农业生产活动中重要的农用物资,可以防治病虫害、维持作物正常生长,从而提高作物产量、作物质量,增加农业收入。面对作物病虫害,关于农药的选择和安全合理使用,以及对于农药中毒后的急救处理便成为农业生产活动中不可回避的问题。针对当前农药信息系统多是基于关键字的查询系统,且农药使用信息较为分散,缺乏系统化,尤其缺乏对未知农药的中毒急救查询等问题。本文研究了对农药使用信息和未知农药中毒急救的语义查询方法,设计并实现了基于领域本体的农药信息语义查询系统。主要研究内容如下:(1)构建农药和农作物领域本体。首先需要建立农药和农作物领域本体,信息源于中国农业出版社出版的《农业科学叙词表》以及部分已搜集整理的信息,辅以网络爬虫Scrapy框架,爬取目标网站信息以及权威书籍和相关领域文章作为本体构建信息的补全与后续的更新来源。改进了用于领域本体构建的七步法(增加验证与评价本体、持久化为关系型数据库这两个环节)构建农药和农作物领域本体,这是系统的关键和基础。(2)构建中毒症状本体和中毒症状用户词典。为了实现对未知农药中毒急救的查询,首先搜集并整理中毒症状与急救措施,以及用户输入的中毒症状文本,确定要添加的中毒的部位、表现、接触方式、农药名这几类词,并在筛选后构建中毒症状本体,再以本体主要内容构建NLPIR系统的中毒症状用户词典。系统对用户输入的文本进行分词,提取关键词并在中毒症状本体中查询关键词的同近义词,最后将查询结果作为查询条件,在农药和农作物领域本体数据库中查询农药的中毒症状与急救措施等属性,根据关键词的数量逐步缩小查询结果范围。(3)基于农药和农作物领域本体的语义查询过程。利用农药和农作物领域本体数据库和农药使用信息数据库设计了农药使用信息的语义查询功能,利用中毒症状本体数据库、中毒症状用户词典、农药和农作物领域本体数据库设计了未知农药中毒急救语义查询功能。(4)基于领域本体的农药信息语义查询系统设计与实现。主要功能都依赖于农药和农作物领域本体的内容,实现用户对农药和农作物分类体系浏览、农药使用信息语义查询、未知农药中毒急救语义查询功能,以及对系统的意见反馈。管理员则通过修改本体文件和用户词典以及数据库等信息对系统数据做出修改和更新,并按照用户合理反馈对系统进行更进一步地更新与完善。
陶哲源[10](2020)在《基于在线评价的消费者网购满意度影响因素分析 ——以京东商城光学眼镜类产品为例》文中指出随着互联网技术的成熟、物流网络的完善以及人们观念的转变,网络购物因为其丰富的商品,实惠的价格以及足不出户的便利性,深受消费者喜爱。5G技术的出现更是带了全新的全场景沉浸式网购模式。目前国内主要的网络购物平台有淘宝、京东、苏宁易购、拼多多等。据国家统计局数据显示,2019年,全国网上零售额106324亿元,比上年增长16.5%,占社会消费品零售总额的25%以上,是消费市场重要的组成部分,而且发展潜力巨大,是零售企业极力开拓的市场。在线评价是消费者在购物之后对商品满意度的直接体现,既影响其他消费者的购物决策,也对企业具有重要意义。通过对在线评价进行文本挖掘,得出消费者对商品满意度的影响因素,对企业理解消费者需求,提升服务质量从而实现销售额增长具有现实意义。本文以京东商城光学眼镜评论为研究对象,设计爬虫程序抽取京东商城销量最高的20款光学眼镜的11384条在线评价,通过TFIDF算法选取特征,对特征值较大的前200个关键词进行抽取,对关键词进行概念化提炼与概括初步分析出影响网购眼镜的满意度影响因素。基于机器学习的算法,训练朴素贝叶斯情感分类器,并评价分类器性能,使用分类器将评论文本分为积极情感集和消极情感集。再使用LDA主题模型分别对积极情感评价集和消极情感评价集提取主题,从而分析消费者网购眼镜的满意因素和不满意因素。网购眼镜的消费者满意度影响因素有17个,本文归纳为4个类目:产品质量类目、价格价值类目、包装物流类目、客户服务类目。根据分析结果,为京东商城光学眼镜卖家提高消费者满意度提供可靠建议;同时分析结果对潜在消费者了解网购眼镜的优缺点也有一定的意义。
二、自动分词软件质量的评价模型(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、自动分词软件质量的评价模型(论文提纲范文)
(1)古籍信息处理回顾与展望(论文提纲范文)
1 引言 |
2 基于规则的方法 |
2.1 古籍断句与标点 |
2.2 古籍分词与词性标注 |
2.3 古籍语义理解与知识发现 |
2.4 古籍知识组织与利用 |
2.5 古籍图像库构建 |
2.6 古籍元数据库 |
2.7 古籍校勘 |
3 基于机器学习的方法 |
3.1 古籍断句与标点 |
3.2 古籍分词与词性标注 |
3.3 古籍语义理解与知识发现 |
3.4 古籍知识组织与利用 |
3.5 古籍版本库构建 |
3.6 古籍知识库构建 |
3.7 古籍索引 |
3.8 古籍翻译 |
3.9 古籍检索 |
3.10 自动编撰 |
4 基于深度学习的方法 |
4.1 古籍断句与标点 |
4.2 古籍分词与词性标注 |
4.3 古籍语义理解与知识发现 |
4.4 古籍知识组织与利用 |
5 研究趋势与展望 |
5.1 古籍数据挖掘 |
5.2 古籍信息系统构建 |
5.3 古籍信息服务 |
6 总结 |
(2)在线用户评价驱动的产品形态进化设计方法研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景 |
1.1.1 选题背景 |
1.1.2 研究意义 |
1.2 国内外研究现状综述 |
1.2.1 情感体验研究 |
1.2.2 情感测量研究现状 |
1.2.3 感性工学理论与发展 |
1.2.4 自然语言处理研究现状 |
1.2.5 交互式遗传算法在产品设计中的应用现状 |
1.3 研究内容 |
1.3.1 研究内容 |
1.3.2 组织结构 |
第2章 产品感性意象空间的建构 |
2.1 产品形态意象与语意 |
2.1.1 产品形态意象 |
2.1.2 产品形态语意 |
2.2 设计意图的表达 |
2.2.1 设计编码 |
2.2.2 设计解码 |
2.3 互联网评价文本数据获取 |
2.3.1 基于评价数据的消费者感性诉求分析 |
2.3.2 文本获取与处理 |
2.4 文本语意分析模型 |
2.4.1 文本语意分析 |
2.4.2 产品感性意象语意空间的构建 |
2.5 本章小结 |
第3章 感性需求与产品设计要素映射关系模型建构方法 |
3.1 在线用户评价的需求文本挖掘 |
3.2 用户需求属性分类 |
3.2.1 基于模糊Kano模型的用户需求属性分类 |
3.2.2 模糊Kano模型的计算过程 |
3.3 需求的重要度计算 |
3.3.1 语义差异法 |
3.3.2 模糊层次分析法 |
3.4 映射关系模型建构 |
3.4.1 回归型支持向量机 |
3.4.2 神经网络 |
3.5 本章小结 |
第4章 基于文本挖掘的感性需求分析 |
4.1 确定研究案例 |
4.1.1 电动自行车产品发展现状 |
4.1.2 电动自行车产品形态特征 |
4.2 挑选实验样本 |
4.3 感性意象空间的建构过程 |
4.3.1 基于词频与KJ法的语意词汇提取与分组 |
4.3.2 基于WordNet的感性意象空间建构 |
4.3.3 感性意象词汇验证 |
4.4 基于用户满意度分类需求属性 |
4.5 本章小结 |
第5章 构建基于用户情感偏好的产品意象评价模型 |
5.1 产品感性意象偏好量化实验 |
5.2 产品形态要素数据集的构建 |
5.2.1 评价构造法 |
5.2.2 实验过程与结果 |
5.3 基于用户情感偏好的产品意象评价模型 |
5.3.1 构建感性评价矩阵 |
5.3.2 基于回归型支持向量机的产品意象评价模型 |
5.3.3 模型性能的评估 |
5.4 结果与讨论 |
5.4.1 基于BP神经网络建构预测模型 |
5.4.2 支持向量回归与BP神经网络误差对比 |
5.5 本章小结 |
第6章 产品形态进化生成与设计评价 |
6.1 基于交互式遗传算法的产品形态进化设计 |
6.1.1 IGA的进化过程 |
6.1.2 交叉与变异 |
6.1.3 产品形态元素编码及染色体结构 |
6.1.4 人口规模及初始化种群 |
6.2 实例研究 |
6.2.1 个体编码模式 |
6.2.2 产品综合适应度计算 |
6.2.3 交互式遗传算法系统的建构 |
6.2.4 系统选择算法设定 |
6.2.5 系统参数设置 |
6.2.6 系统交互界面设计 |
6.3 结果和讨论 |
6.4 产品方案设计及评价 |
6.4.1 方案设计 |
6.4.2 设计方案评价 |
6.5 本章小结 |
第7章 总结与展望 |
7.1 结论 |
7.2 创新点 |
7.3 研究局限 |
7.4 研究展望 |
参考文献 |
致谢 |
攻读博士期间完成的学术成果 |
附录 |
(3)基于检索式和生成式相结合的聊天机器人研究与实现(论文提纲范文)
中文摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 聊天机器人的分类 |
1.2.1 开放域聊天机器人 |
1.2.2 特定域聊天机器人 |
1.3 聊天机器人的价值 |
1.4 主要研究内容及论文组织结构 |
1.4.1 主要研究内容 |
1.4.2 论文组织结构 |
第2章 相关技术 |
2.1 聊天机器人技术 |
2.2 自然语言相关技术 |
2.2.1 中文自动分词 |
2.2.2 词性标注 |
2.2.3 词向量 |
2.2.4 语言模型 |
2.3 神经网络 |
2.3.1 循环神经网络(RNN) |
2.3.2 长短时记忆网络(LSTM) |
2.3.3 双向长短时记忆网络(Bi LSTM) |
2.4 本章小结 |
第3章 基于Seq2Seq的生成式模型 |
3.1 Seq2Seq 模型 |
3.2 注意力机制(Attention) |
3.3 Beam Search算法 |
3.4 生成式回复模型构建 |
3.5 实验结果与分析 |
3.5.1 实验环境 |
3.5.2 实验数据 |
3.5.3 语料数据处理 |
3.5.4 训练词向量 |
3.5.5 LSTM和 Bi LSTM模型对比 |
3.5.6 结合注意力机制模型对比 |
3.5.7 添加 Beam Search 算法的回复 |
3.6 本章小结 |
第4章 基于检索式的回复模型 |
4.1 文本相似度算法 |
4.1.1 TF-IDF算法 |
4.1.2 余弦相似度 |
4.2 检索式回复模型框架 |
4.3 实验结果与分析 |
4.3.1 实验准备 |
4.3.2 实验结果 |
4.4 本章小结 |
第5章 基于检索式和生成式相结合的聊天机器人系统的设计与实现 |
5.1 聊天机器人总体设计 |
5.2 功能设计 |
5.3 系统工作流程 |
5.4 系统实现和测试 |
5.4.1 运行环境 |
5.4.2 系统功能实现 |
5.4.3 系统评价 |
5.5 本章小结 |
第6章 总结和展望 |
6.1 工作总结 |
6.2 展望未来 |
参考文献 |
致谢 |
个人简历及在学期间的研究成果和发表的学术论文 |
(4)藏语卫藏方言的语音合成技术研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外语音合成研究现状 |
1.3 关于藏语语音合成的概述 |
1.4 本论文的组织结构 |
第二章 藏语语料库设计 |
2.1 语料库的定义 |
2.2 文本语料设计 |
2.3 语音语料设计 |
第三章 基于HMM的藏语语音合成研究 |
3.1 HMM简介 |
3.2 藏语前端语言模型研究 |
3.2.1 藏语语音特征描述 |
3.2.2 前端文本标注 |
3.2.3 藏文拉丁转写 |
3.3 藏语后端声学模型研究 |
3.3.1 韵律标注 |
3.3.2 语音声码器技术 |
3.3.3 基于决策树的上下文属性和问题集设计 |
3.4 语音合成实验评测 |
3.4.1 MOS评价标准 |
3.4.2 评测结果及分析 |
第四章 基于端到端的藏语语音合成技术研究 |
4.1 相关概述 |
4.2 Seq2Seq(序列到序列)原理 |
4.3 “端到端合成”模型架构 |
4.3.1 encoder模块 |
4.3.2 decoder模块 |
4.3.3 post-processing模块 |
4.4 模型参数 |
4.4.1 实验数据的预处理 |
4.4.2 客观评价 |
4.4.3 主观评价 |
4.4.4 实验结果分析 |
第五章 总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
攻读硕士学位期间的研究成果 |
致谢 |
(5)面向留学生汉语朗读的韵律边界预测的研究(论文提纲范文)
摘要 |
abstract |
第1章 引言 |
1.1 研究背景与意义 |
1.2 研究现状 |
1.2.1 汉语韵律结构预测的研究现状 |
1.2.2 第二语言的韵律边界研究现状 |
1.3 本文研究目的 |
1.4 论文结构安排 |
1.5 本章小结 |
第2章 留学生学习汉语存在的问题 |
2.1 韵律问题 |
2.2 流利度问题 |
2.3 本章小结 |
第3章 汉语韵律预测的理论基础 |
3.1 汉语韵律的层级结构 |
3.2 汉语自动分词 |
3.3 汉语句法分析 |
3.4 深度学习方法 |
3.4.1 词向量 |
3.4.2 双向长短时记忆网络 |
3.4.3 编码到解码网络 |
3.4.4 注意力机制 |
3.5 本章小结 |
第4章 语料库的构建 |
4.1 韵律文本语料库 |
4.1.1 语料的准备 |
4.1.2 韵律标注 |
4.1.3 标注评测 |
4.2 录音语料库的录制 |
4.3 本章小结 |
第5章 汉语韵律边界的预测 |
5.1 韵律边界预测的方法 |
5.1.1 基于Bi LSTM模型的韵律预测 |
5.1.2 基于Seq2seq模型的韵律预测 |
5.1.3 基于注意力机制的Seq2seq模型的韵律预测 |
5.2 韵律词边界预测 |
5.2.1 特征选取 |
5.2.2 实验衡量标准 |
5.2.3 实验结果与讨论 |
5.3 韵律短语边界预测 |
5.3.1 句法层级数特征 |
5.3.2 实验结果与讨论 |
5.4 本章小结 |
第6章 韵律边界预测结果的评测 |
6.1 评测工具 |
6.2 评测结果 |
6.3 本章小结 |
第7章 总结与展望 |
7.1 论文总结 |
7.2 工作展望 |
参考文献 |
致谢 |
个人简历、在学期间发表的学术论文及研究成果 |
(6)基于语料库的藏语状态词研究(论文提纲范文)
中文摘要 |
Abstract |
摘要 |
第一章 绪论 |
1.1 研究背景 |
1.2 研究现状 |
1.2.1 国外研究现状 |
1.2.2 国内研究现状 |
1.3 研究目的和研究意义 |
1.3.1 研究目的 |
1.3.2 研究意义 |
1.4 研究范围和研究方法 |
1.4.1 研究范围 |
1.4.2 研究方法 |
第二章 藏语语料库建设 |
2.1 语料库概述 |
2.2 藏语语料库构建 |
2.2.1 藏文网页语料采集 |
2.2.2 藏文编码识别与转换 |
2.2.3 语料库加工技术 |
2.2.4 语料规模与范围 |
2.3 状态词抽取 |
2.4 文章小结 |
第三章 状态词概念及结构分析 |
3.1 状态词概念及定义 |
3.2 状态词与形容词的联系 |
3.2.1 状态词和形容词在语法功能上的共性 |
3.2.2 状态词和形容词在语法功能上的个性 |
3.3 状态词分类 |
3.3.1 从构成成分上分类 |
3.3.2 从意义上分类 |
3.4 状态词构成特征考察 |
3.4.1 双音节结构 |
3.4.2 三音节结构 |
3.4.3 四音节结构 |
3.4.4 结构类型统计 |
3.5 本章小结 |
第四章 状态词语法功能分析 |
4.1 修饰功能分析 |
4.1.1 修饰名词 |
4.1.2 修饰动词 |
4.2 句法功能分析 |
4.2.1 作谓语 |
4.2.2 作状语 |
4.2.3 作定语 |
4.2.4 作补语 |
4.3 组合功能分析 |
4.3.1 不与“??????????”等程度副词组合 |
4.3.2 不与“?????”等否定副词组合 |
4.4 本章小结 |
第五章 状态词句法知识表示 |
5.1 状态词句型结构及其形式化描述 |
5.2 状态词句法形式化描述 |
5.2.1 短语结构语法 |
5.2.2 范畴语法 |
5.2.3 依存语法 |
5.3 本章小结 |
第六章 状态词语法知识库构建 |
6.1 语言知识库的原理及作用 |
6.1.1 语言知识库原理 |
6.1.2 语法知识库作用 |
6.2 状态词语法知识库构建方法 |
6.2.1 收录原则及范围 |
6.2.2 语法属性项目的确定 |
6.3 状态词语法知识库主要内容 |
6.3.1 状态词机器词典 |
6.3.2 状态词标注语料库 |
6.3.3 状态词规则库 |
6.4 本章小结 |
第七章 总结与展望 |
7.1 研究工作的回眸 |
7.2 研究工作的展望 |
附录 |
附录一 |
附录二 |
攻读硕士期间科研及获奖情况 |
致谢 |
参考文献 |
(7)基于条件随机场的中文分词方法研究与应用(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 背景与意义 |
1.2 国内外研究现状 |
1.3 本文的主要工作 |
1.4 本论文的结构安排 |
第二章 相关理论和技术介绍 |
2.1 中文分词规范和原则 |
2.2 中文分词方法 |
2.3 条件随机场理论 |
2.3.1 模型定义 |
2.3.2 模型算法 |
2.4 本章小结 |
第三章 面向政府公文领域的中文分词融合特征的方法 |
3.1 研究动机 |
3.2 融合特征算法 |
3.2.1 训练语料选取 |
3.2.2 特征模板 |
3.2.3 位置特征 |
3.2.4 优化特征 |
3.3 仿真实验 |
3.3.1 不同领域语料对比 |
3.3.2 特征模板组合 |
3.3.3 位置特征优化实验 |
3.3.4 优化特征选取实验 |
3.4 实验结果与分析 |
3.4.1 不同领域语料对比实验结果与分析 |
3.4.2 多元特征模板组合实验结果与分析 |
3.4.3 位置特征优化实验结果与分析 |
3.4.4 优化特征选取实验结果与分析 |
3.4.5 实验总结 |
3.5 本章小结 |
第四章 基于易歧义标记的歧义消解方法 |
4.1 研究动机 |
4.2 基于易歧义标记的歧义消解方法 |
4.2.1 易歧义标记 |
4.2.2 模型训练 |
4.2.3 歧义消解 |
4.3 仿真实验及结果分析 |
4.3.1 仿真实验 |
4.3.2 实验结果分析 |
4.4 本章小结 |
第五章 面向政府公文领域的条件随机场模型应用 |
5.1 现状及需求分析 |
5.1.1 现状 |
5.1.2 需求分析 |
5.2 系统设计 |
5.2.1 总体设计 |
5.2.2 功能设计 |
5.2.3 数据存储设计 |
5.2.4 功能实现 |
5.3 测试及应用成效 |
5.4 本章小结 |
第六章 总结和展望 |
6.1 论文总结 |
6.2 未来展望 |
致谢 |
参考文献 |
攻读硕士学位期间取得的成果 |
(8)基于深度学习的藏语依存句法分析技术研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 研究现状 |
1.2.1 国外研究现状 |
1.2.2 国内研究现状 |
1.3 主要研究内容和目标 |
1.4 论文的主要组织结构 |
第2章 预处理技术 |
2.1 藏语分词及标注 |
2.1.1 词法分析模型 |
2.1.2 数据及实验结果 |
2.2 不同依存结构间的转换算法 |
2.2.1 藏语依存句法(结构)标注规范 |
2.2.2 转换算法 |
2.3 本章小结 |
第3章 藏语依存标注规范 |
3.1 藏语短语分类 |
3.2 藏语短语结构与依存结构 |
3.3 藏语依存句法结构标注规范 |
3.4 本章小结 |
第4章 藏语依存句法分析模型 |
4.1 基于转移的藏语依存句法分析 |
4.2 基于神经网络的藏语依存句法分析模型 |
4.2.1 多层感知机模型 |
4.2.2 实验结果及分析 |
4.3 本章小结 |
第5章 藏语依存句法分析系统 |
5.1 藏语依存句法分析的系统框架 |
5.2 解码方法 |
5.3 系统实现及可视化界面 |
5.4 本章小结 |
第6章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
附录 |
个人简历 |
攻读硕士研究生期间的研究成果 |
(9)基于领域本体的农药信息语义查询系统研究与实现(论文提纲范文)
符号说明 |
中文摘要 |
Abstract |
1 绪论 |
1.1 研究背景 |
1.2 研究目的及意义 |
1.3 国内外研究现状 |
1.3.1 本体研究现状 |
1.3.2 中文分词研究现状 |
1.4 研究内容、方法和技术路线 |
1.4.1 研究内容 |
1.4.2 研究方法 |
1.4.3 技术路线 |
1.5 章节安排 |
2 相关理论与技术 |
2.1 领域本体相关理论与技术 |
2.1.1 本体的种类和主要描述语言 |
2.1.2 领域本体的主要构建方法 |
2.2 中文分词相关理论与技术 |
2.3 本章小结 |
3 农药和农作物领域本体构建研究 |
3.1 领域本体的构建流程 |
3.2 获取领域关键概念和术语 |
3.3 确定概念间的关系和概念的属性 |
3.4 半自动添加实例 |
3.5 验证与评价本体 |
3.6 持久化为关系型数据库 |
3.7 本章小结 |
4 中毒症状本体和用户词典的构建 |
4.1 中毒症状本体构建 |
4.1.1 对中毒症状与急救措施的搜集与整理 |
4.1.2 对中毒症状输入文本的统计与筛选 |
4.1.3 中毒症状本体构建并持久化为数据库 |
4.2 基于中毒症状本体的用户词典构建 |
4.3 本章小结 |
5 基于农药和农作物领域本体的语义查询过程 |
5.1 农药使用信息查询 |
5.2 未知农药中毒急救查询 |
5.3 本章小结 |
6 基于领域本体的农药信息语义查询系统设计与实现 |
6.1 需求分析 |
6.2 系统总体设计 |
6.3 数据库设计 |
6.4 系统详细设计与实现 |
6.4.1 农药使用信息语义查询模块 |
6.4.2 未知农药中毒急救查询模块 |
6.4.3 农药和农作物分类体系浏览模块 |
6.4.4 用户意见反馈模块 |
6.4.5 信息管理模块 |
6.5 本章小结 |
7 总结与展望 |
7.1 总结 |
7.2 展望 |
参考文献 |
致谢 |
攻读硕士学位期间所发表的学术论文与成果 |
(10)基于在线评价的消费者网购满意度影响因素分析 ——以京东商城光学眼镜类产品为例(论文提纲范文)
学位论文数据集 |
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景与意义 |
1.1.1 研究背景 |
1.1.2 研究的意义 |
1.2 眼镜行业的国内外发展状况 |
1.2.1 国外的发展状况 |
1.2.2 国内的行业状况 |
1.3 研究现状 |
1.3.1 文本情感分析研究综述 |
1.3.2 顾客满意度影响因素研究综述 |
1.4 研究内容和框架 |
第二章 理论基础及文献综述 |
2.1 顾客满意度概念 |
2.1.1 网络购物满意度影响因素 |
2.2 网络爬虫 |
2.3 中文分词 |
2.4 关键词提取 |
2.5 情感分析 |
2.5.1 贝叶斯情感分类器 |
2.5.2 分类器性能评价指标 |
第三章 数据采集和处理 |
3.1 数据采集 |
3.2 文本预处理 |
3.3 关键词抽取及分析 |
第四章 文本分析 |
4.1 朴素贝叶斯分类器 |
4.2 LDA主题挖掘 |
4.2.1 积极情感集的LDA主题模型结果与分析 |
4.2.2 消极情感集的LDA主题模型结果与分析 |
第五章 结论与展望 |
5.1 结论 |
5.2 本文研究的不足与展望 |
参考文献 |
致谢 |
作者及导师简介 |
附件 |
四、自动分词软件质量的评价模型(论文参考文献)
- [1]古籍信息处理回顾与展望[J]. 刘忠宝,赵文娟. 大学图书馆学报, 2021(06)
- [2]在线用户评价驱动的产品形态进化设计方法研究[D]. 汪天雄. 华东理工大学, 2021(08)
- [3]基于检索式和生成式相结合的聊天机器人研究与实现[D]. 刘炳麟. 沈阳师范大学, 2021(09)
- [4]藏语卫藏方言的语音合成技术研究[D]. 谢香腾. 西藏大学, 2021(12)
- [5]面向留学生汉语朗读的韵律边界预测的研究[D]. 剡雅静. 西北师范大学, 2021(12)
- [6]基于语料库的藏语状态词研究[D]. 才让卓玛(Tsering Dolma). 西北民族大学, 2021(09)
- [7]基于条件随机场的中文分词方法研究与应用[D]. 王照卫. 电子科技大学, 2021(01)
- [8]基于深度学习的藏语依存句法分析技术研究[D]. 多杰才让. 青海师范大学, 2021(09)
- [9]基于领域本体的农药信息语义查询系统研究与实现[D]. 王翔宇. 山东农业大学, 2020(01)
- [10]基于在线评价的消费者网购满意度影响因素分析 ——以京东商城光学眼镜类产品为例[D]. 陶哲源. 北京化工大学, 2020(02)