货蜻蜓的拼音 运车辆的英文辆翻译辆英语怎么说-大提花
2023年4月4日发(作者:最经典的英文歌曲)
古文翻译系统的设计与实现
王爽,熊德兰,王晓霞
(许昌学院计算机科学与技术学院,河南许昌461000)
摘要:古文翻译对研究古代历史文化、继承前人成果等有重要的意义。该文结合机器翻译研究方法和技术,设计实现了一个古文自
动翻译系统,能够实现部分古文献的翻译和标注。
关键词:机器翻译;古文翻译;系统设计
中图分类号:TP391文献标识码:A文章编号:1009-3044(2009)04-0855-02
TheDesignandImplementationofAncientChineseTranslationSystem
WANGShuang,XIONGDe-lan,WANGXiao-xia
(XuchangUniversity,ComputerScienceandTechnologyInstitute,Xuchang461000,China)
Abstract:ThetranslationofancientChinesehasvitalsignificancetostudyancienthistoryandculture,toinheritthepredecessorachieve-
dtheresearchmethodandtechnologyofmachinetranslation,thearticlehasdesignedandrealizedanautomatical
ancientChinesetranslationsystem,whichcoulddotranslatingandmarkingforamountofancientliterature.
Keywords:machinetranslation;ancientChinesetranslation;systemdesign
1引言
机器翻译是应用计算机实现从一种语言到另一种语言的翻译过程,目前已经开发并投入使用的翻译软件,如金山词霸、东方快
车、译星等,他们通常侧重于中英、中日、英日等不同语种之间的互译,而专门针对古代汉语与现代汉语之间对照的研究还比较少。
现代汉语是在古代汉语的基础上传承和发展起来的,同属于一种语言[1]。但是。现代汉语和古今汉语在字、词汇、语法以及修辞
诸方面都有很大差异,这给我们查找、学习古代文献资料、古代书籍带来了诸多不便。如果开发这样寓意未来一片光明的成语 的一个系统,它能对所阅读的古
文中的每个字、词给出合理的解释,进一步能够将整个句子乃至整篇文章翻译成等价的现代汉语的语句或文章,将对于我们了解历
史、学习优秀传统文化、继承古人学术成就有重要的意义。
2机器翻译研究方法
机器翻译技术经过50多年的发展,已经形成了比较成熟的理论体系,其研究方法基本上可以分为两大类,即基于规则(Rule-
Based)的方法和基于语料库(Corpus-Based)的方法。
基于规则的机器翻译技术是最成熟的,也是到目前为止应用最广的,目前有影响的机器翻译系统都是基于规则的。基于规则的
方法理论基础是假设翻译的过程就是对源语言进行分析,对语言语句的词法、语法、语义和句法进行分析、判断和取舍,然后重新排
列组合,生成等价的目标语言。基于规则的方法可分为基于转换(TransferBased)和基于中间语言(InterlinguaBased)两种[2]。
基于语料的方法以大规模语料库的分析为基础,又可以分为基于统计(sticsBased)和基于实例(ExampleBased)两种方法。它们
通过大规模的双语或多语料进行概率运算,依照各语言要素间的相似程度来构造语言模型,从而进行机器翻译。
从机器翻译的历史来看,机器翻译的主流方法一直是规则方法。随着计算机的进步,基于统计的方法越来越受到人们的重视。
每种方法都有各自的优缺点,可以互为补充,因此混合翻译方法和多引擎技术被提出,多引擎的含义是一个机器翻译系统采用多个
翻译方法,每个方法就是一个引擎。
本文采用相对比较成熟的规则的翻译方法和实例库相结合,吸取各自的处理优势。利用目前最新的计算机软件技术和中文信
息处理的最新研究成果,初步构造一个的古文自动翻译系统。
3系统框架结构
英汉机器翻译系统的设计原则鉴于机译系统的研制是一项非常艰巨的系统工程。从功能上来讲,系统模型可分为源语分析部
分和译文生成部分两部分。源语分析部分遵循语言学的知识,对源语言的形态、词法、语法、语义、进行分析,分析结果表示为内部表
示形式,译文生成部分将这种内部表示形式转化为目标语中的合法语句。该系统的总体框架结构可以用图1表示。
1)系统知识库
机器翻译的过程可以看成是一个应用知识进行推理
的过程。知识表示是这一过程的基础。翻译系统知识库主
要由一个语言模型、一部词典、多个规则库和一个实例库
组成。词典分为基本词典和特殊词典。规则库存放短语规
则、句型规则、句型匹配规则、现代和古代转换规则等,
所有的规则采用统一的数据结构。例如,词典中的局部规
则与全局规则具有完全相同的格式,在使用上局部规则
优先于全局规则,这样特别有利于处理一些与具体词相
收稿日期:2008-12-10
图1系统总体框架结构图
本栏目责任编辑:谢媛媛
软件设计开发
ComputerKnowledgeandTechnology电脑知识与技术第5卷第4期(2009年2月)
关的特殊用法[3]。词典和规则维护部分具备词典规则的动态查询、修改和增删功能。实例库用于存放现代汉语和古汉语例句及其相
关信息。
2)系统处理部分
古汉语词处理部分:包括古汉语自动分词和兼类词的处理,这部分是短语合并和句型匹配的基础。自动分词采用了最大匹配算
法,系统利用规则和统计的方法进行消兼。
古汉语分析部分:系统中分短语合并和句型匹配两部分。短语合并的任务是利用各类短语规则和方法,将古汉语字、词分层次
合并基本短语,而句型匹配是在短语合并的基础上进行的。
现代汉语的转换和生成部分:根据古代汉语句子和词语的分
析结构,结合现代汉语句法规则进行一个意思通顺的句子。具体
的转换和生成包括词、短语和句子等3个层次的转换和生成算
法。
3)翻译流程
翻译系统的总体翻译流程如图2所示。
系统输入的是古文句子,经过查找古今对照词典,进行分词
处理并得到每个字词的注解,然后根据现代语法规则库中规则合
成完整现代汉语句子。如果输入的是简单古文字词,就可以直接
查找词典,得到字词的翻译、注解和例句等。另外,该系统中还涉
及到语料库的收集,语料库一方面提供大量古文句子的译文和注
解,这样可以通过查看现有语料资源快速得到古文专家翻译好的
现存译文,避免了使用了规则处理过程。另一方面,对于现存语料
中没有,机器翻译的结果又不能让用户满意,用户可以自由对翻
译结果进行修改,然后作为有典型的句子在存储到语料库中,已
被后续使用。同时,语料库还可以针对古代汉语中的一些特殊句式进行分析和处理的,比如倒装句、省略句等要适当原有语句进行
必要的修饰和调整。
4系统实现
采用上述翻译模型,使用2005开发环境中VB语言进行软件的设别董大这首诗的诗意解释 计开发。该系统的实现的软件界面如图3所
示,下面就软件设计开发中的几个关键问题进行介绍。
表1基本字词表结构
1)词典建立
翻译离不开词典,同样,机器翻译也离不开机器词典。在机器翻译系统中,机器词典是处理程序赖逍遥游原文及翻译读音 以对原语言进行分析处理和
语言转换的信息来源,机器词典的词条信息的丰富与否是生成高质量译文的关键。荷花的赞美词
机器词典是供计算机软件使用的,因此,必须将单词的信息
形式化。如何表示各种词条信息,使翻译系统能够有效地运用这
些知识,是词典结构设计的基础。词典通常以复杂特征集(setoff
complexfeatures)作为知识表示的基础,采用多属性一值的表达方
式表示词条信息。
考虑到词典文件的安全性和计算机时间、空间的开销,我们
采用数据库的形式建立电子词典,其中基本字词表结构如图4。
对于句子成分和词性符号也以专门的表形式存放于数据库
中。语法规则采用BNF范式的形式描述,在编程设计是定义为特
定的励志语录正能量 数据结构。
2)译文生成的难点
古文字词的特殊性使得翻译系统在生成译文时候有很多困
难。古文中常见的“一词多义”和“通假”现象在分析时候就要专门
处理,如古字“安”可以表示疑问,也可以表示安定等意思[4]。在处
理过程中,我们借鉴古文研究人员的成果,将此类词语进行收集
总结,系统在翻译时候就可以根据该古文字在句中出现的位置、
文献的年代等信息来推断当前句中的可能译文。
古汉语中通常会含有否定句代词宾语前置、主语承前句的定语而省略、语序的倒置(或“倒装”)等,因此,要正确处理特殊句式的
句子也是一大难点。在本系统中,我们采用的做法是建立若干类特殊句式的语料几个,在系统根据正常语法规则处理不成功后,调
用该部分程序,进行特殊句式的分析处理。
5实验和总结
经过多人对本系统的执行性情况进行测试,实验分别选用的《论语》中50个句子进行翻译测试,结果表明,简单陈述句翻译效
果的满意度可以达到90%,简单疑问句和复杂句的满意度为82%左右,而反问句的处理效果不够理想。
设计一个完好的自动翻译系统就需要古代文学、现代汉语、历史学、以及计算机学科等多方面知识,有相当的难度。本文从语言
学和机器翻译理论出发,设计实现了一个简单的古文翻译系统,在部分测试数据中结果尚好,但还有很多需要改进和完善的方面。
今后,我们将就歧义处理、特殊句式、算法改进等几个方面改进和提高译文质量进行努力。(下转第867页)
图2古文翻译流程
图3古文翻译系统界面
856
2012-05-16
2012-0精巧的近义词和反义词 5-16
2012-05-16
2012-05-16
2012-05-16
2012-05-16
软件设计开发
本栏目责任编辑:谢媛媛
(上接第856页)
参考文献:
[1]姚天顺.自然语言理解[M].北京:清华大学出版社,1998.
[2]李向东,周清波,黄河燕,等.智能型俄汉机器翻译系统的句法规则库的设计原则[J].中文信息学报,1999,13(1):16-19.
[3]刘荣.英汉机器翻译系统的框架设计和实现[J].科技情报开发与经济.2006,16(18):227.
[4]赵国玺.论古文翻译理论框架的构建[J].辽宁师范大学学报:社会科学版,2004,27(1):84-88.
王爽(1982-),女,河南驻马店人,硕士,从事
人工智能方面的教学和研究工作。
所以直线
即可求得。
4试验测试
根据上述算法进行C++编程,并对试验数据进行测试,测试数据如表1,迭代次数为5000,精度为0.0001。
通过计算可得方向向量为(0.0208776,0.0329005,0.0430876),且过点(10.91,16.77,22.87),所以拟合直线方程为:
5结束语
文章详细介绍了平面和空间离散点的直线拟合算法,并对空间直线拟合算法进行了改进,在提高准确度的前提下控制了精确
度。关于春节的十大传说 尽管如此,该算法还存在一定的缺陷,比如随着迭代次数的增加和精度要求的提高,系统的计算量将不断增大,会影响其运算效
率。
参考文献:
[1]同济大学应用数学系.高等数学[M].5版.北京:高等教育出版社,2005:67-71.
[2]何渝.计算机常用数值算法与程序(C++版)[M].北京:人民邮电出版社,2003.
[3]杜明芳.空间直线拟合[J].北京印刷学院学报,1996,4(2).
表1测试数据
许海涛(1984-),男,河北安国人,硕士研究
生,研究方向:计算机地学应用和信号分析。
867
2012-05-16
2012-05-16
2012-05-16
2012-05-16
2012-05-16
2012-05-16
专业推荐
↓
精品文档
更多推荐
WLE是什么意思在线翻译读音例句
发布评论