汉英口语存在的问题及对策
来源:互联网 发布:工单提交系统源码php 编辑:程序博客网 时间:2024/06/10 05:27
最近看了看IWSLT2008,IWSLT2010的相关文章,总体上的感觉就是大家的做法大同小异。通用的做法都是拿几个系统过来做个系统融合,在调调参数,完成,OK。但在前处理后处理的做法上各家单位就是“八仙过海,各显神通”了。我想想也是这样,主体方法测评的差距不大,什么唬人的模型拿到现在中用BLEU差别并不太大。但如果处理好细节问题,完全可以在最终的性能上PK掉其他的单位。这也就是所谓的“细节决定成败”吧。
目前,口语翻译存在的两个大问题。
第一个问题就是语料库规模不大。比起新闻语料,口语语料规模还是太小了。这就导致一个问题,在词对齐效果上不是很好。这样一来再牛的模型也表现不佳。有的单位针对词对齐效果不佳方面做改进,
第二个问题是口语中的一些特殊表达。
有的单位也去做些领域自适应的工作,或者添加语言模型。这一块在08,10年的工作中没有涉及。就不罗列了。
啰嗦这么多,就是为了mark一下,以备来日查询。
- 汉英口语存在的问题及对策
- 实验室管理信息系统(LIS)应用中存在的问题及对策
- 餐饮行业连锁经营存在的问题及对策
- 当代孩子存在的主要问题及教育对策
- 基本养老保险存在的问题与对策
- 财务报表分析存在问题的对策分析
- 存在问题,解决对策
- 使用原生jdbc查询数据库时存在的问题及对策
- 中国发展电子商务存在的问题与对策探究
- 关于抄表到户存在的问题与对策
- 银行商业智能项目建设存在的问题与对策
- 试论中小企业会计电算化存在的问题与对策
- 网络考试系统存在的问题与对策
- 解决网络会计中存在问题的对策
- caffe训练图片的问题及对策
- 遇到问题的对策
- Oracle10g 问题总结及对策
- Xcode 8 问题及对策
- gcc编译问题
- ld and sopath and gdb useage
- 蓄水池抽样算法
- Why is the maximum size of the Java heap fixed?
- hdu 4430 Yukari's Birthday
- 汉英口语存在的问题及对策
- Java maximum memory on Windows XP
- 常见的Hash函数
- 编码问题一网打尽
- 设计模式之九------compositer(组合)
- Java webstart max-heap-size causes JVM cannot be started
- 在ORACLE里按用户名重建索引的方法
- GCD介绍(一): 基本概念和Dispatch Queue
- 查找程序所在上一级目录中是否存在指定文件夹,不存在就建立,并在其中新建一个txt文件