但是对于那些以此为职业的翻译,恐怕就是灾难了,一款优秀的软件足以让一个行业伤筋动骨,无数以此为生的人陷入失业的沼泽。
所以要慢慢来,陈家涛前期只想做一个可以翻译文本的软件,同声传译的难度也比较大,比较世界各地各种口音的收录就是个麻烦事,工程量太大。
陈家涛考虑的是采用数学思维,另辟蹊径,将每个词语设定为向量,并且分类为名词,动词等等。
将此与设定为向量的好处就是将长难句进行肢解,翻译选件处理时会将每个词语准确翻译。
接下来就是根据语言的语境,将所有词语的意思,按照语言环境进行筛选,剔除明显不符合语境的释义。
接着再让不同的词语,根据翻译对象所需要的语言的语法和含义进行组合,并对缺少的与语法要素进行补充。
陈家涛反复检查了几遍,软件整体的逻辑是正确,接下来就要正儿经的开工了。
逻辑正确只是第一步,怎么让用向量的词语按照指定语言的语法进行重组为新的语句,就是个难题,这也是市场上翻译软件最大的难点。
就拿英语和汉语来举例,在语法上主谓宾的顺序就不同,翻译机器没有办法进行自我重组,所以经常闹出,饭吃了我的笑话来。
市面上的翻译软件都是采用语言学家总结的语法库,少部分软件有自我学习功能,也不能做到了解和统计当今所有的语言习惯并对其作出分析。
这项工作最大的难点就编译量非常大,毕竟要统计一种语言的所有语法习惯,这基本是不可能的。
不过没有关系,这些难不倒陈家涛,盘古语言最擅长如此。
陈家涛开始在屏幕上敲敲打打起来,他首先需要编译出一个可以自我学习的,搜集一切可用资料的数据库。
然后通过数据库搜集各地的语音和语气将其归类分析,最后形成文字数据库来给翻译提供基本理论支持。
陈家涛预留了几个接口,方便今后导入大量的中英文资料。
然后
笔记本开始变慢,发烫。
最后它卡卡死了。
陈家涛这大半天的功夫转眼就化为乌有。
我去劳资
陈家涛刚想骂人,结果看了看周围室友都在睡觉,陈家涛默默把没说出口的话咽了回去。
看了一下时间,已经凌晨四点了,在折腾一会儿天都快亮
从随机任务刷新,到搞翻译软件这个想法出来,这期间陈家涛一直保持兴奋的状态,根本没有考虑到硬件的问题。
就和阿基米德当初在澡堂想到如何判断皇冠的真假,直接光着身子跑了出去是心情一样。
陈家涛看着自己新买的华硕普通笔记本,真的是欲哭无泪啊!
当初陈家涛买笔记本的时候想着就是用来写写论文,可以到处带着走,图个方便。
平时要是干其他的事,就连陈家涛偶尔看个电影,都用的宿舍那台台式机,当初上学时陈家涛特意从家里也带了过来。
处理如此大量的数据,笔记本用的是7550处理器,不卡死才是怪事!
ps:今天第二更,抱歉有点晚了。
感谢“书迷三十年”和“蚂蚁松少”的打赏!
魔方再求一波推荐票,谢谢大家!
^^
本站域名已经更换为www.adouyinxs.com 。请牢记。