手机浏览器扫描二维码访问
林燃一副理所当然的样子:“当然,我都和科罗廖夫见了两面,我不会俄语怎么和他交流的?
我同时会俄语、德语、英语和汉语。”
多语言大师的身份,给林燃的理论增添了几分可信度。
在这个时代,科学家们会几门语言并不奇怪。
当然一些敏感部门会提高对你的怀疑。
以前面提到的约翰·麦卡锡为例,他就精通俄语,从小接受俄语教育长大,尽管他出生在阿美莉卡。
“另外翻译过程,应该是模块化设计,而不是简单的映射关系。
它应该分成预处理、翻译、后处理三部分。
预处理包括了分词和词形还原,翻译才是词典的映射,后处理是对语序进行调整。
这样来降低单次计算的复杂度,提高规则的复用率!”
林燃的话给了在座研究团队的成员们非常多的灵感。
就好像之前一直陷在百越的丛林里找不到出路,而现在天上出现一道光指引他们怎么样才能走出丛林迷宫。
大家都有点迫不及待去尝试了。
所有研究人员都疯狂在笔记本上记录下林燃所说的。
虽然不确定教授的方法是否管用,但有路总比之前没有好。
再者,如果你不好好记下来,到时候被开除只是教授一句话的事。
“好了刚才我们讲了一些简单的内容,现在才是最难的。
因为IBM的机器不是那么强大,我们只能引入一些比较简单的统计学方法来提高我们翻译的准确度。
我把它叫做基于频率的词对齐。
这也是我们引入统计模型的核。
我们先要手动分析平行句子,标注俄语词或短语与英语翻译的对应关系。
俄语句子Мыговоримомире
英语翻译:“Wespeakaboutpeace
对齐结果:“мы”
对应“we”
“говорим”
对应“speak”
“о”
对应“about”
“мире”
对应“peace”
然后我们需要对这种对齐的频率进行统计。
统计每个俄语词或短语在英语中的对应翻译出现的频率。
例如,在语料中,“говорим”
在80%的句子中翻译为“speak”
,20%翻译为“talk”
。
这样对于我们就可以构建概率表了。
将这些概率整理成表格,供机器进行查询。
第四天灾:人在高武,游戏成神 灵魂扳机 换亲后!带火婆家! 反贼之路:开局抢了和亲公主! 出宫第四年,清冷摄政王夜夜求复合 我的化身正在成为最终BOSS 蓄谋已久,强扭的白月光他又酸又涩 请天下赴死 女儿喜欢后爸,我成全他们一家三口 天命皆烬 模拟成真,我曾俯视万古岁月? 海贼:从捡到红发断臂开始 重生的我只想追小姨子 三年婚姻守空房,我独美你发疯 团宠小福星,扛着粮仓去逃荒 平步亲芸 农门悍媳有空间,嫁猎户被宠不停 文圣天尊 亡国公主娇又软,糙汉可汗夜夜宠 奥特曼:开门啊,是我,老人迦!
关于病娇王爷深深宠意外死亡,却白捡了一条命。严绯瑶来不及狂喜,就发现原主肯定是蠢死的!她绑了个有毒的男人,放在自己闺房床上算怎么回事儿?外有恶狼未婚夫,内有猛虎毒王爷严绯瑶无语问手环可以再死一次穿回去吗?且慢手环自带解毒功能?还能升级炼药,治病?毒王爷看她的眼神,怎么越来越不同?连皇帝都风闻她的名声?情节虚构,请勿模仿...
不准不接我电话,不准看我以外的男人,不准惹我不高兴。他捏着她的下巴狠道。湛蓝泪奔总裁大人,我才是女人好么?一言不合他就壁咚地咚各种花式咚。湛蓝扶着隆起的腰,暗自发誓以后一定要想尽各种办法婉拒他。可是为毛,婉拒的下场却是变本加厉?她决定离家出走。神秘霸主秦少全球通缉女人,你敢逃?!看来是生的不够!...
主角王耕因黑拳违规被丟进大海中喂鲨鱼,遇到古战场海市蜃楼,魂穿到汉末名将田晏之子田峻的身上,此时正值公元177年田晏与檀石槐草原大战惨败,田峻率二千亲卫断后,身陷绝境。绝地求活后,立下功勋,努力争取到辽东太守职位。在广褒的东北平原上大力拓荒,收容(收购)流民,护住民族元气,败鲜卑高句丽夫余辰韩马韩,建立根基,潜心发展势力。待天下变乱之时,南向而争天下。如果您喜欢汉末孤峰,别忘记分享给朋友...
关于血战到底他,一个国军军官,在淞沪战场的腥风血雨中走来,与日本鬼子血拼于南京城下,在尸山血海的南京城中逃出生天,面对国破家亡的惨痛,他毅然选择了一条同日本鬼子血战到底的道路,生命不息,冲锋不...
凤鸣被劫上山做压寨夫人,誓死不嫁莽夫,奈何莽夫有颜有值有武艺,上山能擒虎,下山能良辅,心里眼里只有自家的小公主公主扶额,罢了,且收下吧。如果您喜欢至尊公主草莽夫,别忘记分享给朋友...
关于大话水浒之武大郎传奇历史不是镜子,历史是精子,牺牲亿万,才有一个活到今天人生不是故事,人生是事故,摸爬滚打,才不辜负功名尘土。作为一名宅男,穿越,是我一直以来梦寐以求的事情,可穿越到武大...