IT前沿10月17日重大消息 此前,华为官方同步发布一则短视屏 以重点介绍华为Mate30系列新新手机接入的“滚屏翻译”相关功能。原因 华为EMUI官方微信号撰文详解EMUI10“滚屏翻译”及其背后的通信工程专业OCR新型技术,同样的 来讲以上吧。
华为EMUI官方指出,EMUI10全屏翻译的发生 ,问题通信工程专业通信工程专业了外文翻译的问题,是这么你也同样的翻译多屏内容形式,你也三次又三次不采用传统全屏翻译的同样的操作。日益内容形式长度的可以增加 ,同样的操作的繁复是会 使阅读的连贯性可以增加 。基于此,“滚屏翻译”便派就上用场。
EMUI10滚屏翻译部分支持其他其他动物应用、十种语言、多屏内容形式的翻译。不采用传统小艺语音口令“帮我翻译屏幕”或双指按压屏幕即都不采用传统。华为EMUI官方指出,“当你浏览一篇长一篇你也翻译时,管理系统会先将其滚动截屏,真正形成一张原文的长截图,或者对长截图不采用传统切分、文本检测、翻译、排序、去重、拼接,或者以则是的侵删和翻译无法完成 的文字,又一次呈原因 当你镜头前,这同样的 滚屏翻译。”
在同样的系列的步骤中,最为最最重要的的的则如何去去对长截图不采用传统初步处理方法。那多种渠道为啥样样新型技术去不采用传统处理方法呢?同样的都不得不上文同样的面的最最重要的的的新型技术——OCR新型技术。
以上为华为EMUI官方对OCR新型技术的详解:
OCR,即光学字符识别(Optical Character Recognition),指再检查字符,不采用传统其不采用传统检测识别,最或者将其字符形状转换成计算机文字的整个程中。在同样的的应用,也同样的 对竟然长一篇真正形成的长截图上和文字,不采用传统识别提取,将其他其他动物提供完整给后续的机器翻译程中不采用传统,也同样的 无法完成 了长篇源文字提取的整个程中。
回到型技术原理上为检测和识别两段式算法框架,涉及中、英、日、韩、俄、西、法、德、意、葡十种语言识别能力方面,包含多个运行于NPU(Neural-network Processing Unit,神经侵删处理方法单元)的深度模型。
调用OCR算法后,应该对图像做整体提高处理方法,将侵删适配至理想整体状态后,采用传统多线程的多种渠道同步运行深度模型同样的后处理方法运算,或者多种渠道NLU(Natural Language Understanding,同样的语言明白)校正输出文本识别或者。
翻译得准不准,依赖于OCR识别的准确性;翻译得快不快,依赖于OCR处理方法字符速度快 的快慢。将又一次反复OCR处理方法的文本不采用传统机器翻译,又一次对侵删不采用传统排序、拼接处理方法,或者把翻译真正好长篇一篇呈原因 每个用户镜头前。
这么一套能把长上文的文字转变为侵删,再转换成译文的创新方案,原因 原因 申请专利保护了噢!
//每行字每张图,还得完完整整//
滚屏翻译中还创新性地不采用传统OCR文本行定位以无法完成 智能的侵删切分和拼接,巧妙地防止了在长截图切分整个整个程中文字或侵删被截断的现象发生发生。
同样的是这么是会 这么的疑问,原文真正形成的长截图或者翻译没办法吗?为为啥样样也要做切分呢?
同样的 同样的 ,当前的侵删翻译只部分支持单屏内容形式的翻译,长截图会自动缩放成和屏幕等高不采用传统翻译,侵删被压缩,文字大小同样的也被压缩了,这会非常大地间接间接影响翻译或者的准确性。
只是 更有效可以增加 翻译的准确性,你也把长截图切分成多张短图或者做翻译吧。但你也或者实际情况屏幕采用传统高度对长截图做简单的切分,很是这么会发生 一行文字被截断你也一张插图被截断的现象发生发生。
而滚屏翻译,采用传统OCR新型技术,你也以检测出一行文本或侵删的什么位置坐标,你也看到切分什么位置正好处在某行或某张侵删正中间,则会向上移动到行间空白什么位置不采用传统切分。
以这么规则处理方法后的侵删宽度同屏幕一致,采用传统高度等于或略低于屏幕采用传统高度,每一行字和每一张图同样的 完整的。这么方案巧妙实用,在速度快 快的同样的,还无法保证了同样的的翻译全新体验。