xlhhai xlhhai
关注数: 2 粉丝数: 58 发帖数: 298 关注贴吧数: 13
日语漫画的辅助阅读工具 我稍微懂点日语,但直接看原版漫画还是比较吃力。于是我修改了下之前写的ImageTrans以更好地用于阅读日语漫画,可以识别文字并提供机器翻译结果便于了解大概意思。 软件功能: 1. 自动定位文字区域2. 聚合多种OCR引擎,哪个好使用哪个,并提供竖排文字图片转横排功能 整合了百度、微软、有道、腾讯、搜狗等在线OCR引擎和Tessearct离线引擎。 但测试只有tesseract、微软和有道支持竖排的文本,所以我又做了一个将竖直排列的文字横向排列的功能。 原图:百度识别结果:证山,K领山源十诲!心长想:2や十 转换后:百度识别结果:今日からみんなと勉強する事になった灰原哀さんです! 但这要求文字区域的背景是白色的,如果比较复杂就不能重新排列了。 3. 提供去除振假名的功能 用于注音的振假名会影响OCR结果,需要进行去除。 去除前:tesseract识别结果:いきなり東大を_目指しだして以来 去除后:tesseract识别结果:思えば高-のとき三者面談でいきなり東大を目指しだして以来 4. 整合多种机器翻译引擎 整合了谷歌、百度和腾讯等机器翻译服务。但测试下来,很难把原文意思翻译出来。日语比较特别,有很多语气词,内容还依赖于语境。不过切换不同的机器翻译再加上图片内容,大致意思就能理解了。5. 将译文替换回图片6. 使用Chrome插件翻译网页中的图片 现在一般在线看漫画,用Chrome扩展获取网页中图片链接并把翻译好的图片替换回去,体验会好很多。
1 下一页