Clear Sky Science · zh
利用场景文本检测与识别技术的综合框架,以增强对所有印地语系文字招牌中兴趣点的提取
为多语国家打造的智能地图
在印度城市中寻找路线往往需要扫视一片由店招、广告牌和街道牌组成的文字混杂景象,这些文字使用多种不同的文字系统。人类能轻松完成这一任务,但数字地图和导航工具仍然很难可靠识别这些招牌。本文提出了一个综合系统,使计算机能够从现实世界图像中检测并读取几乎所有主要印度文字系统的文本,然后将这些信息转化为清晰、可检索的兴趣点——为更智能的导航、更好的本地搜索和更具包容性的数字服务铺平道路。
关键词: 场景文本识别, 多语种 OCR, 印地语系文字, 兴趣点提取, 深度学习视觉