快捷搜索:

百度向开发者开放OCR文字识别服务

6月1日,百度深度学习研究院宣布,通过APIStore将其自主研发的百度文字识别技术(OCR)对外开放。

这项技术是目前全球最准确的中文通用识别服务,此前仅供百度系产品使用。现在,只要是接入了百度开发者平台的开发者,都可以通过百度文字识别API服务(地址:)对其进行调用,享受百度强大技术实力和深度开放平台带来的产品使用体验提升。

    图1 百度OCR技术通过APIStore首次对外开放

百度深度学习研究院(IDL)建立于2013年初,成立初期由百度公司创始人、董事长兼首席执行官李彦宏(Robin)亲自管理,目前由百度首席科学家吴恩达,前Facebook资深科学家徐伟,异构计算专家、前AMD异构系统首席软件架构师吴韧,计算机视觉资深科学家黄畅领衔。

百度文字识别技术依托业界领先的OCR算法,拥有整图文字检测和识别、整图文字识别、整图文字行定位和单字图像识别等能力。此前这项技术主要应用在百度旗下的移动产品当中,包括百度翻译、作业帮、百度传课、涂书笔记、百度浏览器插件等。其中涂书笔记还依靠该技术获得了“AppStore2014年度精选”、“最美应用2014高品质应用TOP 100”等荣誉。

    图2 精确定位和识别图像中包含的文字信息(以行为单位)

在此之前,百度已经通过API向开发者提供了多项百度研发的前沿技术,目的是为了让更多的开发者可以分享百度的技术能力,帮助开发者更好地为用户服务。此次百度再次通过专业服务分发平台APIStore开放百度文字识别技术,让开发者可以零成本使用基于移动应用的OCR技术,为开发者创新应用提供了更多的可能。

    图3 百度APIStore首创即用API模式

APIStore是百度出品的API开放平台。2014年10月上线至今已网罗了20万注册开发者,接口单日调用量破亿。汇集了国内外APP与WEB应用开发所需的大量API及SDK,包括设计开发、运维管理、市场营销、游戏引擎等领域,种类齐全,优质安全。特有百度独家的检索抓取、语音图像、地图翻译等服务。首创即用API模式,使用百度账号即可免费调用平台内所有即用API。

目前APIStore正在面向业界征集API合作需求。经过APIStore代理的API,会由APIStore平台统一提供用户身份鉴权、调用频控、限流和缓存、服务质量监控、自动生成API文档、在线调试工具、支持多种流行语言的客户端代码SDK等功能,既降低了API服务的发布和维护成本,又降低了用户的学习和使用成本,未来API Store将进一步探索和拓展API商业化服务的空间。

百度OCR文字识别开放服务尚在试运行阶段,暂时未全面放开,有大规模商用需求的请联系apistore@baidu.com。

您可能还会对下面的文章感兴趣: