跳转到帖子

Python+百度OCR进行图像识别

recommended_posts

发布于
  • Members
说实在的Pyhon在数据处理方面确实很牛。尤其是大数据的今天,我们和形形色色的数据形影不离。本文给大家介绍下利用百度OCR进行文字识别。

实验环境

  • Python (3.9.12)
  • Kali Linux
  • 百度OCR

    申请百度OCR

    访问百度智能云,开通API
    网址:https://cloud.baidu.com/campaign/OCR202203/index.html
    t2s5xwky4su1489.png
    可以使用百度账号登录,使用百度登录的好处是,你可以把百度的实名认证直接迁移过来,就不需要再等几天人工审核了。
    你可以选择免费试用,或者1块钱买1万次,我觉得没什么区别,都是够用的。
    领取免费额度的时候要勾选接口类型,要不然是一片空白。
    新建应用,获取token
    控制台-文字识别-概览中点击创建应用
    a535m3xf33v1490.png
    应用归属选择个人,应用名称和概述就随便填
    qd2xxkctz3h1491.png
    创建完成之后,进入应用列表,可以看到API KeySecret Key,记下来。
    wsxfpfwxgwk1492.png

    文字识别

    根据官方示例,写了Python的简单列子。参考如下:

    from aip import AipOcr
    APP_ID = 'xxxxxx'#你的APP_ID
    API_KEY = 'xxxxxxxxx'#你的API_KEY
    SECRET_KEY = 'xxxxxxxx'#你的SECRET_KEY
    client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
    def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
    return fp.read()
    image = get_file_content('/root/img/44.jpg')
    result = client.basicGeneral(image)
    for item in result['words_result']:
    print(item['words'])

    识别车牌号

    pyjbhmspr0p1493.png
    效果如下:
    lujll5cgmx41494.png

    识别行程码

    jaesfkker2a1495.png

    其他

    在此基础上,我们可以深度开发。比如批量处理文件夹中的图片,并将其图片中的文字信息导出到Excel中。后期有时间深度研究下吧。

  • 查看数 710
  • 已创建
  • 最后回复

参与讨论

你可立刻发布并稍后注册。 如果你有帐户,立刻登录发布帖子。

游客
回帖…