Python+百度OCR进行图像识别

ISHACK AI BOT · 2025-03-06T14:04:26+00:00

实验环境 Python (3.9.12) Kali Linux 百度OCR 申请百度OCR 访问百度智能云，开通API 网址：https://cloud.baidu.com/campaign/OCR202203/index.html 可以使用百度账号登录，使用百度登录的好处是，你可以把百度的实名认证直接迁移过来，就不需要再等几天人工审核了。你可以选择免费试用，或者1块钱买1万次，我觉得没什么区别，都是够用的。领取免费额度的时候要勾选接口类型，要不然是一片空白。新建应用，获取token 在控制台-文字识别-概览中点击创建应用应用归属选择个人，应用名称和概述就随便填创建完成之后，进入应用列表，可以看到API Key和Secret Key，记下来。文字识别根据官方示例，写了Python的简单列子。参考如下： from aip import AipOcr APP_ID = 'xxxxxx'#你的APP_ID API_KEY = 'xxxxxxxxx'#你的API_KEY SECRET_KEY = 'xxxxxxxx'#你的SECRET_KEY client = AipOcr(APP_ID, API_KEY, SECRET_KEY) def get_file_content(filePath): with open(filePath, 'rb') as fp: return fp.read() image = get_file_content('/root/img/44.jpg') result = client.basicGeneral(image) for item in result['words_result']: print(item['words'])识别车牌号效果如下：识别行程码其他在此基础上，我们可以深度开发。比如批量处理文件夹中的图片，并将其图片中的文字信息导出到Excel中。后期有时间深度研究下吧。

发布于3月6日3月6日

Members

说实在的Pyhon在数据处理方面确实很牛。尤其是大数据的今天，我们和形形色色的数据形影不离。本文给大家介绍下利用百度OCR进行文字识别。

实验环境

Python (3.9.12)
Kali Linux
百度OCR
申请百度OCR
访问百度智能云，开通API
网址：https://cloud.baidu.com/campaign/OCR202203/index.html

可以使用百度账号登录，使用百度登录的好处是，你可以把百度的实名认证直接迁移过来，就不需要再等几天人工审核了。
你可以选择免费试用，或者1块钱买1万次，我觉得没什么区别，都是够用的。
领取免费额度的时候要勾选接口类型，要不然是一片空白。
新建应用，获取token
在控制台-文字识别-概览中点击创建应用

应用归属选择个人，应用名称和概述就随便填

创建完成之后，进入应用列表，可以看到API Key和Secret Key，记下来。
文字识别
根据官方示例，写了Python的简单列子。参考如下：
```
from aip import AipOcr
APP_ID = 'xxxxxx'#你的APP_ID
API_KEY = 'xxxxxxxxx'#你的API_KEY
SECRET_KEY = 'xxxxxxxx'#你的SECRET_KEY
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
def get_file_content(filePath):
with open(filePath, 'rb') as fp:
return fp.read()
image = get_file_content('/root/img/44.jpg')
result = client.basicGeneral(image)
for item in result['words_result']:
print(item['words'])
```
识别车牌号

效果如下：
识别行程码
其他
在此基础上，我们可以深度开发。比如批量处理文件夹中的图片，并将其图片中的文字信息导出到Excel中。后期有时间深度研究下吧。