来源: 最后更新:22-12-11 12:11:12
在日常生活中,我们经常需要用到图片,我们都知道,图片的种类挺多的,在这里不一一列举。我们今天要完成就是一个图片转换器外加图片识别程序,废话不多说,直接就是淦!1.文字识别技术2.图片转换器一、文字识别技术首先介绍文字识别技术,就是读取图片之后然后把图片中的文字提取出来。1.打开百度开放平台
进去之后咱们选择文字识别,可以看出,语音合成和图片识别的参数不一样,所以不要搞混了,不过他们用的Python模块是一样的,这个可以放心使用。
谈到文字识别,大致可分为本地文件文字识别和网络文件文字识别,识别率还算挺高的,他的用法与语音合成有很多相似之处,当然也有很多不同,例如:from aip import AipOcr""" 你的 APPID AK SK """APP_ID = '你的 App ID'API_KEY = '你的 Api Key'SECRET_KEY = '你的 Secret Key'client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
首先是使用的模块不同,其次参数也不同,可以看出来第一步配置就是这么简单。然后我们需要对本地文件进行一个识别,例如:
可以看出来,这些就是识别后图片上的内容,识别效果很好,非常完美。文字识别——请求参数详情参数名称是否必选类型可选值范围默认值说明
image是string图像数据,base64编码,要求base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/png/bmp格式
url是string图片完整URL,URL长度不超过1024字节,URL对应的图片base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/png/bmp格式,当image字段存在时url字段失效
language_type否stringCHN_ENG ENG POR FRE GER ITA SPA RUS JAP KORCHN_ENG识别语言类型,默认为CHN_ENG。可选值包括:- CHN_ENG:中英文混合;- ENG:英文;- POR:葡萄牙语;- FRE:法语;- GER:德语;- ITA:意大利语;- SPA:西班牙语;- RUS:俄语;- JAP:日语;- KOR:韩语;
detect_direction否stringtrue falsefalse是否检测图像朝向,默认不检测,即:false。朝向是指输入图像是正常方向、逆时针旋转90/180/270度。可选值包括: - true:检测朝向;- false:不检测朝向。
detect_language否stringtrue falsefalse是否检测语言,默认不检测。当前支持(中文、英语、日语、韩语)
probability否stringtrue false是否返回识别结果中每一行的置信度
文字识别——返回数据参数详情字段必选类型说明
direction否number图像方向,当detect_direction=true时存在。- -1:未定义, - 0:正向, - 1: 逆时针90度, - 2:逆时针180度, - 3:逆时针270度
log_id是number唯一的log id,用于问题定位
words_result_num是number识别结果数,表示words_result的元素个数
words_result是array定位和识别结果数组
+words否string识别结果字符串
probability否object行置信度信息;如果输入参数 probability = true 则输出
+average否number行置信度平均值
+variance否number行置信度方差
+min否number行置信度最小值
可以看出这个API还是相当不错了,下面我们聊一下图片格式转换器,二、图片格式转换器图片格式转换器,顾名思义就是将图片格式互相转换,很多人为了方便都是直接改后缀名,殊不知那样图盘的原始样式会受到影响,也许图片会打开后从产生错误的画面。下面我们就来做一个类似的案例。1.先安装图片处理模块 pillow ,安装方法 :pip install pillow
2.导入pillowfrom PIL import Image
3.判断文件是否可以打开from PIL import Imagedef isbad(path): bad = True try: Image.open(path).verify() #判断图片是否损坏 except: bad= False return bad
4.转换文件格式def translate(path): if isbad(path): try: str = path.rsplit(".", 1) output_path = str[0] + ".png" #输出文件名称 im = Image.open(path) im.save(output_path) #保存目标文件 return True except: return False else: return False
这样我们就得到了一张完整的可用的png图片了,代码如图:
本项目用于平时上传文件识别图片所用,效果还是蛮不错的,希望大家喜欢。
标签: [db:关键词]
拜登称以色列袭击伊朗这一设施将被视为形势重大升级!法国总统呼吁停止向以提供武器,以总理急了:“可耻”
内塔尼亚胡斥马克龙“可耻”,法国总统府回应:他反应“过度”,脱离了法以友谊
为何薛宝钗和林黛玉的性格不同(薛宝钗为什么和林黛玉并列)
电视剧重启之极海听雷大结局(重启之极海听雷结局解析)
如果可以这样爱演员表 如果可以这样爱演员表剧情简介
以家人之名谁和谁是一对 以家人之名谁是谁的孩子
以家人之名凌霄结局(以家人之名凌霄是男主吗)
美官员评估:哈马斯领导人已不抱“生的希望”,意在对以色列造成更大杀伤
离开中山三角镇需要什么条件? 离开中山三角镇需要什么条件才能回家
中山阜沙镇7月10日开展区域免费核酸检测
2024蓬江区墓园清明祭扫预约形式及电话汇总2024年清明节期间祭扫预约人数预计会变多,部分可能需要提前预约祭
以总理猛批马克龙:“真可耻!”(马克龙说啥了) 派出所凌晨3点还有游客排队打卡,“有时候警察都很想报警” 国庆假日,青岛这处海滩火了!蛤蜊一挖一麻袋,根本挖不完 矢量图是什么(矢量图是什么格式)