如何在Python中使用imghdr模块识别图片的格式
更新:HHH   时间:2023-1-7


本篇文章为大家展示了如何在Python中使用imghdr模块识别图片的格式,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。

imghdr模块

功能描述:imghdr模块用于识别图片的格式。它通过检测文件的前几个字节,从而判断图片的格式。

唯一一个API

imghdr.what(file, h=None)

第一个参数file可以是用rb模式打开的file对象或者表示路径的字符串和PathLike对象。h参数是一段字节串。函数返回表示图片格式的字符串。

>>> import imghdr
>>> imghdr.what('test.jpg')
'jpeg'

具体的返回值和描述如下:

返回值描述检测方式
jpeg用JFIF或者Exif格式保存的JPEG图片第7到第10个字节是b'JFIF'或者b'Exif'
png可移植网络图形格式(Portable Network Graphic Format)以字节串b'\x89PNG\r\n\x1a\n'开头
gifGIF(Graphics Interchange Format)的87版本和89版本前6个字节为b'GIF87a'或者b'GIF89a'
tiffTIFF(Tag Image File Format)的两种字节顺序前两个字节为b'MM'或者b'II'
rgbSGI ImgLib以字节串b'\x01\xda'开头
pbmPortable Bitmap第1个字节为b'P',第2个字节为b'1'或b'4',第3个字节为b'\t'或b'\n'或b'\r'
pgmPortable Graymap Files第1个字节为b'P',第2个字节为b'2'或b'5',第3个字节为b'\t'或b'\n'或b'\r'
ppmPortable Pixmap Files第1个字节为b'P',第2个字节为b'3'或b'6',第3个字节为b'\t'或b'\n'或b'\r'
rastSun Raster以字节串b'\x59\xA6\x6A\x95'开头
xbmX Bitmap Files以字节串b'#define ‘开头
bmpBitmap,Windows标准图像文件格式以字节串b'BM'开头
webp谷歌的WebP格式,Python3.5加入以字节串b'RIFF'开头并且第9到第12个字节为b'WEBP'
exrOpenEXR,Python3.5加入以字节串b'\x76\x2f\x31\x01'开头

模块内部缺陷

当h参数不为空时,模块会忽略掉file参数,直接检测h参数,但此时file参数又是必须提供的,算是一个设计缺陷吧。博主个人感觉这个h参数根本没有存在的意义,没必要放在参数列表里面。

>>> import imghdr
>>> imghdr.what('test.jpg', b'\x89PNG\r\n\x1a\n')
'png'
>>>

自定义检测流程

imghdr内部使用了test_jpeg、test_png、test_gif等函数检测文件的格式。模块内部维护了一个函数列表imghdr.tests,每次调用what函数的时候,会按列表里的顺序调用检测函数,当检测函数返回结果时退出循环。用户可以通过修改这个列表达到修改检测流程的目的。同时,也可以自行添加检测函数到列表里面。

下面这个例子,博主添加了一个函数放在检测流程的最后提示文件不是图片:

>>> import imghdr
>>> def final(h, f):
... print("This file isn\'t a image!")
...
>>> imghdr.tests.append(final)
>>> imghdr.what("imghdr.md")
This file isn't a image!

自行添加检测函数需要接收两个参数h和f,h是用来检测的字节串,f是file对象。但是在模块内部自带的检测函数都是没用到这个f参数的…

命令行启动imghdr模块

博主读源码的时候发现了官方文档里面没提到的两个函数,提供了直接用命令行启动imghdr模块的方法。

只需要调用python -m imghdr [-r] file1 file2...就可以直接检测文件的类型。file可以是文件也可以是文件夹。该命令默认只检测文件夹下一层的文件类型,如果需要递归检测,则加上-r参数。

每个文件以”文件名: 文件类型/None”的形式打印一行输出结果。

上述内容就是如何在Python中使用imghdr模块识别图片的格式,你们学到知识或技能了吗?如果还想学到更多技能或者丰富自己的知识储备,欢迎关注天达云行业资讯频道。

返回开发技术教程...