代码实例
python-magic是libmagic文件类型识别库的python接口。 libmagic通过根据预定义的文件类型列表检查它们的头文件来识别文件类型。 这个功能通过Unix命令文件暴露给命令行。
1
2
3
4
5
6
7
|
>>> import magic
>>> magic.from_file( "testdata/test.pdf" )
'PDF document, version 1.2'
>>> magic.from_buffer( open ( "testdata/test.pdf" ).read( 1024 ))
'PDF document, version 1.2'
>>> magic.from_file( "testdata/test.pdf" , mime = True )
'application/pdf'
|
还有一个Magic类提供更直接的控制,包括覆盖魔术数据库文件并开启字符编码检测。 这不建议用于一般用途。 特别是,跨多个线程共享并不安全,如果尝试这样做会失败。
1
2
3
4
|
>>> f = magic.Magic(uncompress = True )
>>> f.from_file( 'testdata/test.gz' )
'ASCII text (gzip compressed data, was "test" , last modified: Sat Jun 28
21 : 32 : 52 2008 , from Unix)'
|
还可以结合标志选项:
1
2
3
|
>>> f = magic.Magic(mime = True , uncompress = True )
>>> f.from_file( 'testdata/test.gz' )
'text/plain'
|
以上这篇python使用magic模块进行文件类型识别方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/diyiday/article/details/80571179