Glob 语法及解析
1 glob 简介
glob 是用于匹配符合指定模式的文件集合的一种语言, 类似于正则表达式, 但更加简单。
Update-09-22: 前两天阮一峰老师更新了他的博客,内容讲的就是 Glob, 强烈推荐。
2 glob 语法
glob 的语法很简单:
| 通配符 | 描述 | 例子 | 匹配 | 不匹配 |
|---|---|---|---|---|
* |
匹配任意数量的任何字符,包括无 | Law* |
Law, Laws, Lawyer |
GrokLaw, La, aw |
? |
匹配任何 单个 字符 | ?at |
Cat, cat, Bat, bat |
at |
[abc] |
匹配括号中给出的一个字符 | [CB]at |
Cat, Bat |
cat, bat |
[a-z] |
匹配括号中给出的范围中的一个字符 | Letter[0-9] |
Letter0, Letter1 … Letter9 |
Letters, Letter, Letter10 |
[!abc] |
匹配括号中未给出的一个字符 | [!C]at |
Bat, bat, cat |
Cat |
[!a-z] |
匹配不在括号内给定范围内的一个字符 | Letter[!3-5] |
Letter1… |
Letter3 … Letter5, Letterxx |
Update-2018-07-18: 使用
**/* 可以匹配当前目录树中的所有文件, 通过 **/*.py 匹配所有后缀名为 .py 的文件
Update-2018-09-20: 好像只是 Python 中 pathlib.Path.glob 支持列出所有文件,其他工具只是列出当前所有子目录中匹配的文件,子目录的子目录需要 **/**/*.
3 .gitignore
git 的 .gitignore 文件可以使用 glob 模式匹配, 另外还有一些规则:
- 所有空行或者以
#开头的行都会被Git忽略 - 匹配模式可以以
/开头防止递归 - 匹配模式可以以
/结尾指定目录 - 要忽略指定模式以外的文件或目录,可以在模式前加上惊叹号
!取反
4 Python glob
Python 有进行 glob 匹配的标准库, 使用也很简单:
# -*- coding: utf-8 -*- import glob # glob 只有两个函数, 功能差不多, 只不过一个返回列表, 一个返回迭代器 glob.glob('*.org') # 返回所有后缀名为 .org 的文件 glob.iglob('*/') # 返回匹配所有目录的迭代器
标准库 glob 在 Python2 和 Python3 中是相同的。