“findstr“ 的应用分析

一、引言

Findstr
使用正则表达式搜索文件中的文本模式。
语法
findstr [/b] [/e] [/l] [/r] [/s] [/i] [/x] [/v] [/n] [/m] [/o] [/p] [/offline] [/g:File] [/f:File] [/c:String] [/d:DirList] [/a:ColorAttribute] [Strings] [[Drive:][Path] FileName [...]]
参数
/b
如果位于行的开头则匹配模式。
/e
如果位于行的末尾则匹配模式。
/l
逐字地搜索字符串。
/r
使用搜索串作为正则表达式。Findstr 将所有元字符解释为正则表达式，除非使用了 /l。
/s
在当前目录和所有子目录中搜索匹配的文件。
/i
指定搜索不区分大小写。
/x
打印完全匹配的行。
/v
仅打印不包含匹配的行。
/n
在每个匹配的行之前打印行号。
/m
如果文件包含匹配项，则仅打印该文件名。
/o
在每个匹配行之前打印查找偏移量。
/p
跳过包含非可打印字符的文件。
/offline
利用脱机属性设置处理文件。
/f:File
从指定文件中读取文件列表。
/c:String
使用指定的文本作为文字搜索字符串。
/g:File
从指定文件得到搜索字符串。
/d:DirList
搜索以逗号分隔的目录列表。
/a:ColorAttribute
使用两个十六进制数指定颜色属性。
Strings
指定要在 FileName 中搜索的文本。
[ Drive:][Path] FileName [...]
指定要搜索的文件。
/?
在命令提示符下显示帮助。
注释
? 使用 Strings 和 [Drive:][Path] FileName [...]
在命令字符串中，所有 findstr 命令行选项必须在 Strings 和 [Drive:][Path] FileName [...] 之前。

? 在 findstr 中使用正则表达式
Findstr 可以在任何 ASCII 文件或文件中精确查找所要查找的文本。然而，有时要匹配的信息只有一部分或要查找更宽广的信息范围。在这种情况下，findstr 具有使用正则表达式搜索各种文本的强大功能。
正则表达式是用于指定文本类型的符号，与精确的字符串相反。标记使用文字字符和元字符。每个在常规的表达式语法中没有特殊意义的字符都是文字字符，与出现的该字符匹配。例如，字母和数字是文字符号。元字符是在正则表达式语法中具有特殊意义（操作符或分隔符）的符号。
下表列出 findstr 接受的元字符。
字符值
通配符：任何字符
*
重复：以前零次或多次出现的字符或数字
^
行中的位置：行首
$
行中的位置：行尾
[class]
字符类：集中的任何一个字符
[^class]
反向类：非集中的任何一个字符
[X-y]
范围：指定范围内的任何字符
X
转义：元字符 X 的文字用途
<xyz
字的位置：字首
xyz>
字的位置：字尾
组合使用正则表达式语法的特殊字符功能十分强大。例如，下面的通配符 (.) 和重复符 (*) 的组合可以匹配任何字符串：
.*
将如下表达式用作匹配以“b”开头并以“ing”结尾的任意字符串的更大表达式的组成部分：
b.*ing
示例

参数详解：
学习findstr需要大量的实践体会，所以需要新建一些txt文本以供测试。
a.txt的内容（a.txt的内容在后面会多次修改，请注意！）：

复制代码代码如下:

Hello World
Hello Boy
hello ,good man.
goodbye!

1.最简单的应用：在指定文本中查找指定字符串
代码：

复制代码代码如下:

findstr "hello" a.txt

结果：

复制代码代码如下:

C:\Users\helloworld\Desktop>findstr "hello" a.txt
hello ,good man.

代码：

复制代码代码如下:

findstr "Hello" a.txt

结果：

复制代码代码如下:

C:\Users\helloworld\Desktop>findstr "Hello" a.txt
Hello World
Hello Boy

这里可以看出，
findstr默认是区分大小写的（跟find命令一样）——找hello就不会出现Hello，反之亦然。
怎么让其不区分大小写呢？
用/i参数！
例如：

复制代码代码如下:

C:\Users\helloworld\Desktop>findstr /i "Hello" a.txt
Hello World
Hello Boy
hello ,good man.

2.显示要查找的字符具体在文本哪一行
代码：C:\Users\helloworld\Desktop>findstr /n /i "hello" a.txt
复制代码效果：

复制代码代码如下:

1:Hello World
2:Hello Boy
3:hello ,good man.

显示的结果中冒号（:）是英文格式下的，在用for提取的时候需要注意！
这里可以对比一下find命令的/n参数：
代码：

复制代码代码如下:

C:\Users\helloworld\Desktop>find /n "hello" a.txt

效果：---------- A.TXT
[3]hello ,good man.
复制代码冒号（:）和中括号（[]），这就是差别，编写代码的时候一定要注意。
3.查找包含了指定字符的文本
代码：

复制代码代码如下:

C:\Users\helloworld\Desktop>findstr /m /i "hello" *.txt

效果：

复制代码代码如下:

1.txt
a.txt

1.txt中的类容如下：除非参数有 /C 前缀，请使用空格隔开搜索字符串。
例如:

复制代码代码如下:

'FINDSTR "hello there" x.y' 在文件 x.y 中寻找 "hello" 或
"there"。'FINDSTR /C:"hello there" x.y' 文件 x.y 寻找
"hello there"。
[code]
由于加上了/m参数，所以只列出包含指定字符的文件名。
4.查找以指定字符开始或结尾的文本行
这个功能和前面介绍的最大不同就在于涉及到了“元字符”，如果你不明白什么是“元字符”，那也不用担心学不好这一节，这就好像不明白“water”是什么，也不会影响喝水。
a.txt内容：
[code]
good hello
你好 hello world
Hello World
Hello Boy
hello ,good man.
goodbye!

如何查找以hello（忽略大小写）开始的行？
两种方法：
①./b参数
代码：

复制代码代码如下:

C:\Users\helloworld\Desktop>findstr /b /i "hello" a.txt

效果：

复制代码代码如下:

Hello World
Hello Boy
hello ,good man.

good hello 和你好 hello world，这两行都没有显示出来，因为hello不在行的开始处。
②.^符
这里的^可不是转义符，而是正则表达式中的“匹配行开始的位置”。
代码：

复制代码代码如下:

C:\Users\helloworld\Desktop>findstr /i "^hello" a.txt

效果：

复制代码代码如下:

Hello World
Hello Boy
hello ,good man.

学完了以查找指定字符开始的行，下面学习查找以指定字符结尾的行。
如何查找以hello（忽略大小写）结尾的行？
同样有两种方法：
①./e参数
代码：

复制代码代码如下:

C:\Users\helloworld\Desktop>findstr /e /i "hello" a.txt

结果：

复制代码代码如下:

good hello

只显示了“good hello”，因为其它行虽然有“hello”，但是他们都没有以“hello”结尾。
②.$符
代码：

复制代码代码如下:

C:\Users\helloworld\Desktop>findstr /i "hello$" a.txt

结果：good hello
到此，我们已经学习了两个正则表达式的元字符：^和$（分别和他们功能相对应的有/b、/e参数）。
5.查找与指定字符完全匹配的行
首先修改a.txt的内容：

复制代码代码如下:

hello
hello hello
good hello
你好 hello world
Hello World
Hello Boy
hello ,good man.
goodbye!

懂得举一反三的的童鞋可能会试着尝试以下代码：

复制代码代码如下

C:\Users\helloworld\Desktop>findstr /n /i "^hello$" a.txt

结果让你倍感欣喜：1:hello
其实除了这一种方法外，findstr命令还提供了/x参数用来查找完全匹配的行。
代码：

复制代码代码如下:

C:\Users\helloworld\Desktop>findstr /n /i /x "hello" a.txt

结果：

复制代码代码如下:

1:hello

6.关闭正则表达式会怎么样？
我们可以人为地将findstr分为两种模式，“正则表达式模式”和“普通字符串模式”。
findstr默认为“正则表达式模式”，加上/r参数也是“正则表达式模式”（换言之，/r参数有点多余）。
加上/l参数后，findstr转换为“普通字符串模式”（其实find就是这种模式、且只有这种模式）。
“普通字符串模式”下，以同样的代码，看看结果怎样？
代码：

复制代码代码如下:

C:\Users\helloworld\Desktop>findstr /li "^hello" a.txt

结果什么都没显示出来。
以hello开头的行明明有以下这些，为什么没显示出来呢？

复制代码代码如下:

hello hello
Hello World
Hello Boy
hello ,good man.

因为，当你使用“普通字符串模式”，findstr不会把^当做是正则表达式的元字符，而只是把其当做普通字符^，也就是说它此时已经不具备“表示行首”的功能，变成了和h之类字符一样的普通民众，再也没“特权”。
改变a.txt的内容：^hello

复制代码代码如下:

hello
hello hello
good hello
你好 hello world
Hello World
Hello Boy
hello ,good man.
goodbye!

再次运行代码：

复制代码代码如下:

C:\Users\helloworld\Desktop>findstr /nli "^hello" a.txt

结果：

复制代码代码如下:

1:^hello

7.查找不包含指定字符的行
如果比较一下find和findstr命令就会发现，他们都具有/v，/n,/i,/off[line]参数，而且功能都是一摸一样的，这里说的就是/v参数。
查找不包含hello的行。
代码：

复制代码代码如下:

C:\Users\helloworld\Desktop>findstr /vni "hello" a.txt

结果：

复制代码代码如下:

9:goodbye!

8.如何查找当前目录及子目录下文件内容中包含某字符串的文件名？
在写这篇教程的时候，偶然看到有批友问了这个问题，问题地址：http://bbs.bathome.net/viewthread.php?tid=14727
代码：

复制代码代码如下:

findstr /ms "专业" *.txt

效果：
找出当前目录及子目录下文件内容中包含“专业”的文本文件，并只显示其文件名。
9.用文本制定要查找的文件 And 用文本制定要查找的字符串
用文本制定要查找的文件
新建一个file.txt，内容如下（这个文本中指定findstr要查找的文本的路径）：

复制代码代码如下:

C:\Users\helloworld\Desktop\1.txt
C:\Users\helloworld\Desktop\a.txt
C:\Users\helloworld\Desktop\clip.txt
C:\Users\helloworld\Desktop\CrLf 批处理笔记.txt
C:\Users\helloworld\Desktop\file.txt
C:\Users\helloworld\Desktop\MyRarHelp.txt
C:\Users\helloworld\Desktop\test.txt
C:\Users\helloworld\Desktop\红楼.txt
C:\Users\helloworld\Desktop\520\新建文本文档.txt
C:\Users\helloworld\Desktop\520\12\hello_ world.txt
C:\Users\helloworld\Desktop\编程\help.txt
C:\Users\helloworld\Desktop\编程\win7 help比xp help多出来的命令.txt
C:\Users\helloworld\Desktop\编程\wmic.txt

代码：

复制代码代码如下:

C:\Users\helloworld\Desktop>findstr /f:file.txt /im "hello"

效果：

复制代码代码如下:

C:\Users\helloworld\Desktop\1.txt
C:\Users\helloworld\Desktop\a.txt
C:\Users\helloworld\Desktop\CrLf 批处理笔记.txt
C:\Users\helloworld\Desktop\file.txt
C:\Users\helloworld\Desktop\test.txt

用文本制定要查找的字符串
新建一个string.txt，内容如下（这个文本中指定findstr要查找的字符串）：

复制代码代码如下:

^hello
world

a.txt

复制代码代码如下:

^hello
hello
hello hello
good hello
你好 hello
Hello World
Hello Boy
hello ,good man.
goodbye!

代码：

复制代码代码如下:

C:\Users\helloworld\Desktop>findstr /ig:string.txt a.txt

效果：

复制代码代码如下:

hello
hello hello
Hello World
Hello Boy
hello ,good man.

被忽略的行

复制代码代码如下:

^hello
good hello
你好 hello
goodbye!

从被忽略的“^hello”可以看出，在不加/l参数的前提下，用/g指定的搜索字符串中如果含有“元字符”，则作为正则表达式使用，而不是作为普通表达式。
10.搜索一个完全匹配的句子
其实findstr自带的帮助中就有个很好的例子：
例如: 'FINDSTR "hello there" x.y' 在文件 x.y 中寻找 "hello" 或
"there"。'FINDSTR /C:"hello there" x.y' 文件 x.y 寻找
"hello there"。
可以以这个例子来做个测试。

复制代码代码如下:

a.txthello there
hellothere
hello
there

代码：

复制代码代码如下:

C:\Users\helloworld\Desktop>findstr /ic:"hello there" a.txt

结果：

复制代码代码如下:

hello there

这就是句子的完全匹配了。
11.搜索一个完全匹配的词。
这里也涉及到了两个元字符：\<，\>。
先试看一个例子。
a.txt

复制代码代码如下:

far there
farthere
there
far
farm
farmer

代码：

复制代码代码如下:

C:\Users\helloworld\Desktop>findstr "far" a.txt

结果：

复制代码代码如下:

far there
farthere
far
farm
farmer

我的本意是要查找含有“far”这个单词的行，但是farthere、farm、farmer却显示出来了，这不是我想要的结果。
如果只要求显示含有“far”这个单词的行，该怎么写呢？
代码：

复制代码代码如下:

C:\Users\helloworld\Desktop>findstr "\<far\>" a.txt

结果：

复制代码代码如下:

far there
far

12.指定要查找的目录
/d参数我一直把它和/f、/g归为一类，但其实二者截然不同，/f、/g是用文本文件制定要查找的文件、字符串，而/d是直接书写目录名到命令中。
代码：

复制代码代码如下:

C:\Users\helloworld\Desktop>findstr /imd:520;编程; ".*" "*.txt"

结果：

复制代码代码如下:

520:
hello.txt

编程:
help.txt

复制代码代码如下:

win7 help比xp help多出来的命令.txt
wmic.txt

查找在520、编程目录中所有包含任意字符的txt文件。
13.统计字符数
/o:在每行前打印字符偏移量，在找到的每行前打印该行首距离文件开头的位置，也就是多少个字符，如test.txt中有如下内容：

复制代码代码如下:

aaaaaaaaaa
aaaaaaaaaa
aaaaaaaaaa
aaaaaaaaaa
aaaaaaaaaa
aaaaaaaaaa

执行命令：findstr /o .* test.txt
复制代码::上一行中的.*为正则表达式的内容，表示任意行，包含空行
结果如下：

复制代码代码如下:

0:aaaaaaaaaa
12:aaaaaaaaaa
24:aaaaaaaaaa
36:aaaaaaaaaa
48:aaaaaaaaaa

注意每行末尾的回车换行符算两个字符。
14.以指定颜色显示文件名
/a:当被搜索文件名中含有通配符*或?时对搜索结果的文件名部分指定颜色属性，具体颜色值参见color帮助：
0 = 黑色 8 = 灰色
1 = 蓝色 9 = 淡蓝色
2 = 绿色 A = 淡绿色
3 = 浅绿色 B = 淡浅绿色
4 = 红色 C = 淡红色
5 = 紫色 D = 淡紫色
6 = 黄色 E = 淡黄色
7 = 白色 F = 亮白色
常用于彩色显示，举个简单的例子，想要彩色显示“批处理之家”怎么办，假如当前的color设置为27（背景绿色，字体白色），用蓝色显示“批处理之家”咋办？::下一行的退格符可以在cmd的编辑模式下按ctrl+p后按退格键获得>"批处理之家" set /p=<nul

复制代码代码如下:

>"批处理之家" set /p=<nul
findstr /a:21 .* "批处理之家*"
pause

代码中的退格符是为了让显示的内容仅为"批处理之家",如果有其他内容，在彩色显示的"批处理之家"后还有一个冒号和其他内容，退格符正好将冒号删除。注意代码中的通配符是必须的。

二、应用案例

（1）$GPGGA 语句包括17个字段：语句标识头，世界时间，纬度，纬度半球，经度，经度半球，定位质量指示，使用卫星数量，HDOP-水平精度因子，椭球高，高度单位，大地水准面高度异常差值，高度单位，差分GPS数据期限，差分参考基站标号，校验和结束标记(用回车符<CR>和换行符<LF>)，分别用14个逗号进行分隔。

格式示例：$GPGGA,014434.70,3817.13334637,N,12139.72994196,E,4,07,1.5,6.571,M,8.942,M,0.7,0016*79

该数据帧的结构及各字段释义如下：

$GPGGA,<1>,<2>,<3>,<4>,<5>,<6>,<7>,<8>,<9>,M,<10>,M,<11>,<12>*xx<CR><LF>

$GPGGA：起始引导符及语句格式说明(本句为GPS定位数据)；

<1> UTC时间，格式为hhmmss.sss；

<2> 纬度，格式为ddmm.mmmm(第一位是零也将传送)；

<3> 纬度半球，N或S(北纬或南纬)

<4> 经度，格式为dddmm.mmmm(第一位零也将传送)；

<5> 经度半球，E或W(东经或西经)

<6> GPS状态， 0初始化， 1单点定位， 2码差分， 3无效PPS， 4固定解， 5浮点解， 6正在估算 7，人工输入固定值， 8模拟模式， 9WAAS差分

<7> 使用卫星数量，从00到12(第一个零也将传送)

<8> HDOP-水平精度因子，0.5到99.9，一般认为HDOP越小，质量越好。

<9> 海拔高度，-9999.9到9999.9米

M 指单位米

<10> 大地水准面高度异常差值，-9999.9到9999.9米

M 指单位米

<11> 差分GPS数据期限(RTCM SC-104)，最后设立RTCM传送的秒数量，如不是差分定位则为空

<12> 差分参考基站标号，从0000到1023(首位0也将传送)。

* 语句结束标志符

xx 从$开始到*之间的所有ASCII码的异或校验

<CR> 回车符，结束标记

<LF> 换行符，结束标记

$GNGGA 与GPGGA类似，见下图

（2）实测数据分析

原始数据片段

ELL WGS-84 6378137.000 298.257223563
PRO TME 111.000000 1.000000 0.000000 0.000000 0.000000 500000.0000 0.0000
DTM 0.00 0.00 0.00 0.00000 0.00000 0.00000 0.00000
GEO "" 0.000
HVU 1.0000000000 1.0000000000
TND 12:29:40 08/09/2020 -480
DEV 0 33269 "GPS NMEA-0183" 57348 C:\HYPACK 2018\devices\gps.dll 17.2.6.0
OFF 0 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000
PRD 0 KTD "" "" ""
DDT 0 SYN KTC
USR "FENERBAHCE" "NOT FOR COMMERCIAL USE" 0x1FF 1907
EOH 374E52CD73F92DB2E60B4A94FE482003F68C5D29E7478A0D1496A3E400681FCDA7937359454FF5926C0162AD3554163AF250A1E5D95964704E38C793B142788EB7AC35BF335E20EB945A4BA46560B95F8FB276EAB0101A1A134B303180BE568479319B8D1B2E956DBB4C8F303F94D65B22AAD863A97FD52DE261A9C83308B4BF
POS 0 44979.000 429782.591 3367458.117
QUA 0 44979.000 7 5.000 0.800 16.000 4.000 0.000 0.000 0.000
RAW 0 44979.000 4 302550.22194 1101614.78033 372.27600 42939.00000
GYR 0 44979.530 210.160
SYN 0 44979.525 6 44738920.099 44738920.099 256.000 0.000 0.000 0.000
MSG 0 44979.517 $GNGGA,042939.00,3025.50221938,N,11016.14780327,E,4,16,0.8,395.028,M,-22.752,M,13.0,0002*42
MSG 0 44979.525 $GNZDA,042939.06,09,08,2020,00,00*7A
MSG 0 44979.528 $GNHDT,,*51
MSG 0 44979.530 $GNVTG,210.16,T,213.69,M,0.02,N,0.03,K,D*32
MSG 0 44979.708 UTC 20.08.09 04:29:40 69
POS 0 44980.000 429782.589 3367458.114
QUA 0 44980.000 7 5.000 0.800 16.000 4.000 0.000 0.000 0.000
RAW 0 44980.000 4 302550.22177 1101614.78022 372.27500 42940.00000
GYR 0 44980.525 319.310
SYN 0 44980.520 6 44738920.099 44738920.099 256.000 0.000 0.000 0.000
MSG 0 44980.513 $GNGGA,042940.00,3025.50221774,N,11016.14780215,E,4,16,0.8,395.027,M,-22.752,M,14.0,0002*42
MSG 0 44980.520 $GNZDA,042940.05,09,08,2020,00,00*77
MSG 0 44980.524 $GNHDT,,*51
MSG 0 44980.525 $GNVTG,319.31,T,322.84,M,0.01,N,0.02,K,D*3D
MSG 0 44980.707 UTC 20.08.09 04:29:41 69
FIX 99 44980.750 3 429782.589 3367458.114
POS 0 44981.000 429782.589 3367458.111
QUA 0 44981.000 7 5.000 0.800 16.000 4.000 0.000 0.000 0.000
RAW 0 44981.000 4 302550.22161 1101614.78019 372.27200 42941.00000
MSG 0 44981.510 $GNGGA,042941.00,3025.50221613,N,11016.14780192,E,4,16,0.8,395.024,M,-22.752,M,15.0,0002*4D
GYR 0 44981.523 217.260
SYN 0 44981.518 6 44738920.099 44738920.099 256.000 0.000 0.000 0.000
MSG 0 44981.518 $GNZDA,042941.05,09,08,2020,00,00*76
MSG 0 44981.522 $GNHDT,,*51
MSG 0 44981.523 $GNVTG,217.26,T,220.79,M,0.02,N,0.04,K,D*30
MSG 0 44981.707 UTC 20.08.09 04:29:42 69

实现功能：从上万条的记录数据中，提取只包含$GNGGA字符串的行

//提取含GNGGA的行
@echo off
findstr /C:"$GNGGA" B.RAW>B1.RAW

上述语句的意思是将B.RAW文件中含有GNGGA的行完全提取出来，生成一个新文件B1.RAW，并保存

结语：希望在以后的日子里能够多思考，多动手，多实践，提高工作效率，解放自己。

“findstr“ 的应用分析

一、引言

二、应用案例

浏览过的版块