使用vbs脚本进行批量编码转换
最近需要使用SourceInsight查看分析在Linux系统下开发的项目代码,我们知道Linux系统中文本文件默认编码格式是UTF-8,而Windows中文系统中的默认编码格式是Gb2312。系统内的编码格式有所区别倒无伤大雅,关键的是SourceInsight竟不支持UTF-8,导致项目代码内的中文注释全部乱码!
既然SourceInsight不支持UTF-8编码的文件,那我们就得想办法将UTF-8的代码文件转化为GB2312编码的。首先想到的是到网上搜一下“批量编码转换工具”,结果下载后发现编码转换后的文件总是出现乱码,可能是工具的bug吧。既然不能使用工具转换,那就自己写一个程序进行编码转换,但是细想一下觉得C++/java的编码转换程序写起来又比较啰嗦,要是在Linux下写一个shell脚本就能轻松搞定了。还好Windows下有vbs脚本可以帮助我们轻松达到这个目的。
'-------------------------------------------------
'函数名称:ReadFile
'作用:利用AdoDb.Stream对象来读取各种格式的文本文件
'-------------------------------------------------
Function ReadFile(FileUrl, CharSet)
Dim Str
Set stm = CreateObject("Adodb.Stream")
stm.Type = 2
stm.mode = 3
stm.charset = CharSet
stm.Open
stm.loadfromfile FileUrl
Str = stm.readtext
stm.Close
Set stm = Nothing
ReadFile = Str
End Function
我们使用ReadFile函数读取文件,其中FileUrl指定文件的路径,CharSet指定文件的原始编码格式,使用adodb.stream对象读取文件内容到Str。
'-------------------------------------------------
'函数名称:WriteToFile
'作用:利用AdoDb.Stream对象来写入各种格式的文本文件
'-------------------------------------------------
Function WriteToFile (FileUrl, Str, CharSet)
Set stm = CreateObject("Adodb.Stream")
stm.Type = 2
stm.mode = 3
stm.charset = CharSet
stm.Open
stm.WriteText Str
stm.SaveToFile FileUrl, 2
stm.flush
stm.Close
Set stm = Nothing
End Function
然后使用WriteToFile将Str写回原文件FileUrl,并设定新的编码CharSet。
'-------------------------------------------------
'函数名称:ConvertFile
'作用:将一个文件进行编码转换
'-------------------------------------------------
Function ConvertFile(FileUrl)
Call WriteToFile(FileUrl, ReadFile(FileUrl, SrcCode), DestCode)
End Function
这样ConvertFile对上述两个函数封装,实现文件FileUrl的编码转换,其中原始编码SrcCode与目的编码DestCode为全局变量。
如果仅对一个文件进行编码转换,我们不必这么大费周章。我们希望能对任意的文件或文件夹内的所有文件进行编码转换,达到批量转换的目的。
'-------------------------------------------------
'函数名称:ConvertDir
'作用:将任意目录内的文件进行编码转换
'-------------------------------------------------
Function ConvertDir(DirUrl)
If fs.FileExists(DirUrl) Then
Call ConvertFile(DirUrl)
Else
Call SearchDir(DirUrl)
End If
End Function
函数ConvertDir对任意路径的文件/文件夹进行编码转换,使用scripting.filesystemobject对象的FileExists函数判断路径对应的是文件还是文件夹,如果是文件则直接调用ConvertFile进行编码转换,否则调用SearchDir处理文件夹。
'-------------------------------------------------
'函数名称:SearchDir
'作用:递归查找目录内的文件,进行编码转换
'-------------------------------------------------
Function SearchDir(path)
Set folder = fs.getfolder(path)
Set subfolders = folder.subfolders
Set Files = folder.Files
For Each i In Files
Call ConvertFile(i.path)
Next
For Each j In subfolders
Call SearchDir(j.path)
Next
End Function
函数SearchDir是递归的,首先调用getfolder创建文件夹对象,然后取出文件夹内的子文件夹集合subfolders和子文件集合files。对于每个子文件,直接调用ConvertFile进行编码转换即可,而对于每个子文件夹,则递归调用SearchDir重复处理。
'-------------------------------------------------
'设置编码:默认 utf-8 --> gb2312
'-------------------------------------------------
SrcCode="utf-8"
DestCode="gb2312"
'-------------------------------------------------
'解析参数
'-------------------------------------------------
Set fs = CreateObject("scripting.filesystemobject")
Set objArgs = WScript.Arguments
If objArgs.Count>0 Then
For I = 0 To objArgs.Count - 1
FileUrl = objArgs(I)
Call ConvertDir(FileUrl)
Next
Else
MsgBox "没有文件/文件夹被拖入!"
wscript.quit
End If
MsgBox "转换成功!"
最后通过解析脚本文件的参数,由于每个参数对应一个文件/文件夹的路径,将之传递给ConvertDir即可。这里默认的是将UTF-8编码转化为GB2312编码,读者可以根据自身需要自行修改。
将上述代码保存为ConvertCode.vbs,只需要将任意多个文件选中拖动到该脚本文件上即可。或者使用命令行。
> ConvertCode.vbs [filepath]
需要注意的是文件编码是就地转换的,在转换之前最好将原文件/文件夹进行备份。
最后附上脚本文件的所有代码。
FileUrl = objArgs(I)
stm.mode =
stm.charset = CharSet
stm.Open
stm.loadfromfile FileUrl
stm.mode =
stm.charset = CharSet
stm.Open
stm.WriteText
stm.flush
stm.Close
Set stm = Nothing
End Function
使用vbs脚本进行批量编码转换的更多相关文章
-
用shell批量编码转换
-------------------------------------文件内容转换:iconv-------------------------------------- 通常,从其他平台拷贝过来 ...
-
loadrunner 脚本开发-字符串编码转换
字符串编码转换 by:授客 QQ:1033553122 相关函数 lr_convert_string_encoding函数 功能:字符串编码转换 原型: int lr_convert_string ...
-
python实现文件批量编码转换
起因:大三做日本交换生期间在修一门C语言图像处理的编程课,在配套书籍的网站上下载了sample,但是由于我用的ubuntu18.04系统默认用utf-8编码,而文件源码是Shift_JIS编码,因而文 ...
-
远程控制分析之VBS编码转换
简介 分析这种VBS简单chr()函数编码的脚本技巧.只需要把vbs的execute()函数换成信息输出到控制台(dos窗口)函数就可以了. WSH.Echo "print your mes ...
-
python基础-2 编码转换 pycharm 配置 运算符 基本数据类型int str list tupple dict for循环 enumerate序列方法 range和xrange
1.编码转换 unicode 可以编译成 UTF-U GBK 即 #!/usr/bin/env python # -*- coding:utf-8 -*- a = '测试字符' #默认是utf-8 a ...
-
discuz编码转换UTF8与GBK互转完美适合Discuz3.x系列
由于一些网站通信编码的问题不得不把一直使用的网站编码由UTF8转为GBK,在转换过程中在官方看了很多方法,自己也都尝试了一些最后都没有能够成功,数据库的转换一直都是没有大问题,不存在丢失什么的,能看到 ...
-
Vbs脚本经典教材(转)
Vbs脚本经典教材(最全的资料还是MSDN) —为什么要使用Vbs? 在Windows中,学习计算机操作也许很简单,但是很多计算机工作是重复性劳动,例如你每周也许需要对一些计算机文件进行复制.粘贴.改 ...
-
理解perl的编码转换——utf8以及乱码
工作需要,闲暇之余,仔细研究了一下脚本乱码的问题 1. vim新建的文件 1)在linux命令行 vim命令建立的文件,如果内容中不出现中文,默认是ASCII.那么用notepad++打开的时候,就是 ...
-
VBS脚本和HTML DOM自动操作网页
VBS脚本和HTML DOM自动操作网页 2016-06-16 10:24 1068人阅读 评论(0) 收藏 举报 分类: Windows(42) 版权声明:本文为博主原创文章,未经博主允许不得转 ...
随机推荐
-
Nopcommerce 二次开发1 基础
1 Doamin 酒店 namespace Nop.Core.Domain.Hotels { /// <summary> /// 酒店 /// </summary> p ...
-
HDU 2861 四维dp打表
Patti and Terri run a bar in which there are 15 stools. One day, Darrell entered the bar and found t ...
-
ASP.NET MVC中Controller返回值类型ActionResult
1.返回ViewResult视图结果,将视图呈现给网页 public class TestController : Controller { //必须存在Controller\Test\Index.c ...
-
onfiguration problem: Unable to locate Spring NamespaceHandler for XML schema namespace [http://www.springframework.org/schema/security]
org.springframework.beans.factory.parsing.BeanDefinitionParsingException: Configuration problem: Una ...
-
paper 83:前景检测算法_1(codebook和平均背景法)
前景分割中一个非常重要的研究方向就是背景减图法,因为背景减图的方法简单,原理容易被想到,且在智能视频监控领域中,摄像机很多情况下是固定的,且背景也是基本不变或者是缓慢变换的,在这种场合背景减图法的应用 ...
-
Vcenter 添加域管理员权限
授予相应管理权限
-
careercup-数组和字符串1.8
1.8 假定有一个方法isSubstring,可检查一个单词是否为其他字符串的子串.给定两个字符串s1和s2,请编写代码检查s2是否为s1旋转而成,要求只能调用一次isSubstring.旋转字符串: ...
-
Raid1源代码分析--Barrier机制
本想就此结束Raid1的专题博客,但是觉得Raid1中自己构建的一套barrier机制的设计非常巧妙,值得单独拿出来分析.它保证了同步流程和正常读写流程的并发性,也为设备冻结/解冻(freeze/un ...
-
git-分支使用方式
需求场景:假如你看着教程完成了一个项目,但是感觉第一次代码掌握不牢,想要进行第二次代码练习--如果某某心里想我还有初始备份文件,我此时的心里独白是你的硬盘还够用吗o(╯□╰)o 1 创建一个新分支 - ...
-
web前端上传图片的几种方法
1.表单上传 最传统的图片上传方式是form表单上传,使用form表单的input[type=”file”]控件,打开系统的文件选择对话框,从而达到选择文件并上传的目的. form表单上传 表单上传需 ...