#!/bin/bash
# Convert abs-cn html files' charset to utf8,
# and add charset info of <meta> to every html document.
for i in *.html ;
do
echo $i
iconv -f gbk -t utf8 -c "$i" | sed "s/CONTENT=\"Modular DocBook HTML Stylesheet Version 1\.79\">/CONTENT=\"Modular DocBook HTML Stylesheet Version 1\.79\"><meta http-equiv=Content-Type content=\"text\/html;charset=utf-8\">/" > work/$i
done
---------------------
转化字符编码,根据abs-cn的HTML源码的特征,添加charset的meta信息。
每个转化后的新文件放到work目录内,以免重复处理。