十八种文件格式转换,四种内码转换,文件合并,文件分割,乱码修改,格式整理,文件更名,目录合并,广告删除,HTML 代码删除,自动排版,文本搜索替换,正则表达式搜索替换,块搜索替换,通配符搜索替换.全面支持 Unicode,Unicode Big Endian,UTF-8 格式文件,功能可扩展,支持批处理。文件体积小,纯绿色软件,不用安装直接运行。
用法
1 首先选择你的 txt/html 文件所在目录,该目录中的文件将显示在列表中
2 单击列表中的一个文件名来打开此文件
3 批处理就是一次性依次处理整个目录中的所有文件。
对于格式整理而言,通常情况下, 你只需使用"格式整理"就够了。
建议多进行一次“格式整理”处理。这样可以把广告清除得更彻底一些。
此外
巧用查找和替换功能,可以达到一些意想不到的效果。例如,当对一个文档进行了"格式整理"后,再进行如下替换:把“\r\n”全部替换成“\r\n ”(不含引号)
或者
把“\r\n”全部替换成“\r\n\r\n ”(不含引号)
呵呵,你自己看看处理效果吧!
另外,以上操作的逆操作是:
把“\r\n ”全部替换成“\r\n”(不含引号)
把“\r\n\r\n ”全部替换成“\r\n”(不含引号)
关于去除广告
你可以在你的 txt 文件所在的目录中创建一个名为 remove.txt 的文件,在其中写入你想要移除的广告内容,一行一条。
这样,txtFormat 会将 remove.txt 中的内容逐条、全部从你的 txt 文件中删除。
关于格式整理:
在“格式整理”功能中,程序将进行以下操作:
1 繁体转简体(GBK -> GB),有些比较长的小说,大部分内容是简体,但有些章节的内容确是繁体。为统一起见,对全部内容进行一次“繁转简”。
2 删除行首、尾空格及行与行之间的空格
3 章节标题检查及简单处理(标题与正文内容间保留一个空行)
4 全角字符、数字转半角(便于后面的去除广告处理)
5 删除正文中的空格(包括全角和半角空格)
6 去除广告
7 删除硬回车(相当于重新排版)
8 HTML 代码替换:在有些小说中或多或少混有一些没有处理好的 HTML 代码,该处理就是用于查找并替换这些代码的。
9 重复章节标题的删除。例如小说“庆余年”,开始一些卷的标题就有重复,该功能用于删除重复的章节标题。
10 简繁标点符号统一(如:「 『 转换为 “ 等)