文通TH-OCR文字识别软件是一款免费文字识别软件,软件集成多种国内外OCR相关技术开发商,提供最新最全面的文字和手写识别技术,并采用跨平台的只能图像处理系统,支持多平台使用,支持图像处理,亚洲文字OCR、手写OCR识别等。让您在操作时更加得心应手。
软件特色
1、OCR软件具有文通最新识别核心,识别正确率高,识别速度快;
2、支持导入图像,支持连接扫描仪扫描图像OCR
3、支持处理灰度、彩色、黑白三种色彩的BMP、TIF、JPG等多种格式的OCR图像文件;
4、OCR可识别简体、繁体和英文三种语言
软件功能
OCR文字识别软件识别核心
OCR文字识别软件内置文通公司最新研发的高性能文字识别引擎,中文识别率达99.8%以上。英文、日文、韩文的识别率居世界领先水平。
OCR文字识别软件UNICODE编码
OCR文字识别软件采用UNICODE国际编码标准。系统可在一个统一的平台下,同时处理包括中文、日文、韩文、英文在内的多种文字的识别和校对修改。
OCR文字识别软件XML技术
OCR文字识别软件系统基于开放式的XML数据结构,可以对数据进行扩充和再定义。支持第三方开发厂商方便地进行文档数据的转换、迁移和再利用。
OCR文字识别软件版面还原
OCR文字识别软件强大的版面还原技术,可将识别后的报刊、杂志、图书等多种形式的文档,通过还原字体、字号、版面位置、字体颜色等信息以原版原式呈现在读者面前,最终生成优质的全息PDF文档。
OCR文字识别软件集字校对集字校对
集字校对是OCR文字识别软件特有的文字校对技术,该技术打破了传统校对工具图像与识别结果文本比对显示的模式,将多篇文档中所有识别结果相同的字符图像集中呈现在一个视图中,给校对人员强烈的视觉冲击,让错字自动“跳”入校对人员的眼中,避免了校对人员因陷入文档的上下文语境而产生视觉疲劳,引起的校对准确率下降。同时,由于常用汉字集中在3000-4000个左右,面对海量文字的校对时,不会因文字量的上升带来相应的校对量的上升,仍只需校对这几千个不同的汉字,明显提高工作效率。
OCR文字识别软件自学习软件
OCR文字识别软件针对古籍、科研等特殊领域文档中经常出现的特殊文字,即使不在国家标准范围以内或者TH-OCR字库中并没有支持,用户也可通过自学习功能,将这些文字的图像学习进入系统,使得调整后的核心可以支持这些文字的识别。
OCR文字识别软件双层PDF批量制作功能
OCR文字识别软件可以实现图像文件到PDF文件的自动转换,生成的PDF文件能够实现全文检索,可以复制粘贴,也可以对某个指定目录进行长期监视,真正实现无人操作。
文通TH-OCR文字识别软件使用教程
1、首先点击图像采集,软件会提示你是扫描导入,还是本机导入,你可以根据自己意愿选择
2、点击 简单版面分析,软件会自动文字定位,在整幅图像上寻找文字进行定位
3、点击 识别 系统就会进行OCR识别,把识别结果显示到右侧的空白处
4、最后一步就是 导出了,你可以导出PDF,TXT或者复制到剪切板
适用范围
图书馆
中国国家图书馆 清华大学图书馆 上海交大图书馆 天津南开大学图书馆
在数字图书馆领域拥有上百家用户
电力行业
国电信息中心 各省市电力设计院 各省市电力科学院
在电力标准数字化项目中广泛应用
出版社
商务印书馆 中华书局
在古籍识别技术领域得到了客户的首肯
报社
大连日报社 深圳特区报 南方周末
在生产流程化管理系统已成为报业信息化的首选要素
政府机关
中央办公厅 国家安全部九局 水利部 国家质量技术监督局
网络了最多的政府机关用户
更新日志
1、修复一些软件缺陷
2、提升用户体验