【详细参数及报价】智能图文系列产品解决方案及报价

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 8

一、智能图文“标准文字识别系统”产品介绍

1.1 整体介绍

标准文字识别系统包含:文字识别、版面分析、版面还原三个基础模块,中
文表格及全文检索系统两个可选模块。

版面分析:将版面不同的文献,里面不同的元素、抽取其中的属性信息,包
含位置、大小、颜色、及关系等等其他属性,标引精度可达到 99%以上。
1. 版面分析预处理包括图像二值化、边缘去噪等。
2. 版面分割与理解,得到不同属性的连通域模块,如图像、表格、文本,
同时记录连通域位置信息。然后,对文字行进行切分,实现对文字区域的字符识
别。
3. 版面重构,根据版面分割与理解时记载的连通域位置信息,确定连通域
归属序列,进而获取文章逻辑结构,包括各区域的逻辑属性、文章的
4. 层次关系和阅读顺序等,重构出包含文字信息和版面信息的电子文档。
文字识别:支持简体中文、英文、各类符号等的识别,印刷体识别精度>99.9%,
可实现全自动的内容数字化支持简体中文、英文、各类符号等的识别,印刷体识
别精度>99.9%,可实现全自动的内容数字化。文字识别模块对分离出的印刷体文
字区域进行定位与识别。是数字化过程中一个重要的一步,决定了数字化的准确
性。
版面还原:双层 PDF 格式文件是一种具有多层结构的 PDF 格式文件,由 PDF
文件衍生而来。该文件既可以是文本型的(例如 word 生成的文件),也可以是图
像型的,可以 100%保留原始版面效果,同时便于建立索引数据库,进行科学化
管理。双层叠加 PDF 文件,包含上下两层:上层是原图像,下层是对应的识别结
果按照原图像版面进行重构形成的可检索文档。
全文检索系统:对扫描文档的全文识别结果进行全文的索引、建库、发布、
检索查询。
中文表格:根据文件中的表格形态,通过对表格的识别与分析生成标准的
EXCEL 表格文件。表格识别引擎是在 OCR 识别核心基础上开发的基于固定表格识
别的一个模块。识别表格种类多,各种银行单据、保单、测评表、目录等。
识别精度
标准印刷体简体中文识别精度为 99.9%。知网的期刊数据集中,300dpi 扫描
的灰度图测试环境下,整体错误率万分之 1.8。

1.2 产品报价

1.高精度版 17 万(按点购买,终身使用,服务费每年 5000.)


项目 说明 定价(元)
支持简体中文、英文、各类符号等的
企业级工厂版文字识别系统
识别,印刷体识别精度>99.9%,可实 8万
(终身版)
现全自动的内容数字化
支持多种版面的多要素识别,包括文
字、图片、公式、表格、直线等要素,
版面分析系统(终身版) 5万
给出标注位置、大小与属性信息。标
引精度 99%以上
对识别的图像进行原版显示的版面还
版面还原(终身版) 4万
原,生成双层 pdf (图片叠加文字)

2.标准精度版 12 万(按点购买,终身使用,服务费每年 5000.)


项目 说明 定价(元)
标准版文字识别系统(终身 支持简体中文、英文、各类符号等的
3万
版) 识别,印刷体识别精度>99%
支持多种版面的多要素识别,包括文
字、图片、公式、表格、直线等要素,
版面分析系统(终身版) 5万
给出标注位置、大小与属性信息。标
引精度 99%以上
对识别的图像进行原版显示的版面
版面还原(终身版) 4万
还原,生成双层 pdf(图片叠加文字)

其他可选功能项:
支持电子化资源碎片化处理并全文标
全文检索系统(可选) 10 万
引,能够支持全文检索功能。
中文表格输出 EXCEL(可选)对于电子化的中文表格,支持 EXCEL 格
10 万
式进行输出。
二、智能图文“图纸识别与全文检索系统”介绍

2.1 产品介绍

图纸识别与全文检索系统包含:图纸元素的分析与识别、CAD 格式图纸解析、
数据库管理与检索系统三部分。
图纸元素识别:图签定位与识别、图签表格还原 xls 或标准结构化数据生成、
图纸子图定位,图纸子图标题定位与识别,对应关系构建。目录表格分析与识别、
图纸说明版面分析与识别。
CAD 格式图纸解析:解析 CAD 格式图纸、图纸标题,图签等文字信息。
数据库管理与检索系统:建库管理全文检索,图纸的每个元素信息都可以作
为检索字段进行全文检索。

2.2 产品报价

项目名称 说明 定价(元)

图签识别 图签定位与识别 10 万
图签表格还原 xls 或标准结构化数据
图签结构化提取 5万
生成
图纸子图定位,图纸子图标题定位与识
图纸子图标题定位与识别 10 万
别,对应关系构建。
图纸目录识别 目录表格分析与识别 10 万

图纸说明识别 图纸说明版面分析与识别 10 万

CAD 格式图纸解析 解析 CAD 图纸图题,图签等文字信息 10 万

数据库管理与检索系统 入库检索发布系统 10 万

版面还原 版面还原,生成双层 pdf 4万


三、智能图文“图像相似检索对比系统”产品方案

3.1 产品介绍

图像相似检索对比系统包含:图像特征提取、相似检索建库模块、检索查询
引擎、相似对比模块这四个部分。

图像特征提取:基于图像视觉信息采用深度学习、自编码器等方法抽取用于
相似检索比对的图像特征。基于模板的方法、边缘的方法、灰度的方法、空间转
换的方法等不同的方法来检测图像特征。
相似检索建库模块:基于图像视觉信息训练用于相似检索神经网络模型并建
立相似检索索引。
检索查询引擎:基于图像视觉特征的相似检索查询模块,支持用户图像库的
相似检索功能。
相似对比模块:基于图像配准及叠加显示技术,实现相似图像的对比分析功
能。
召回率、正确率:学术图片 2000 万检索集测试,召回率>80%,正确率>60%。
根据不变更新的学术图片数据集的变化,召回率和正确率有相应的变化。

3.2 产品报价

项目名称 说明 定价(元)

基于图像视觉信息采用深度学习、自编码器等
图像特征提取模块 10 万
方法抽取用于相似检索比对的图像特征

基于图像视觉信息训练用于相似检索神经网
图像相似检索库建库模块 20 万
络模型并建立相似检索索引

基于图像视觉特征的相似检索查询模块,支持
图像相似检索查询引擎 10 万
用户图像库的相似检索功能

基于图像配准及叠加显示技术,实现相似图像
图像相似对比模块 5万
的对比分析功能
四、翻页免拆书籍扫描仪介绍

4.1 手动翻页免拆书籍扫描仪

1)功能:
成册文件免拆扫描;全中文界面彩色触摸屏操作;顶置式双扫描头配置;非接触
式 CMOS 镜 头扫描;采用可调节 V 型玻璃压板做文件展平处理;智能化控制扫描
架位置一键到位;智能化控制中缝自动对齐;书页翻动过程中厚薄平衡自动调整。
生产型功能和自助型功能一机两用。
2)扫描幅面:成册 A4
3)扫描适应范围:胶装纸质成册文件/线装纸质成册文件/单页纸质文件
4)不同装订方式的适应:配备可自动调整的托架
5)档案固定方式:钢丝定位+托架限位
6)操作台:110~180°可调节 V 型书稿台
7)扫描头动作:左右摄像头之间距离可电动调整
8)光学分辨率:3742*2806*2 400DPI
9)扫描方式:免拆装订,手动翻页扫描,V 型玻璃压板+快拍按键,即压即扫,
即扫即存。或设备机身按键、PC 软件触发三种方式。
10)中缝对齐方式:自动
11)扫描速度:成册 2 页/秒
12)成册文件扫描厚度:≤4cm
13)展平方式:物理展平
14)对焦方式:定焦
15)图像预览格式:支持 YUY2 和 MJPG
16)扫描输出:彩色,灰度
17)图像输出格式:JPEG,TIFF,BMP,PNG,JPEG 压缩,TIFF 无压缩,PDF,多页 PDF,
多页 TIFF
18)表格及文字行畸变:无
19)数据接口:USB2.0 High-Speed
20)扫描存储路径:扫描至计算机
21)扫描路径:符合书本弧度从左至右扫描
22)触摸控制屏:5 英寸中文彩色触摸屏面板
23)光源:两侧双光源配置,可避免光滑纸张反光,白色 LED 冷光源照明系统,
光源入射角度可调节,无红外线,无辐射,不炫目
24)附件:快捷开关,遮阳罩(赠送)
25)内置软件:
全中文界面、纸质厚度设置、扫描头位置调整,书稿台位置调整。
26)附带软件:
中文版 BOOKSCAN 扫描软件:采集图像,图片格式设定,图像色彩输出设定,压
缩比例设定,分辨率设定,存储设定;处理图像,旋转,亮度,对比度,去斑点,
曝光补偿,批量纠偏,批量裁剪,批量锐化,批量二值化。

4.2 自动翻页免拆书籍扫描仪
1)功能:
手动和自动一体机(书页翻动实现手动和自动两种模式)
成册文件免拆扫描;全中文界面彩色触摸屏操作;顶置式双扫描头配置;
工业级 CMOS 扫描头扫描;采用可调节 V 型书稿台,采用可调节 V 型玻璃压板
做文件展平处理;智能化控制扫描架位置一键到位;智能化控制中缝自动对齐;
书页翻动过程中厚薄平衡自动调整。
生产型功能和自助型功能一机两用。
2)扫描最大幅面:成册 A4+(打开 A3)
3)扫描适应范围:免拆装订、成册胶装/线装书籍、公/检/法 卷宗 案卷、人
事档案、古籍等
4)不同装订方式的适应:配备可自动调整的托架
5)档案固定方式:钢丝定位+托架限位
6)操作台:110~180°可调节 V 型书稿台
7)扫描头动作:左右摄像头之间距离可电动调整
8)光学分辨率:600dpi
9)色深:24 位
10)扫描方式:免拆装订,手动翻页或自动翻页扫描,即压即扫,即扫即存。
或设备机身按键、PC 软件触发四种方式。
11)中缝对齐方式:自动
12)扫描速度:手动 2 页/秒,自动 20 页/分钟
13)成册文件最大扫描厚度:4cm 以上
14)展平方式:物理展平
15)对焦方式:定焦
16)图像预览格式:支持 YUY2 和 MJPG
17)扫描输出:彩色,灰度
18)图像输出格式:JPEG,TIFF,BMP,PNG,JPEG 压缩,TIFF 无压缩,PDF,多页 PDF
(需另配 OCR),多页 TIFF(需另配 OCR)
19)表格及文字行畸变:无
20)数据接口:USB3.0 High-Speed
21)扫描存储路径:扫描至计算机
22)扫描路径:符合书本弧度从左至右扫描
23)触摸控制屏:5 英寸中文彩色触摸屏面板
24)光源:两侧双光源配置,可避免光滑纸张反光,白色 LED 冷光源照明系统,
光源入射角度可调节,无红外线,无辐射,不炫目
25)附件:快捷开关,遮阳罩(赠送)
26)内置软件:
全中文界面、纸质厚度设置、扫描头位置调整,书稿台位置调整。
27)附带软件:
中文版 BOOKSCAN 扫描软件:采集图像,自动裁切和批量裁切可选,图片
格式设定,图像色彩输出设定,压缩比例设定,分辨率设定,存储设定;处理
图像,旋转,亮度,对比度,去斑点,曝光补偿,批量纠偏,批量裁剪,批量锐化,
批量二值化。

4.3 产品应用场景
1. 企业图书馆或电子阅览室
企业图书馆或电子阅览室的数字化、信息化包括:纸质图书整理、图书扫描、
图书质量检测与验收。OCR 文字质检和 OCR 文字识别等。我们的两款扫描仪可以
和软件无缝衔接,扫描完成后自动进行识别服务,做到软硬件一体化。一可以提
高工作效率,二可以节省人工成本,三操作简单,易学易用。
2. 企业档案室及科技情报室
企业档案室及科技情报室在数字化建设或者整体信息化升级中,会有大量的
纸质资料、档案资料、设计图纸、技术报告等资源需要做数字化加工。运用免拆
扫描仪,再利用智能图文更智能话的技术可以大大降低成本,高效快捷的进行知
识利用。
3. 企业综合管理部门或总经办
企业综合管理部门或总经办在日常办公中会有大量的员工档案、人员信息、
纸质流转文件、会签文件等材料,需要进行资源的碎片化处理加工后进行电子存
档。通过一体化的 OCR 识别系统极大的简
运用免拆扫描仪,再利用智能图文更智能话的技术可以大大降低成本,高效
快捷的进行知识利用。

4.4 产品报价
OCR 标准文字识别系统有标准精度版和高精度版可选择,扫描仪器有自动和
手动版本可选择。

项目名称 说明 定价(元)

自动翻页免拆书籍扫描仪 自动翻页,终身使用,服务费每年 14000 元。 36.8 万

手动翻页免拆书籍扫描仪 手动翻页,终身使用,服务费每年 9000 元。 10 万

You might also like