Professional Documents
Culture Documents
【详细参数及报价】智能图文系列产品解决方案及报价
【详细参数及报价】智能图文系列产品解决方案及报价
【详细参数及报价】智能图文系列产品解决方案及报价
1.1 整体介绍
标准文字识别系统包含:文字识别、版面分析、版面还原三个基础模块,中
文表格及全文检索系统两个可选模块。
版面分析:将版面不同的文献,里面不同的元素、抽取其中的属性信息,包
含位置、大小、颜色、及关系等等其他属性,标引精度可达到 99%以上。
1. 版面分析预处理包括图像二值化、边缘去噪等。
2. 版面分割与理解,得到不同属性的连通域模块,如图像、表格、文本,
同时记录连通域位置信息。然后,对文字行进行切分,实现对文字区域的字符识
别。
3. 版面重构,根据版面分割与理解时记载的连通域位置信息,确定连通域
归属序列,进而获取文章逻辑结构,包括各区域的逻辑属性、文章的
4. 层次关系和阅读顺序等,重构出包含文字信息和版面信息的电子文档。
文字识别:支持简体中文、英文、各类符号等的识别,印刷体识别精度>99.9%,
可实现全自动的内容数字化支持简体中文、英文、各类符号等的识别,印刷体识
别精度>99.9%,可实现全自动的内容数字化。文字识别模块对分离出的印刷体文
字区域进行定位与识别。是数字化过程中一个重要的一步,决定了数字化的准确
性。
版面还原:双层 PDF 格式文件是一种具有多层结构的 PDF 格式文件,由 PDF
文件衍生而来。该文件既可以是文本型的(例如 word 生成的文件),也可以是图
像型的,可以 100%保留原始版面效果,同时便于建立索引数据库,进行科学化
管理。双层叠加 PDF 文件,包含上下两层:上层是原图像,下层是对应的识别结
果按照原图像版面进行重构形成的可检索文档。
全文检索系统:对扫描文档的全文识别结果进行全文的索引、建库、发布、
检索查询。
中文表格:根据文件中的表格形态,通过对表格的识别与分析生成标准的
EXCEL 表格文件。表格识别引擎是在 OCR 识别核心基础上开发的基于固定表格识
别的一个模块。识别表格种类多,各种银行单据、保单、测评表、目录等。
识别精度
标准印刷体简体中文识别精度为 99.9%。知网的期刊数据集中,300dpi 扫描
的灰度图测试环境下,整体错误率万分之 1.8。
1.2 产品报价
其他可选功能项:
支持电子化资源碎片化处理并全文标
全文检索系统(可选) 10 万
引,能够支持全文检索功能。
中文表格输出 EXCEL(可选)对于电子化的中文表格,支持 EXCEL 格
10 万
式进行输出。
二、智能图文“图纸识别与全文检索系统”介绍
2.1 产品介绍
图纸识别与全文检索系统包含:图纸元素的分析与识别、CAD 格式图纸解析、
数据库管理与检索系统三部分。
图纸元素识别:图签定位与识别、图签表格还原 xls 或标准结构化数据生成、
图纸子图定位,图纸子图标题定位与识别,对应关系构建。目录表格分析与识别、
图纸说明版面分析与识别。
CAD 格式图纸解析:解析 CAD 格式图纸、图纸标题,图签等文字信息。
数据库管理与检索系统:建库管理全文检索,图纸的每个元素信息都可以作
为检索字段进行全文检索。
2.2 产品报价
项目名称 说明 定价(元)
图签识别 图签定位与识别 10 万
图签表格还原 xls 或标准结构化数据
图签结构化提取 5万
生成
图纸子图定位,图纸子图标题定位与识
图纸子图标题定位与识别 10 万
别,对应关系构建。
图纸目录识别 目录表格分析与识别 10 万
图纸说明识别 图纸说明版面分析与识别 10 万
数据库管理与检索系统 入库检索发布系统 10 万
3.1 产品介绍
图像相似检索对比系统包含:图像特征提取、相似检索建库模块、检索查询
引擎、相似对比模块这四个部分。
图像特征提取:基于图像视觉信息采用深度学习、自编码器等方法抽取用于
相似检索比对的图像特征。基于模板的方法、边缘的方法、灰度的方法、空间转
换的方法等不同的方法来检测图像特征。
相似检索建库模块:基于图像视觉信息训练用于相似检索神经网络模型并建
立相似检索索引。
检索查询引擎:基于图像视觉特征的相似检索查询模块,支持用户图像库的
相似检索功能。
相似对比模块:基于图像配准及叠加显示技术,实现相似图像的对比分析功
能。
召回率、正确率:学术图片 2000 万检索集测试,召回率>80%,正确率>60%。
根据不变更新的学术图片数据集的变化,召回率和正确率有相应的变化。
3.2 产品报价
项目名称 说明 定价(元)
基于图像视觉信息采用深度学习、自编码器等
图像特征提取模块 10 万
方法抽取用于相似检索比对的图像特征
基于图像视觉信息训练用于相似检索神经网
图像相似检索库建库模块 20 万
络模型并建立相似检索索引
基于图像视觉特征的相似检索查询模块,支持
图像相似检索查询引擎 10 万
用户图像库的相似检索功能
基于图像配准及叠加显示技术,实现相似图像
图像相似对比模块 5万
的对比分析功能
四、翻页免拆书籍扫描仪介绍
4.1 手动翻页免拆书籍扫描仪
1)功能:
成册文件免拆扫描;全中文界面彩色触摸屏操作;顶置式双扫描头配置;非接触
式 CMOS 镜 头扫描;采用可调节 V 型玻璃压板做文件展平处理;智能化控制扫描
架位置一键到位;智能化控制中缝自动对齐;书页翻动过程中厚薄平衡自动调整。
生产型功能和自助型功能一机两用。
2)扫描幅面:成册 A4
3)扫描适应范围:胶装纸质成册文件/线装纸质成册文件/单页纸质文件
4)不同装订方式的适应:配备可自动调整的托架
5)档案固定方式:钢丝定位+托架限位
6)操作台:110~180°可调节 V 型书稿台
7)扫描头动作:左右摄像头之间距离可电动调整
8)光学分辨率:3742*2806*2 400DPI
9)扫描方式:免拆装订,手动翻页扫描,V 型玻璃压板+快拍按键,即压即扫,
即扫即存。或设备机身按键、PC 软件触发三种方式。
10)中缝对齐方式:自动
11)扫描速度:成册 2 页/秒
12)成册文件扫描厚度:≤4cm
13)展平方式:物理展平
14)对焦方式:定焦
15)图像预览格式:支持 YUY2 和 MJPG
16)扫描输出:彩色,灰度
17)图像输出格式:JPEG,TIFF,BMP,PNG,JPEG 压缩,TIFF 无压缩,PDF,多页 PDF,
多页 TIFF
18)表格及文字行畸变:无
19)数据接口:USB2.0 High-Speed
20)扫描存储路径:扫描至计算机
21)扫描路径:符合书本弧度从左至右扫描
22)触摸控制屏:5 英寸中文彩色触摸屏面板
23)光源:两侧双光源配置,可避免光滑纸张反光,白色 LED 冷光源照明系统,
光源入射角度可调节,无红外线,无辐射,不炫目
24)附件:快捷开关,遮阳罩(赠送)
25)内置软件:
全中文界面、纸质厚度设置、扫描头位置调整,书稿台位置调整。
26)附带软件:
中文版 BOOKSCAN 扫描软件:采集图像,图片格式设定,图像色彩输出设定,压
缩比例设定,分辨率设定,存储设定;处理图像,旋转,亮度,对比度,去斑点,
曝光补偿,批量纠偏,批量裁剪,批量锐化,批量二值化。
4.2 自动翻页免拆书籍扫描仪
1)功能:
手动和自动一体机(书页翻动实现手动和自动两种模式)
成册文件免拆扫描;全中文界面彩色触摸屏操作;顶置式双扫描头配置;
工业级 CMOS 扫描头扫描;采用可调节 V 型书稿台,采用可调节 V 型玻璃压板
做文件展平处理;智能化控制扫描架位置一键到位;智能化控制中缝自动对齐;
书页翻动过程中厚薄平衡自动调整。
生产型功能和自助型功能一机两用。
2)扫描最大幅面:成册 A4+(打开 A3)
3)扫描适应范围:免拆装订、成册胶装/线装书籍、公/检/法 卷宗 案卷、人
事档案、古籍等
4)不同装订方式的适应:配备可自动调整的托架
5)档案固定方式:钢丝定位+托架限位
6)操作台:110~180°可调节 V 型书稿台
7)扫描头动作:左右摄像头之间距离可电动调整
8)光学分辨率:600dpi
9)色深:24 位
10)扫描方式:免拆装订,手动翻页或自动翻页扫描,即压即扫,即扫即存。
或设备机身按键、PC 软件触发四种方式。
11)中缝对齐方式:自动
12)扫描速度:手动 2 页/秒,自动 20 页/分钟
13)成册文件最大扫描厚度:4cm 以上
14)展平方式:物理展平
15)对焦方式:定焦
16)图像预览格式:支持 YUY2 和 MJPG
17)扫描输出:彩色,灰度
18)图像输出格式:JPEG,TIFF,BMP,PNG,JPEG 压缩,TIFF 无压缩,PDF,多页 PDF
(需另配 OCR),多页 TIFF(需另配 OCR)
19)表格及文字行畸变:无
20)数据接口:USB3.0 High-Speed
21)扫描存储路径:扫描至计算机
22)扫描路径:符合书本弧度从左至右扫描
23)触摸控制屏:5 英寸中文彩色触摸屏面板
24)光源:两侧双光源配置,可避免光滑纸张反光,白色 LED 冷光源照明系统,
光源入射角度可调节,无红外线,无辐射,不炫目
25)附件:快捷开关,遮阳罩(赠送)
26)内置软件:
全中文界面、纸质厚度设置、扫描头位置调整,书稿台位置调整。
27)附带软件:
中文版 BOOKSCAN 扫描软件:采集图像,自动裁切和批量裁切可选,图片
格式设定,图像色彩输出设定,压缩比例设定,分辨率设定,存储设定;处理
图像,旋转,亮度,对比度,去斑点,曝光补偿,批量纠偏,批量裁剪,批量锐化,
批量二值化。
4.3 产品应用场景
1. 企业图书馆或电子阅览室
企业图书馆或电子阅览室的数字化、信息化包括:纸质图书整理、图书扫描、
图书质量检测与验收。OCR 文字质检和 OCR 文字识别等。我们的两款扫描仪可以
和软件无缝衔接,扫描完成后自动进行识别服务,做到软硬件一体化。一可以提
高工作效率,二可以节省人工成本,三操作简单,易学易用。
2. 企业档案室及科技情报室
企业档案室及科技情报室在数字化建设或者整体信息化升级中,会有大量的
纸质资料、档案资料、设计图纸、技术报告等资源需要做数字化加工。运用免拆
扫描仪,再利用智能图文更智能话的技术可以大大降低成本,高效快捷的进行知
识利用。
3. 企业综合管理部门或总经办
企业综合管理部门或总经办在日常办公中会有大量的员工档案、人员信息、
纸质流转文件、会签文件等材料,需要进行资源的碎片化处理加工后进行电子存
档。通过一体化的 OCR 识别系统极大的简
运用免拆扫描仪,再利用智能图文更智能话的技术可以大大降低成本,高效
快捷的进行知识利用。
4.4 产品报价
OCR 标准文字识别系统有标准精度版和高精度版可选择,扫描仪器有自动和
手动版本可选择。
项目名称 说明 定价(元)