- · 《自动化应用》栏目设置[06/28]
- · 《自动化应用》收稿方向[06/28]
- · 《自动化应用》投稿方式[06/28]
- · 《自动化应用》征稿要求[06/28]
- · 《自动化应用》刊物宗旨[06/28]
笔迹自动比对可行性探析
作者:网站采编关键词:
摘要:赵文朓(1996-),男,辽宁沈阳人,硕士研究生。研究方向:图像检验。 单大国(1961-),男,吉林长春人,中国刑事警察学院副院长,教授,硕士。研究方向:声像资料检验。 一、引
赵文朓(1996-),男,辽宁沈阳人,硕士研究生。研究方向:图像检验。
单大国(1961-),男,吉林长春人,中国刑事警察学院副院长,教授,硕士。研究方向:声像资料检验。
一、引 言
在公安实践中,笔迹检验作为文件检验的重要内容之一,在传统上工作内容主要由文件检验技术人员进行,通过文字形态确认、特征选取、特征比对,最终给出鉴定意见。人工笔迹检验和文字识别的方法准确率高,且具有很强的说服力。但是文件检验技术人员在熟练掌握文件检验的各项技能并能做出高质量的鉴定之前,往往需要大量的练习和实际案件的积累。此外,样本的搜集和筛选也要耗费大量的人力物力,这在一定程度上加剧了警力不足的问题。
随着计算机的普及,公安工作科技化集成的不断推进,逐渐强大的计算机功能给刑事科学技术办案人员提供了越来越多的辅助破案手段。这也提供了一条新的笔迹检验道路——利用计算机代替人工进行比对。
二、文字识别与比对研究现状
文字识别技术早在上世纪就被提出,经过十余年的沉寂,2007年左右出现了大幅进展。尤其是在智能手机和手写输入在生活中日渐流行后,文字识别技术更是随着手写输入精准化的需求迅猛地发展起来。目前较为流行的文字识别技术是基于 OCR的文字识别技术和基于深度学习理论的文字识别技术。
基于OCR的文字识别技术发展得较为成熟,是将包含文字内容的图像经过一定的步骤进行处理,并在数据库中搜索出相应的文字内容,最后输出图像内容的文本形式的过程。基于OCR的汉字识别技术是基于拉丁文的识别原理和步骤,经过数据库的扩充和优化,最后形成的专属于汉字的识别方法(如图1)。
基于深度学习理论的文字识别技术是从计算机的深度学习理论出发,将深度学习理论应用于文字识别,建立起的一个关于文字智能识别的系统(如图2)。
但是无论是基于 OCR的文字识别技术还是基于深度学习的文字识别技术都仅仅停留在文字(包括手写文字)的识别上,没有进一步的对于人的笔迹或文字形成方面的研究。文字比对的商业关联性低是文字比对方面研究停滞在单一识别层面的主要原因。在文字比对(笔迹检验)方面的研究少之又少,甚至呈现空白状态。
图1 OCR技术工作流程
图2 一种深度学习原理的实例
三、传统笔迹检验方法在计算机应用方面的探究
传统的笔迹检验可以根据所分析的系统大小分为宏观层面、中观层面、微观层面三个层次,即笔迹的宏观层面特征、中观层面特征和微观层面特征。在进行人工比对时,这三个方面的特征都应当着重进行比对分析,通过样本与检材之间的宏观层面、中观层面、微观层面上的共同点或差异点来给出最终结论。三方面应当共同指向“是同一人书写”或者“不是同一人书写”,而不应在某一层面上出现较大分歧。这种出于鉴定人经验性的判断,在实际判断时,不同的鉴定人之间给出的鉴定意见也不尽相同。宏观层面中观层面微观层面三个层次上的笔迹特征各有其显著特点,并且证明效力也彼此有别。
笔迹的宏观层面特征包含整体风貌特征与整体布局特征。整体风貌特征指的是书写人书写整篇文稿时,通篇的行文特点。虽然整体风貌特征也同样容易受到书写纸张和书写人主观意愿的影响,但如果书写笔迹并非伪装笔迹,一个人一段时期内的笔记整体风貌应当是较为一致的。然而实际文件检验工作中仍然需要根据单字与单字之间的关系找出全篇的整体特点。
笔迹的中观层面特征包括文字搭配比例特征、形体大小特征以及笔顺特征。文字的形体大小特征是书写人所写的单字的大小、形态以及书写字体方面的特征。每个人写的字的风格有很大差别,根据书写字体风格可以分为细长、矮胖、方正、长圆等书写风格。字体的写法特征根据社会习惯可以分为楷体、行草、草书等。单字的大小特征就是依照字的高度与宽度来分别的字的特征。单字的形体特征是最容易被改变的一种特征,每个人的书写风格各异,而且书写风格会根据书写快慢、书写持续时间甚至是书写人的主观意愿改变。因此字体特征也是一种易于伪装的笔迹特征。书写水平高或者知识水平高的人,往往可以书写出多种字体,并且书写速度的改变会极大地影响字体,比如慢速书写易接近楷体,而快速书写就形成草书等。字的大小更是一种受书写载体变化而急剧变化的形体特征,同样一个人在笔记本上书写和在A4纸上书写时,字的大小会具有很大差别,即便是刻意控制,在书写较长时间后,A4纸上形成的文字大小也会与笔记本上形成的文字大小相差较大。文字搭配比例特征是指单字中各个偏旁或组成部分之间的位置关系特征。不同的人书写时各部分位置关系不同,并且带有很强的个人特点。
文章来源:《自动化应用》 网址: http://www.zdhyyzz.cn/qikandaodu/2020/0901/644.html