S系统数值范围检索剖析
马志勇
摘要:数值范围检索是专利检索中的难点之一,S系统的数据标引方式及专门为数值范围检索提供的数值范围检索算符,使得对数值范围进行有效和快捷检索成为可能。本文对单一数值范围和具有关联关系的多数值范围两类典型数值范围,如何在S系统运用数值范围算符检索进行了对比和剖析,给出了相应的具体检索方法和步骤,并分别给出典型案例进行示例。
关键词:S系统 数值算符 数值范围检索 邻近算符
引言
在材料、组分、工艺等领域的实际检索过程中,经常会涉及数值范围的检索,这也是检索时的难点所在。目前,S系统提供的数据标引方式及专门为数值范围检索提供的数值范围检索算符,使得对数值范围进行有效和快捷检索成为可能。S系统目前适用于数值范围检索的算符、命令和标引主要有:①数值范围检索算符“-”,可直接对某一数值范围进行检索,如检索数值范围70~90之间的任一数值,其表达式为“70-90”。②利用截词符对数值范围进行表达。S系统对数值进行了全面标引,因而可利用截词符“+”、“#”和“?”实现数值范围检索。③利用频率算符来构建检索要素的权重关系。④利用S系统对特殊字符的标引如单位、特殊符号来配合数值范围检索。下面对单一数值范围和具有关联关系的多数值范围两类典型数值范围检索进行介绍。
一、单一数值范围检索
针对某一特定参数如温度、电流密度、粗糙度、压力、厚度等的单一数值范围检索,目前主要存在的问题为:如何合理构建检索式,从而有效地降低噪声,并对需要的数值范围准确地进行检索。检索式的构建涉及数值范围如何表达、数值范围与参数单位的位置关系表达等。单一数值范围检索可具体通过直接数值范围检索法和间接检索法两条途径进行,下面进行具体介绍。
1.直接检索法
直接检索法,就是利用数值范围检索算符或截词符对数值范围进行直接表达,然后采用邻近算符W/D限定数值范围与单位之间的关系。用邻近算符限定数值范围与单位之间的关系时,准确表达关系推荐用2D或2W(如2-5 2D A/dm2),其可准确表达数值(例如3)与单位(例如A/dm2)之间间隔0~2个字符的情况,如3A/dm2、3-10A/dm2、3 to(and)10A/dm2等情况;此外,上述表达式会遗漏数值与单位之间间隔更多字符的情况,如3,4,10,11A/dm2。因此若未检索到,可适当对检索式进行扩展,如3-5D。
2.间接检索法
间接检索法,是不直接对数值范围进行检索,将检索要素与数值的单位采用邻近/同在算符W/D/P/F/S进行限定检索,通过浏览来获取检索的数值范围。该方法的优点是检索更加全面(直接检索数值范围,部分数值范围不能检索到),且检索式构建更加简单;缺点是检索文献量可能较大,噪声也较大。因此算符的选择非常重要和关键。检索参数单位要注意存在多种表达方式。当未检索到结果时,应注意进行扩展。如电流密度A/dm2,还存在mA/dm2、安培每平方分米、A/m2等。
(1)检索要素选择。检索要素优先选择为检索参数针对的对象或密切相关内容。如下面案例1中检索参数为电流密度,其具体为CuSO4溶液中进行铜电镀的电流密度,因此选择CuSO4作为检索对象。由于该检索要素与检索参数在位置上可能间隔较大距离,因此在检索时选择用同在算符S/P,而尽量不要采用邻近算符W/D。例如,在下面的检索案例1中,检索要素(硫酸铜OR CuSO4)与检索参数单位(A/dm2 OR A/dm2)之间的逻辑关系分别用P、S和10D进行构建,检索到相关的文献数分别为4篇、4篇和1篇。
(2)检索要素进一步增加检索参数。检索参数与参数单位之间关系密切,在位置上具有比较固定的关系,尽量采用邻近/同在算符进行表示,邻近算符以nD为宜。其中,以电流密度和粗糙度为例,采用6D邻近算符基本上涵盖了其常用的表达方式,同在算符S更加全面。具体来说,专利文献中电流密度的具体表达方式有:电流密度为/是5A/dm2,具有5A/dm2的电流密度,a current density of 5A/dm2,current density 6 A/dm2,电流密度分别为/是5,6A/dm2,粗糙度分别达到Ra≤0.45,Ra≤0.03μm,粗糙度平均值达到6.3~12.5μm等,粗糙度Ra<0.02μm,粗糙度Ra在0.3~3.0微米。此外,专利全文由于文字OCR原因,电流密度可能还存在“电流密度”、“电流密度”等形式。
二、具有关联关系的多数值范围检索
具有关联关系的多数值范围检索的对象,与单一数值范围检索不同,同时并存多个具有数值范围的参量,且这些参量具有关联性。其中最为典型的代表为材料组分的检索,如合金组分、有机或无机混合物组分、化合物元素组成等。检索时的主要困难是检索噪声很大,结果太多而难以浏览。具体可通过使用标记符和频率算符两条途径来解决上述问题,具体如下:
1.使用标记算符提高检索准确度
在使用材料组分进行检索时,存在较多仅存在材料组分物质而没有数值配比的情况,这为检索带来了很大的噪声。例如,检索焊料组分为Sn、Ag和Cu,在检索结果中相当部分为“该材料选择Sn、Ag或Cu等”类似形式。材料组分的检索具有自身的特点,即具体特定的标示符,如重量、wt、%、mol、摩尔、体积、份等,通常与材料配比同句,可在很大程度上提高检索准确度和降低检索噪声。因而可构建如下检索式:①重量式:(重量OR质量OR WEIGHT OR wt OR % OR份)S检索组分;②摩尔式:(% OR mol OR摩尔OR份)S检索组分;③体积式:(% OR体积OR VOL OR份)S检索组分。
2.利用频率算符提高检索准确度
材料组分全文检索降低噪声的另一有效途径是使用S系统中特有的频率算符frec,其表示检索词出现的频率,如“锡/frec>3”表示锡这一检索词在检索时至少出现3次。考虑到专利全文数据库的特点,材料组分特征可能会同时出现在权利要求、说明书发明内容部分和实施例部分,因此材料具体组分出现的频率应该大于等于3。材料组分中通常具有主组分和次要组分,主组分即含量最高即基本组分的材料,如:一种焊料,其组分为锡75%~85%、银3%、铜22%~12%,其中锡为主组分。主组分相对次要组分在说明书全文中出现的概率会更高,故主组分和次要组分在检索时可区别对待,如主组分出现的频率可大于10次,可在很大程度上提高检索的精度。
三、数值范围检索的典型案例
为了更好地阐述单一数值范围和具有关联关系的多数值范围检索的方法,这里分别给出了两类数值范围综合运用检索算符和检索命令进行检索的典型示例,并对如何提高数值范围检索的效率和精度进行了对比分析。
【案例1】 单一数值范围检索
发明名称:制造超导线的方法和超导设备
检索针对的内容:一种制造超导线的方法,包括步骤:……将所述基板(1)浸入硫酸铜溶液(7)中;以及用所述硫酸铜溶液(7)作为电镀液通过电镀在所述银稳定层(4)上形成铜稳定层(5),其中在所述电镀时,要被电镀的物体表面的电流密度不大于9A/dm2。
检索过程介绍:电流密度不大于9A/dm2为申请人声称的发明点,也是与对比文件1唯一的区别技术特征。该申请发明点涉及细节技术特征——数值参数,优先在全文数据库进行检索。检索模式为直接对发明点进行检索,在族数据库(CNTXT、USTXT、EPTXT和WOTXT)中检索式1和检索式2分别检索得到70篇和12篇专利文献。检索到CN1455829A、CN1509351A、CN1158915A、CN1275176A和US2006051677A1等多篇电流密度落入申请人请求保护数值范围的现有技术文献。
检索式1:
70/DESC(硫酸铜OR CuSO4)P(A/dm2 OR A/dm2)
检索式2:
12/DESC(硫酸铜OR CuSO4)S((3-8 OR 3 OR 3.+ OR 8 OR 8.+)2D(A/dm2 OR A/dm2))
案例启示:
检索式1采用了同段算符P,检索式2根据检索式中各检索要素之间的逻辑关系,综合运用了表述不同层次逻辑关系的同句算符S、邻近算符2D和数值范围检索算符-,均在不同程度上提高了数值范围检索的精度。与采用AND算符的对比式相比,检索式1和2的检索结果由280多篇减少为70篇和12篇,检索效率大大提高。
【案例2】 具有关联关系的多数值范围检索
发明名称:无铅二极管
检索针对的内容:一种无铅二极管,其特征在于:所述二极管用焊片为无铅焊片,其组分为:锡75%~85%、银3%、铜22%~12%。
检索过程介绍:在S系统中将SIPOABS、DWPI和CPEA英文文摘库建立族数据库进行检索,其中铜含量为本申请发明的关键所在,具体对铜含量采用标示符进行检索,采用检索式1检索到一篇X文献US6767411B2。具体检索式如下:
检索式1:
51(sn OR tin)AND(ag or silver)AND((cu or copper)S(12-22 OR 12.+ OR 22.+)S%)AND SOLDER?AND((LEAD OR PB)1W FREE+)
对比式1(使用数值范围检索算符):
209(sn OR tin)AND(ag or silver)AND(cu or copper)AND(12-22 OR 12.+ OR 22.+)AND % AND SOLDER?AND(LEAD OR PB)AND FREE+
对比式2(不使用数值范围检索算符):
925(sn OR tin)AND(ag or silver)AND(cu or copper)AND SOLDER?AND(LEAD OR PB)AND FREE+
案例启示:
在本案中,焊片的组分较少,仅有三种组分,且这三种组分为焊片通常使用的组分,本案发明点仅在于铜的含量。在实际数值范围检索中,组分越少、组分越普通的多组分含量检索起来更加困难,检索的噪声更大。如对比式2所示,若不采用数值范围检索算符,在上述三个英文文摘数据库检索的结果就有925项,根本无法进行正常浏览。检索式1根据检索式中各检索要素之间的逻辑关系,连续运用同句算符表达了铜含量和单位之间的较为精确的逻辑关系,运用邻近算符1W表示了无铅与焊片之间的逻辑关系,降低了检索噪声,检索结果降低为便于浏览的51篇。对比文件2与检索式1相比,检索要素相同,区别仅在于未考虑检索要素之间的逻辑关系表达,检索结果为浏览量相当大的209篇。由此可见,在多数值范围检索中,采用不同的检索算符对检索要素之间的逻辑关系进行合理表达,对提高数值范围检索的精度和效率具有较好的检索效果。
四、结语
本文对在S系统中如何运用数值范围检索算符对两类典型数值范围检索进行了对比和剖析,在此基础上给出了具体的检索方式和步骤,并采用典型案例进行示例。本文对审查员更好地使用S系统进行数值范围检索具有一定的指导和借鉴意义。
参考文献
[1]国家知识产权局专利审查协作中心.利用搜索引擎检索现有技术[M].北京:知识产权出版社,2011:86.
[2]田力普.发明专利审查基础教程检索分册[M].北京:知识产权出版社,2012:416-427.