第一部分 概述
第一章 主要提要和编写思路
“十二五”期间,宁波市面向国际和国内两个市场,以构建现代产业体系为目标,以提高自主创新能力为重点,以高技术和高附加值为导向,按照“市场主导、创新驱动、重点突破、引领发展”的原则,通过突破关键核心技术,实施重大产业项目,着力培育发展新材料、新能源、新装备、海洋高技术、电子信息、节能环保、生命与健康等新兴产业,推动石化、汽车及零部件、纺织服装等重点优势产业跨越式发展,抢占未来产业竞争的制高点。
针对宁波市的新兴产业和重点优势产业,如何通过对这些产业进行专利信息检索分析,明晰目前这些产业的发展趋势、技术领域的专利布局,以及产业专利的重要申请人,对宁波市今后如何发展该类产业,如何进行资金、技术和人员的配置、布局将起到重要的支撑作用。
1.1 内容提要
专利信息分析是产业研究和企业战略竞争分析中一种独特而实用的分析方法。它是一种从专利文献中采集专利信息,通过加工、整理、跟踪、研究、分析某一产业领域或企业竞争对手的专利情况,以掌握行业技术状况及发展趋势、企业的技术布局和技术水平等信息的竞争情报分析,有助于行业或企业制定专利战略、增强竞争力。专利信息分析的基础环节是专利信息数据的检索,如果能准确全面地检索出待分析的专利数据,专利分析也就具备了成功的基石。但对于一般研发人员和专利分析人员来说,检索数据所用的检索表达式的构建是一件相当专业且烦琐的工作,要做到专利数据的检准和检全难度很大。
本书是基于如何快速准确地查找到需要的专利文献这一目标而编写的。编者选取宁波市在经济发展过程中重点关注的新兴产业和重点优势产业,对每个产业的细分技术领域进行分类,并分别将每个技术领域的IPC分类号、德温特手工代码、中英文关键词和重要申请人等检索要素罗列呈现,同时通过合理的搭配选编部分产业细分技术领域的专利检索表达式作为范例,为读者获取准全兼顾的专利数据提供参考和借鉴。
本书涉及的宁波市新兴产业和重点优势产业,分别是:新材料产业,包括钕铁硼稀土永磁产业、化学纤维产业、工程塑料产业、超导材料产业;新能源产业,包括风力发电产业、太阳能光伏产业、锂电池产业,以及潮汐能产业、生物质能产业和核能产业;新装备类产业,包括数控设备产业、环保设备产业;汽车及零部件产业;生命与健康产业,包括植物提取产业、新型治疗性疫苗产业、体外诊断产业,以及高端医疗器械产业。
1.2 编写思路
本书选取宁波市在经济发展过程中确定的新兴产业和重点优势产业,对每个产业的发展背景和战略意义进行综述后,根据定义对产业细分技术领域进行分类,并分别提供每个技术领域的IPC分类号、中英文关键词和重要申请人等检索要素。最后,通过合理的搭配选编部分产业细分技术领域的专利检索表达式作为范例。这些检索要素和检索表达式范例可以帮助读者在相应的专利数据库中准确快速地进行检索,查找目标专利文献。
1.2.1 细分技术领域
按照产业特性、产业链上下游或产业所覆盖的技术领域,对所选的每个产业细分到具体的技术主题,以便读者能够根据自己的研究主题有针对性地选择、参考和借鉴。
1.2.2 确定检索要素
检索要素,是指从检索项目的信息需求涉及的技术内容及相关线索中挖掘并提炼出来的可检索的基本信息,它是构成专利信息检索表达式的核心组成部分。检索要素一般包括关键词、专利分类号、申请人、申请公平号等。
1.2.2.1 确定关键词
关键词是表达专利信息技术主题内容的主要检索要素之一,它代表了一项专利所包含的技术主题或技术特征等词汇,包括其特有的物理、化学等结构特征、特定的制备或处理工艺、原料、应用领域,以及其特有的技术效果等。本书按照以下原则确定关键词。
1.根据技术分解表确定基本关键词
根据产业定义,研究分析每一个产业的技术分类和组成,制作相应的技术分解表,根据表中对应的技术分支名称,选择基本关键词。然后从综述性科技文献、技术词典、网络上挖掘出更多的关键词进行适当补充和扩展,以保证检索结果的查全率。同时适当请教技术专家、企业专利技术人员,获取他们的惯用术语作为关键词的补充。
2.根据数据库字段的标引特点确定关键词
在不同的数据库中,对同一技术特征的关键词表达可能存在差别,或者不同的关键词表达了同一技术特征。本书根据拟检索的数据库的标引特点进行关键词选取或表达。
3.根据行业协议、标准等确定关键词
深入分析技术主题及各技术分支的技术特征,搜集与这些技术特征相关的标准或协议,选择行业标准或者协议中所使用的术语作为关键词。
按照上述原则确定的关键词包括同义词、近义词、缩略词、音形相近词、上下位概念词,以及其他相关概念词,这样可以基本保证关键词概念上的完整性。
1.2.2.2 确定专利分类号
分类号是代表技术主题所对应的专利分类类别,它也是表达专利信息技术主题内容的检索要素之一。除国际专利分类号(IPC)外,一些国家和地区的专利机构也建立了其自身的专利分类系统,如欧洲专利局的ECLA分类系统、日本特许厅的FI/F-Term分类系统、美国专利商标局的USPC/UCLA分类系统,以及德温特数据库的德温特分类代码(DC)、手工代码(MC)等。2013年1月,欧洲专利局和美国专利商标局还共同启用了一个新的专利分类系统——CPC合作分类体系。
根据选用的数据库和编者的检索实践,本书选用了(IPC)和(MC)两类分类号,并按照以下方式确定分类号:
1. IPC分类号的初定
首先确定初步分类号,然后通过上述确定的关键词,在目标数据库中进行初步检索,找到若干篇文献,根据检索结果,进行统计排序,得到一些另外的IPC分类号,加入这些IPC分类号再次进行检索,并分析检索结果,完善分类号。这样经过不断反复的多次验证,再通过在分类表中进行上下级浏览和彼此交叉指引获取准确的分类位置,认确定最终的IPC分类号,考虑到IPC分类号与技术主题的对应性,该IPC分类号可能以大组、小组或区间的形式给出。
2. IPC的调整和补充
用编制的范例检索表达式进行检索,根据检索结果的全面性与准确性实时调整和补充分类号,充分考虑并分析噪声因素,从而对分类号进行合理增减。
3.获得MC分类号
根据已经得出的IPC分类号,结合在innovation专利分析系统中所得到的初步的检索结果,统计出与该技术主体最为接近、出现频次最高的MC,以方便读者能更好地利用MC对该技术主题进行专利检索。
1.2.2.3 确定申请人
申请人也是表达专利信息的的检索要素之一,其既可以是自然人也可以是法人。本书通过编制相应产业技术领域的专利检索表达式获取检索结果,按统计分析排序,确定该技术主题下专利申请数排名前20位的国内申请人和国外申请人。读者可以较为直观地看出该技术主题下实力较强的专利申请人,为读者进一步研究了解竞争对手或合作伙伴提供参考。
1.2.3 编制检索表达式
专利信息检索表达式,是指计算机检索中表达用户检索提问的逻辑表达式,通常它是由检索要素和各种布尔逻辑算符、位置算符以及系统规定的其他连接组配符号组成的。检索式中所涉及的检索要素包括关键词、分类号、发明名称、申请人、专利申请(公开)号、公开日等。
鉴于每个数据库的索引体系和检索使用词规则各不相同,因此同样的技术主题检索时采用的检索表达式也略有区别。因此,本书在编写检索表达式时,根据编者使用实践,分别编写了国家知识产权局专利检索系统的国内和国外专利检索表达式、ProQuest Dialog信息集团的innography专利检索分析系统和Thomson Reuters公司的innovation专利检索系统的专利检索表达式。
需要注意的是,因为每个人的思维不一样,对主题的理解结果也不一样,因此对于同一领域的检索课题,不同人构建的检索表达式可能不尽相同。本书每章节提供的检索表达式范例仅供参考,读者亦可根据自身所带的课题要求及研究范围,通过以上所提供的检索要素制定出更为符合自身需求的检索表达式,从而获得更全更准的专利数据,为该技术领域的进一步研究和分析打下坚实的基础。