万方专利软件特别说明

来源:互联网 发布:火爆网络女神雅典娜 编辑:程序博客网 时间:2024/06/09 16:52

WanFangData专利分析软件(单机版)使用特别说明

1 光盘安装

WanFangData专利分析软件在使用光盘安装时首先会为电脑配置软件所需要的环境和一些必要的组件。这样在安装过程中可能会出现一下情况:

这样就出现了一下两个问题。

1)   安装速度有快有慢

安装速度的快慢一方面取决于电脑的软硬件配置,如电脑的主频、内存、硬盘的转速等。

另一方面,光盘安装时,会自动为电脑配置所需要的环境和插件,例如自动检查电脑中有无安装.net framework 3.5,如果没有光盘将自动为其安装.net framework 3.5。又例如,WanFangData专利分析软件的数据库必须附加在SQL Express 2005上,光盘安装时先自动扫面电脑,若该电脑以前就已经安装过SQL Express 2005,则此时即可跳过这一步骤进行下一步安装(自动进行)

2)   安装过程出错

光盘安装过程中,由于需要向电脑中安装插件和配置环境,由于电脑所安装的操作系统的不同,安装过程中可能会出现错误提示(如果是硬盘空间不够,系统会自动提示空间不够)

如在Windows XP SP3操作系统上安装,就可能出现.net framework3.5无法安装的情况;在精简版的Windows XP SP2操作系统上安装,就会出现SQL Express 2005无法安装的情况;在Windows Server 2003 Enterprise Edition SP2操作系统上安装就会出现安装成功但无法运行的情况(如果该系统的安全级别较高,可能还会出现其它情况)

如果在Windows Vista( Home Version)安装,可能会出现安装终止的情况,这时需先关闭“用户帐户控制”,否则软件将无法安装。此外还需要保证安装完毕后“用户帐户控制”仍是“关闭”状态,否则软件运行过程将受阻。关闭“用户帐户控制”步骤如下:(1)在控制面板中打开“用户控制和家庭安全”;(2)单击打开“用户帐户”;(3)打开“打开或关闭‘用户控制’”;(4)将“使用用户帐户控制(UAC)帮助保护您的计算机”前的钩去掉,点击“确定”,系统提示重新启动,点击“立即重新启动”,重新启动过后即可安装。

因此,建议不要在Windows XP SP3Windows Server2003操作系统以及精简版的操作系统上安装,以避免出现不可预测的错误。

3)   光盘安装步骤

安装过程分为三步,包括WanFangData软件安装、WanFangData相关组件安装以及自带数据库的安装及数据初始化。

Ø    第一步:WanFangData软件安装。打开autorun图标,执行WanFangData安装程序,进入欢迎界面,点击“下一步”,进入路径选择界面,你可以选择默认路径(系统盘下),也可以自主选择安装路径,点击“确定”按钮,进入WanFangData软件安装界面。安装完成后,点击“完成”按钮,进入第二步。

Ø    第二步:WanFangData组件安装。第一步完成后,自动进入组件安装步骤。当组件安装结束后点击“确定”按钮,进入第三步。

Ø    第三步:WanFangData数据初始化。第二步完成后,自动进入数据初始化安装步骤。当数据初始化安装结束后点击“完成”按钮。

  WanFangData安装完成。

4)   成功安装的案例

机器一

硬件环境:Intel(R) Core(TM)2 Duo CPU T5550 @ 1.83GHz1.79 GHz, 2.00GB的内存

软件环境:Microsoft Windows Vista Home Basic版本,Microsoft Office 2007Microsoft SQL Server 2005.NET Framework 3.5

机器二

硬件环境:Intel(R) Celeron(R) D CPU 3.06GHz 3.07GHz504MB 的内存

软件环境:Microsoft Windows XP Professional 版本 2002Service Pack 2Microsoft Office 2003Microsoft SQL Server 2005.NET Framework 3.5

机器三

硬件环境:Intel(R) Pentium(R) Dual CPU E2160 @ 1.80GHz1.79 GHz, 1.00GB的内存

软件环境:Microsoft Windows XP Professional 版本 2002Service Pack 2Microsoft Office 2003

机器四

硬件环境:AMD Turion(tm)64×2 Mobile Technology TL-60 2.00GHz2.00GB的内存

软件环境:Microsoft Windows Vista Home BasicMicrosoft Office2007Microsoft SQL Server 2005

机器五

硬件环境:Intel(R) Pentium(R) Dual E2180 @ 2.00GHz 2.00GHz 1.99GB的内存

软件环境:Microsoft Windows XP Professional 版本 2002Service Pack 2Microsoft Office 2003

5)   建议

Ø  操作系统

l  Microsoft Windows XP Professional SP2(推荐)

l  Microsoft Windows Vista SP1(注意点如上文所述)

Ø  硬件要求:

l  最小:1.6 GHz CPU, 512 MB RAM, 1024x768 display, 5400 RPM hard disk

l  推荐:2.2 GHz or higher CPU, 1G or more RAM, 1280x1024 display, 7200 RPM or higher hard disk

l  Vista系统:2.4 GHz CPU, 768 MB RAM

此外,由于本软件自带压缩数据库,在数据解压过程中需要较大的硬盘空间,因此为保证您的安装顺利完成,如果您选择默认路径安装,建议您的计算机系统盘保留至少9-10G的空间;如果您选择安装到指定目录,建议您的计算机系统盘保留至少3-4G的空间,同时您指定安装的分区也必须保留至少7-8G的空间。

2 软件的卸载问题

如果用户确定将不再使用该软件,可以在“开始->所有程序中”找到并点击“WanFangData->Uninstall”进行卸载。用户只需按照系统提示步骤即可完成软件的全部卸载。建议不要以其他方式卸载,以防出现卸载不彻底的问题。例如,用户在“控制面板”内卸载该软件,表面上已经卸载完成,实际上数据库还残留在电脑中。DataInsight专利分析软件(单机版)验收报告出现的问题就是因为前一版本的软件卸载不完全,导致数据库未及时更新,出现的错误如下图:

1

2

现已经将安装软件重新打包,将不会出现数据库不能及时更新的问题。尽管如此,若用户不按照指定的卸载方式虽然再次安装使用时不再出先上述错误,但旧版本的数据库依然残留在电脑中,占据着较大的存储空间。因此,为了用户的利益,建议使用指定的卸载方式。

3 软件的使用

WanFangData专利分析软件由两大模块组成:多维检索和智能分析。多维检索集成了简单检索、二次检索和高级检索三部分,智能分析包含国家、企业和行业三大层次。

1)   检索模块

检索模块主要是根据用户的输入信心进行模糊匹配,返回和用户输入的字面信息相一致的专利信息的专利名称、主分类号和申请号(点击查看按钮可查看详细信息)

(1) 检索速度

评价检索质量的一个重要指标就是检索效率,而对于WanFangData专利分析软件而言,由于检索机制是基于字面匹配的,因此提高速度成了一项重要的工作。

由于1985-2007年的专利数据有215万多条,经过我们的加工整理以及大量的数据清洗工作,目前的专利数据库除少数字段以英文字符和数字的形式存储外,大量信息是以中文的形式存储在数据库中的。按照传统的做法,即将全部信息存储在结构化的数据库管理系统(SQL Server2005)中,要提高检索效率必须建立相应的索引,而SQL Server2005建立的索引对非中文字段的检索效率较高,而对于大量的中文信息检索效率很低。于是,我们引进了和SQL Server2005不同的Lucene全文检索技术。

Lucene全文检索技术,最初应用在西文字符的处理上,对中文字符的处理则的基本条件就是要求建立比较完善的主题词表。和SQL Server2005自带的全文索引技术不同的是,Lucene可以为一个中文字段中的关键词建立倒排索引而SQL Server2005只能逐字建立索引,因此SQL Server2005的索引存储量大,效率低。

如“一种计算机的显示器和服务器”,用Lucene建立的索引词只包括“计算机”、“显示器”和“服务器”,而SQL Server2005会为每个字建立索引。由此可知,Lucene全文检索技术的使用会提高检索的速度。这里需要解释一下,由于Lucene全文检索的索引库存放在文件目录中,检索时需要先将一部分数据取到内存中,因此第一次采用中文检索时会较慢(一般在30-40),而在后面的检索过程中不会出现该情况。

(2) 检索精度

由于使用了Lucene全文检索技术,检索的精度就肯定不如原先直接在SQL Server2005中的模糊匹配,例如上述的“一种计算机的显示器和服务器”,我们输入“和服”任然可以检索到,但是采用了Lucene全文检索技术后就检索不到了。

显然,上述的“和服”检索到的结果是违背用户最初意向的。这也就是软件验收人员所看到的“检索出结果比上次减少”的缘故。

此外,我们在建立Lucene全文索引时采用了一张常用的主题词表和一张去词表,去词表中罗列了一些虚词、借此、代词等无实际意义的词,这样可以减少低质量的索引。虽然里面主题词表中收录了大量人们频繁使用的词,但终究不是针对专利领域的专利名称、地名甚至是申请人和发明人建立的,因此主题词表还不完善,检索的精度难免出现一些误差。

要挺高检索的速度和精度,基础数据的整理和加工必不可少,同时建立专业的完善的主题词表也是一项长远而艰巨的任务。甚至有时候即使达到了专业的水准,但由于用户的输入信息千变万化,往往会让软件开发人员措手不及,目前除了限制用户输入信息、提示用户输入规范外,还没有更好的解决办法,如建立语义网络等。

建议用户在检索时尽量不要使用简写,如输入“上海路”而不要输入“上海”等。

(3) 导出数据

软件验收人员提出的导出数据报错的问题,其实是系统的提示。系统自动设定了一个阀值,即用户不能到处超过一万条的专利数据。这主要是考虑到两方面的原因:一是专利数据库的安全性问题,倘若不限制上限,用户即可把整个专利数据中的所有信息全部导出。二是考虑到导出数据所需要的时间,导出数据的速度和电脑的主屏、内存以及当前主机运行的程序相关,若不限制上限,用户可能会等待很长时间,甚至会出现死机的情况。

(4) 保存数据

保存数据,是将用户此次检索的所有结果保存至本机数据库,以方便分析时用到,这样能够满足用户更针对性的分析需求。为了避免保存速度过慢,这里建议用户在保存数据时尽量不要超过10万条。

2)   分析模块

分析模块是运用信息可视化技术将专利的特征统计信息以图形的形式展现出来。系统从企业、行业和国家层次设立相应的分析指标。在点击这些层次时,如果之前保存过检索的数据,这里系统会自动提示选择分析的数据源。

(1) 分析先前检索保存的数据

分析先前检索保存的数据,顾名思义,用户可以在这里针对之前保存的检索数据作进一步分析,得到更直观的信息。软件验收人员提到的错误在上文中已经予以解释,主要由于上一版本的软件卸载不完全造成的。

(2) 所有数据

所有数据库就是整个专利数据库,用户可以对1985-2007年所有收录到数据库中的专利记录进行统计分析,从而得到可视化的图形。

原创粉丝点击