以干眼症为例对五种文献计量工具(citespace,Vosviewer,SATI等)进行研究分析.

以干眼症为例对五种文献计量工具进行研究分析.
这六种工具为,citespace ,Vosviewer,Histcite,文献计量在线分析平台:https://bibliometric.com/ , SATI
1:cite space
书目耦合(作者 期刊 文献), 合作(作者 国家 机构), 共引(作者 文献 期刊),共词分析,timeline视图,timezone视图等
下面选取文献共现分析来研究干眼症的研究热点和研究趋势.以作者和机构,国家合作网络来研究发文量较高的作者和机构以及科研小团体.

方法:检索CNKI中已发表的干眼症相关的文献(日期:1979年1月1日至2019年12月31日)。该研究运用科学计量学工具CiteSpace5.5R2绘制知识图谱,并进行文献关键词共现分析和聚类分析和timeline视图。结果:关键词共现聚类网络由500个节 点,1062条线组成,被分成37个聚类。
关键词:KY=’干眼症’+’白涩病’+’神水将枯’+’角膜干燥症’+’结膜干燥症’.
工具:CiteSpace5.5R2
资料与方法:1. 数据 本文数据来源于中国知网(CNKI)期刊中文数据库。日期:1978年1月1日至2019年12月31日。检索文献的关键词部分包括以下词语:(KY=’干眼症’+’白涩病’+’神水将枯’+’角膜干燥症’+’结膜干燥症’.)。去掉会议和报纸,检索得到相关文献3584篇。从CNKI导出并经过去重和排除,对文献进行筛选后将数据到本地.方法 运用CiteSpace5.5R软件,以“Keyword”作为文献节点,对所纳入的3580篇文献进行文献关键词共现分析及聚类分析,绘制干眼症知识图谱。关键词共现分析主题、关键词的共现分析,节点大小反映的是主题、关键词或者领域的频次。
选项如下,包括:
(a)the time interval of analysis(1978- 2019);
(b)the unit of analysis(1 years);
(c)top N per slice(100);
(d)pruning(MST);结果:Network:N=500, E=1062 density=0.0085 网络节点数量 网络连线数量 网络节点密度Pruning:MST 表示MST剪枝
Modularity:表示网络的模块值,值越大越可信(Q=0.5287>0.3表示可信)
Mean Silhouette 衡量网络同质性的指标,越接近1,网络同质性越好
在这里插入图片描述

  1. 关键词共现分析 文献的关键词反映了一篇文献其核心内容及重要信息,它可以不是出现频次最高的词汇,但一定是 对该文献内容的高度概括和凝练.因此对文章的关键词进行分析,往往被用来探寻和确定一个研究领域的热点问题。本研究排除”干眼症”和“干眼病”,’”干眼”,眼镜等常规关键词,并将一些同意但不同表达的关键词进行人工合并,使统计更清晰规范,例如中西医结合与中西医结合治疗,护理和护理干预,临床疗效和临床效果,眼药水和滴眼液等合并。获得最高频关键词如表1所示。
    1-干眼症文献分析关键词前30
    在这里插入图片描述
    对上述关键词做统计可见,干眼症研究关注的主要分为
    1):干眼症及其并发症:白内障130,青光眼42,糖尿病41.
    2):采取治疗措施:人工泪液175,普拉洛芬92,眼药水74,白内障超声乳化术53,准分子激光原位角膜磨镶术48,睑板腺按摩40,玻璃酸钠133,疗效85,中西医结合疗法38,聚乙二醇滴眼液34,中药30,普拉洛芬滴眼液27,杞菊地黄丸27.
    3):病因,病机:泪膜99,视疲劳47,泪液分泌69,隐形眼镜37;
    4):临床活动指标:维生素29,泪膜破裂时间74.
    结合上述重要关键词分析可见
    1):干眼症病症出现时,还可能出现其他并发症状如糖尿病,青光眼,白内障。
    2):干眼症出现的原因有多种,譬如泪膜,泪液分泌情况,视疲劳,隐形眼镜等都会造成干眼症。.其中泪液分泌不足 是最常见的干眼角度原因;先天性无泪腺、老年性泪腺功能降低或是一些自身免疫性疾病造成泪腺发炎、外伤、感染、自律神经失调,长期戴隐形眼镜者,长期点某些眼药水或服用某些药物都会造成泪液分泌不足。
    3):干眼症的疗法有多种,主要有通过人工泪液治疗,手术,中西医结合治疗,中药治疗等

1. —干眼症研究的聚类分析及基本知识结构
在这里插入图片描述
2.1 关键词共现聚类分析在“1.”项关键词共现网络基础上,进行聚类分析得到干眼症关键词共现聚类图谱。聚类分析是通过一定的方法将没有分类信息的数据按相似程度归类的过程,以此来了解该领域的基本知识结构。国内干眼病文献关键词共现网络共形成37个聚类,标识了该研究领域的知识基础结构及其动态演进的过程。将聚类抽象凝练后得到以下四个聚类
在这里插入图片描述
“轮廓列”表示聚类的同质性。轮廓值的分数越高,则该聚类成员间的一致性越高,这提供了有相似大小聚类间的可比性。由此可见这几个聚类成员间一致性都比较高。一个聚类的平均引用年表示该聚类的文章是由近期还是发表年代较久远的文献组成的。聚类#0,#3,#1可以归纳为干眼症的治疗措施,#2是干眼症及其并发症。结合以上两个图,引文关键词多集中在2008到2013年之间。
2.2 时间线视图
图2为以引文发表年份为X轴、聚类编号为Y轴而布局得到的干眼症时间线视图。可清晰得到各个聚类中文献情况,聚类中文献越多,代表所得到的聚类领域越重要。可见聚类#0~#3中文献都较多,说明这些聚类领域很重要。时间线视图可展现各聚类发展演变的时间跨度和研究进度。聚类#0所代表的领域,时间跨度从1983至今。可以说,几组聚类,就概况了干眼症引起的并发症、疗法、发病机理,也代表了研究热点的发展情况和结构变化情况。
图2-timeline视图
在这里插入图片描述

  1. 突现突现(burst),测度的是含关键词文献被引频次的变化率,在短时间内被广泛关注,往往成为之后的研究热点,从而引导学科发展。如下图3
    图3-突现
    在这里插入图片描述
    由图“泪膜”,“泪液”突现率最高,从1981年激增,由表3可以清晰见到研究热点的转移,由1992年起始的“干眼症”到1996年的”泪膜” ,1999年”角膜上皮”等到2009起始的“角膜染色体”,可见研究由相对较宽泛领域一步步细化具体。

讨论1,研究热点关键词的使用反映了相关领域的研究热点和发展趋势;引用突现为追踪研究热点的演变提供有效途径。我们结合两者共同分析,以揭示干眼症领域的研究热点。统计表明,现阶段研究热点可概括为几个方面:干眼症引起的并发症、疗法、发病机理。
1):干眼症及其并发症:白内障,青光眼,糖尿病
2):采取治疗措施:人工泪液 ,普拉洛芬 ,眼药水 ,白内障超声乳化术 ,准分子激光原位角膜磨镶术 ,睑板腺按摩 ,玻璃酸钠 ,疗效 ,中西医结合疗法 ,聚乙二醇滴眼液 ,中药 ,普拉洛芬滴眼液 ,杞菊地黄丸 .
3):病因,病机:泪膜 ,视疲劳 ,泪液分泌 ,隐形眼镜 ;

2,研究前沿及趋势在干眼症关键词聚类分析中,#0干眼症患者人工泪液治疗前、后对比敏感度的对比研究和#1中西医结合治疗干眼症的临床观察,#3生脉注射液和丹参注射液联合治疗干眼症的临床研究,几个聚类主要是关于干眼症的治疗措施,#2不同程度糖尿病视网膜病变干眼症患者波前像差的研究 为干眼症及其并发症,可推断干眼症的治疗方法和干眼症的并发症将成为干眼症领域的新兴趋势。与干眼症的研究热点大体相似.干眼症作者合作网络研究:
在这里插入图片描述
在这里插入图片描述
由图可见高产作者,其中发文量排前6名的作者是,彭清华,邵毅,姚小磊,吴权龙,叶蕃,姜楠。自动聚类后生成的数据,可以看出张宝凤,魏学仿的程度最高。
在这里插入图片描述
在知网高级检索输入关键词为干眼症,作者为张宝凤,可以得到
在这里插入图片描述
可以看出张宝凤和魏学仿之间合作非常密切。表中作者均与其他作者有过有合作。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
由上图可见,发文量靠前的机构有南京中医药大学,南昌第一附属医院,甘肃中医药大学,辽宁中医药大学,湖南中医药第一附属医院等,可见各大中医药院校为干眼症的研究做出;了很大贡献。
在这里插入图片描述
在这里插入图片描述
由以上图得出有一部分来自美国作者,且其突现率较高,表明在该领域国外发文越来越多.但大部分都来自于中国,因为中国的干眼症发病率高达45%,远高于欧美国家.且近年来随着电子产品的增多,干眼病的发病率还在增加.
在这里插入图片描述
在这里插入图片描述
总结:研究热点是干眼症引起的并发症、疗法、发病机理的研究。研究 前沿是:①干眼症引起的并发症.;②干眼症疗法

2:HistciteHistCite是由加菲尔德博士和其科研团队于2007年研发出的一种引文编年化可视软件。与其他软件相比,HistCite能够识别所研究领域内的关键文献,重现研究领域的历史及发展情况,分析下载文献中的作品数量和引用比率 ,指导科研工作者从众多的科学献资料中找出所研究领域的历史轨迹、发展规律和未来趋势.本文以干眼症为例对Histcite功能进行研究分析.
1 数据来源及研究方法
1.1 数据来源WOS数据库是由美国科技信息所推出的引文索引数据库,是全球最大、覆盖学科最多的综合性学术信息资源,支持自然科学、社会科学、艺术与人文学科的文献检索,数据来源于期刊、图书、专利、会议录、网络资源(包括免费开放资源)等,是国际公认进行科学统计和科学评价的主要检索工具。由于Histcite只支持WOS数据库,本文以WOS为数据源,因文献量较大,将检索式设 为TS=(Dry eye OR white astringency OR magic water will dry OR keratoxerosis OR conjunctival xerosis)索引=SCI-EXPANDED 时间跨度=1979-2019共获得1251篇文献记录。利用HistCite软件找到该研究领域被遗漏文章,并且将他加到分析库之中.
1.2 研究方法 HistCite进行文献引用分析的主要指标有 :发文量;本地被引频次(Local Citation Score,LCS)是这篇文章在当前数据集中被引用的次数,也可以理解为这篇文章在其所属的研究领域内的被引频次;被引频次(Global Citation Score,GCS)是这篇文章被整个WOS数据库中所有文献引用的次数;本地总被引频次(Total Local Citation Score,TLCS)是在当前数据集中文献的被引频次之和;总被引频次(Total GlobalCitation Score,TGCS)是在WOS数据库中所有文献被引频次之和。一篇文章的 LCS 越高,代表它的影响力越高,GCS 高则表示这篇文章被世界许多专家学者所关注。当一篇文章的GCS高而LCS低,则表示这种关注并不是来自本领域的专家学者,也间接说明这篇文章的参考意义不大

1) :时间分析文献出版时间分析下图为干眼病的研究时间分布图。从文献数量来分析,进入21世纪后,随着信息技术的不断进步,越来越多的科学家和医学工作者开始认识到移动医疗在疾病管理中的优势,相关的研究越来越多,从文献的TLCS来分析,2000年之前发表的文献TLCS几乎都较低,说明2000年之前干眼症研究还不是很深入,TLCS在2000年开始逐年增长,且发文量也逐年增涨.
在这里插入图片描述

  1. 作者分析作者在某领域内论文的LCS能够在某种程度上反映其对所研究领域的影响程度。结合发文量和TLCS两项指标,可以确定干眼病研究领域的重要作者由下图可知排名第一的Tsubota K和排名第二的pflugfelder SC要远超后面的作者,可见其二人为干眼症的领域做出了突出贡献,研究者可以关注这两人的动态.
    在这里插入图片描述
  2. 机构分析**
    由下图可以看出哈弗大学医学院,庆应义,大学医学院,东京牙科大学眼科,迈阿密大学医学院TLCS的指数较高,说明这几个机构对干眼症的研究方面的影响较大.
    在这里插入图片描述
  3. 引文编年图
    在这里插入图片描述
    HistCite的Grahps Maker功能,可以根据载入文献的出版年份、被引用频次、引用关系进行引文编年图的绘制,将该领域的发展历史清晰地展示出来。本文研究依据LCS对文献进行排序,设置阈值为30,表示选取LCS排名前30的文献,结果上图所示。图中一个圆圈表示一篇文献,圆内数字表示该文献在文献集合中的唯一序号。文献被引频次多少可以通过圆圈的大小表示,圆圈越大,被引频次越多。不同圆圈间的箭头,表示文献间的引用关系,箭头指向文献为引用的文献。

3:文献计量工具在线分析平台https://bibliometric.com/
资料来源:由于该工具数据来源只能是SCI,于是去选取wos的SCI文献,将检索式设 为TS=(Dry eye OR white astringency OR magic water will dry OR keratoxerosis OR conjunctival xerosis)索引=SCI-EXPANDED 时间跨度=1979-2019检索得到12501篇文章,由于文献太多,选取前2000篇对该工具进行研究.
在这里插入图片描述

  1. :文献总量分析2) 由下图可以分析每年文献总量随时间变化的情况,可以看出2019年发文量少于2018年
    在这里插入图片描述
    在这里插入图片描述
    上图表明的每一年不同国家之间的文献总量情况图中美国,中国在2019年发文量最多. 1) :合作关系分析下图可以看出各个国家之间的合作情况.可以看出图中美国与其他国家的合作最多.
    在这里插入图片描述
    4;影响力:由下图可以看出在干眼症领域影响力排前10的机构,期刊.作者.
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    5关键词图中可以看出干眼症的一些关键词及其分布情况.
    在这里插入图片描述
  2. :作者合作关系由图可以看出各个作者之间的合作关系,当箭头点击在该节点上面时候回显示该节点信息,但是该图的连线太过于密集复杂,没有剪枝,所以用citesapce分析作者合作关系更好.
    在这里插入图片描述
    4:Vosviewer
    数据来源:由于Vosviewer支持WOS数据库,直接用之前导出的wos文件打开Vosviewer软件后,点击create,
    步骤:
    在这里插入图片描述在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    本文以干眼症为例,进行了共词分析.合作关系图(国家,机构,作者)分析,共引分析等每一个网络分析,有三种不同的呈现方式,网络视图,叠加视图,密度视图.如下.叠加可视化和网络可视化差别不大,只是他的颜色代表的是期刊的影响因子.而密度可视化分为两种,分别为项目密度和距离密度.项目密度图表明项目越多,关系越密切,则颜色越趋近于红色,反之为蓝色.而距离密度图的颜色是按照其分布来的,区域的颜色是根据节点相之间的关系与节点数量.
    表1:密度视图在这里插入图片描述

表 2 叠加视图
在这里插入图片描述
表 3 网络视图
在这里插入图片描述
共词分析:
在这里插入图片描述
表 4 引文分析图:
在这里插入图片描述
在这里插入图片描述
上图为被引文献分析网络图,从图中可以看出一些被引次数较高的一些文献,从中可以找出该领域的重要文献.
.表 5 国家耦合
在这里插入图片描述
在这里插入图片描述
表 6 作者耦合
在这里插入图片描述
在这里插入图片描述
上两幅图为国家耦合分析,美国的发文数量最多,中国和日本分别位居第二和第三名.从图中也可以看出各个国家之间的合作情况.其中美国与其他国家的合作最为广泛.作者,机构耦合网络等分析方法和国家耦合分析方法一样,可以得出该导出的文献之中发文量最多的机构以及各个机构之间的合作情况.
在这里插入图片描述
在这里插入图片描述
以上两幅图是关键词聚类分析图.可以得出10个聚类,也可以找出排名靠前的一些关键词,进行研究分析,笔者认为如果是做关键词的聚类分析,citesapce更加适合一些.
5:SATI(链接http://sati.liuqiyuan.com)
背景通过统计和分析期刊数据以挖掘出实用的模式和隐藏的信息,已成为识别学科热点或探索学科前沿的重要方法之一,而全文期刊数据库所收录的电子期刊文献自然成为数据源的首选。题录作为描述文献外部特征的重要条目集合,利用适当的信息抽取技术和定量分析方法,即可以题录为媒介,深入发掘和呈现出美妙的数据统计分析结果。对信息技术的掌握可使得我们编写出控制台程序或者窗体软件,以往需要进行大量手工分析运算的工作如今可以迅速直接的从数据本身得出结论。目前针对题录信息统计分析而开发的软件以国外较多,其数据源大都为国外数据库(WOS)导出文件,并且多为大型、复杂软件难以操作,为提供一个专门分析国内期刊论文题录信息,同时拥有分析WOS题录数据功能的小巧精准工具,以抽取指定字段信息、统计条目出现频率、构建知识单元共现矩阵,
该工具分为两个版本,一个是在线,另外一个是桌面版本
在这里插入图片描述
表 7 SATI功能介绍
在这里插入图片描述
数据来源:CNKI导出,KY=’干眼症’+’白涩病’+’神水将枯’+’角膜干燥症’+’结膜干燥症’.得到3098篇文章,选择Endnote格式导出.将数据输入到SATI工具,得到如下结果.
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
表 8 频次分析,
在这里插入图片描述
可将结果以tsv的格式导出,用Excel打开进行分析.由图可见其分析图与citespace的分析结果差不多.
在这里插入图片描述
由图轻易得知,随着时间的增长,对干眼症的研究越来越多,从图中也可以看出每一年干眼症各个关键词研究的分布情况(鼠标点击该年会显示各个关键词分布情况)此外,该工具还可以用来分析各种时序图,如下.
在这里插入图片描述
下面进行知识图谱的构建图 1 机构 图谱从下面几幅图可以看出各个机构,作者,关键词之间的联系,以及各个机构.作者,关键词的分布情况,圆圈越大表示占比越大.
在这里插入图片描述
图 2 作者图谱
在这里插入图片描述
图 3 关键词:
在这里插入图片描述
重要的是该工具分析出来的知识图谱还还可以导出为各种不同的格式,然后倒入到其他的的可视化工具中进行分析.
在这里插入图片描述
下面的各种聚类图谱的分析(聚类分析是把一组数据按照相似性和差异性分为几个类别,其目的是使得属于同一类别的数据间的相似性尽可能大,不同类别中的数据间的相似性尽可能小。)
图 4 机构聚类
在这里插入图片描述
图 5 作者合作
在这里插入图片描述
图 6 关键词聚类
在这里插入图片描述
小结:Vosviewer和Citespace都可以进行作者(偶联)、机构(偶联)、文献共被引和期刊共被引等方面的分析。通过以上分析可以看出,Vosviewer和Citespace分析结果存在一定的差异,且Vosviewer分析结果更接近于WOS数据。造成这种现象的原因,除了跟软件算法、字段拼写形式有关外,跟分析阈值也很有关系。在分析的过程中,需要反复测试,找出合适的阈值,只有这样,才能得到理想的结果。当然,分析结果不是可视化软件选择的唯一依据,Citespace和Vosviewer的其他功能也可用作参考,如:Citespace的时区视图展示了科学研究的全景及演化进程,突变检测用于发现科学研究的前沿;Vosviewer的叠加视图以颜色冷暖表示各个Cluster的重要性高低,以密度视图表示科学研究的重点与热点等。文献计量平台简单易用,但是功能不多,且对于分析合作关系的话,数据加载缓慢图过于密集,不是很适合用来分析.Histcite可以用来锁定该领域的重要文献和技术大牛,引文编年图将该领域的发展历史清晰地展示出来。SATI功能比较齐全且软件使用起来很容易,且可以转化数据格式放到其他软件里面使用,当然citesapce也可以导出其他文件格式.但是在引文分析这块分析不出来图表,所以用Vosviewer分析更好.

参考文献:[1]李杰,陈超美. citespace:科技文本挖掘及可视化[M].首都经济贸易大学出版社,2016.
[2]胡志刚 .2017-04-06…陈超美教授又一力作,你要的 CiteSpace 应用的完美范文来了.[2020-01-22].(http://blog.sciencenet.cn/blog-43950-1043931.html)
[3] loonytes.2018-06-01.信息计量学|CiteSpace使用教程.[2020-01-22].(https://www.jianshu.com/p/49d41d0ccd7f)
[4] 胡佳卉,孟庆刚.基于CiteSpace的中药治疗2型糖尿病知识图谱分析[J].中华中医药杂志 ( 原中国医药学报 ),2017,32(9):4102-4106
[5] 王发明,朱美娟.国内区块链研究热点的文献计量分析[J].情报杂志,2017,36(12):70-73
[6] 赵磊,朱 泓,张春博.我国 MOOC研究热点及趋势的知识图谱分析[J].大连理工大学学报(社会科学版),2016,37(4):11-15
[7] 李杰. e CiteSpace 中文版 指南. . 网址[ [ EB/OL[ ][ YYYY- - MM- - DD. ].5 2015 年
[8] :四维虫子.2019-07-31.教你简单易学的文献可视化工具——文献计量在线分析平台.[2020-01-24].(https://mp.weixin.qq.com/s?src=11×tamp=1579957626&ver=2118&signature=2X17wxI5svnw-kJIu1Df4tPfDMaSyz0a8q-hDzZz9hFac4vRJRdMhXmum5kyGRCln-6kGous1lm5JRVDlSUyLYL9*gJS7ls8-w3Xn6J2a5xgGpCWpdheS5YD2gJdEFR4&new=1)
[9] :宋秀芳,迟培娟.Vosviewer与Citespace应用比较研究.情报科学,2016,34(7):108-146
[10] 刘成.21世纪以来高校共青团研究的特征.扬州大学学报(高教研究版),2019,23(6),88-93
[11] 黄思佳 ,何翀, 徐惠珍.基于Gephi的R&D投入与公司成长性的可视化研究.研究分析.DOI:10.14011/j.cnki.dzsw.2019.11.015.
[12] 余 萍,张玲玉,刘 玲,吴 静.基于HistCite的移动医疗在慢性病管理中应用的文献计量学分析.江苏科技信息Jiangsu Science & Technology Information,2018,35,9-13
[13] 李 艳,张 悦,曾 可,张士靖.文献信息分析工具的比较.中华医学图书情报杂志,2015,24(11),41-47
[14]肖 明,邱小花,黄 界,等.知识图谱工具比较研究[J].图书馆杂志,2013,32(3):61-69.
[15] 梁晓婷.知识图谱工具应用及反思性研究.应用科技,2019,22,156-158
[16] 刘启元 叶 鹰 .文献题录信息挖掘技术方法及其软件SATI的实现 ———以中外图书情报学为例[J]. 信息资源管理学报,2012,01,50-52
[17]一抹新绿的博客 .2013-05-14.SATI 国产文献题录信息统计分析工具:使用教程.[2020-01-25].(http://blog.sina.com.cn/s/blog_4ee13c2c01017rvx.html)

发布了7 篇原创文章 · 获赞 1 · 访问量 513

猜你喜欢

转载自blog.csdn.net/qq_43584513/article/details/104104957