Citespace(十二)---CiteSpace阈值设置杂谈

CiteSpace在单个时间分区按阈值控制网络节点数量,满足阈值条件的引文才被可视化,有Top NTopN%、 ThresholdInterpolation、SelectCiters4种设定方式。

(1)Top N选取被引次数最高的N个引文;
(2)TopN%先按被引次数排序再按 百分比(N%)选取引文,这两种方式各时间分区的阈值完全相同。
(3)阈值插值(Threshold Interpolation)从被引频次 c(citation)、两篇文献的共被引频次cccocitation)和共被引系数ccvcosinecoefficient)三个层次设置阈值,其中ccv 计算公式为,其中cc(i,j)是文献i和文献j的共被引次数,c(i)c(j)是各自的被引次数,例如在某个时间分区里,文献i和文 献j共被引2次,文献i被引4次,文献j被引3次,则ccv=2/sqrt(4×3)0.577。它在整个时间跨度的第一个、中间一个、最后一个时间分区分别设定阈值锚点,其余时间分区的阈值利用线性插值算法来计算,实现了不同时间分区阈值的个性
化。
(4)选择施引文献(Select Citers)先根据引文记录中的TC字段值筛选施引文献,然后需再用Top NTopN%
ThresholdInterpolation中其中一种方法作为阈值筛选施引文献中的参考文献。
 
        阈值调谐可依据 Citespace 软件界面左下角 (Space Status Process Reports )数据处理报告的选中的引文数量、节点数和连接数量进行调整,确定合理的阈值需要 进行反复的试算和比较。软件界面左侧Space Status 文本框中 space 栏对应数值为该时间分区内引文的有效参考文献数 目,题录字段缺失及重复的参考文献不计入,nodes 指满足阈值条件的参考文献数目。 Process Reports Records within the chosen range的值指有效的引文数量,缺少参考文献的引文不记数。
发布了237 篇原创文章 · 获赞 28 · 访问量 5万+

猜你喜欢

转载自blog.csdn.net/qq_42198024/article/details/105628432