情报学基础教程
1. 情报学经验规律
核心知识点:
- 布拉德福定律:描述专业论文在期刊中分布情况的经验规律的定律
- 洛特卡定律:描述作者与论文数量之间关系的经验规律
- 齐夫定律:描述文献中用词(words)与其出现频次之间关系的经验规律
- 文献增长律:描述文献信息量随着时间而不断增加的一组经验规律
- 文献老化规律:描述文献信息价值随时间推移而不断下降的一组经验规律
1.1 布拉德福定律
布拉德福定律是描述专业论文在期刊中分布情况的经验规律的定律
核心思想:如果将期刊按其刊载某准啊也论文数量的多寡以递减顺序排列,则可分出一个核心区和相继的几个区域, 当每区刊载的论文量相等时,核心期刊数和外围期刊数成:nc: n1: n2 = 1: a : a2 关系,其中a称为布拉德福常数
主要用途:
- 确定核心期刊,以指导期刊订购和期刊利用
- 核心馆藏维护、核心检索工具、
- 考察专著的分布
1.2 洛特卡定律
洛特卡定律时描述作者与论文数量之间关系的经验规律
首次揭示了作者与发表论文数量之间存在的定量规律。
- 物理学等学科领域的作者与论文之间关系基本符合平方反比律
- 生物、计算机、工程等领域则不符合平方反比关系
洛特卡定律的拓展:
- 普莱斯定律:科学家总数是杰出科学家人数的平方
- 洛特卡信息计量学
主要用途:
- 预测发表不同篇数论文的作者数量和特定学科的论文总量
- 根据特定领域作者数量估计该领域相关科学论文数量
1.3 齐夫定律
描述文献中用词(words)与其出现频次之间关系的经验规律。使用频率高的词实际价值不大,只是传递起来省力。
主要用途:
- 指导文献标引、词表编制和情报检索
- 自动标引,使用词频适中、词义强健的词作为标引词和检索词
1.4 文献增长律
描述文献信息量随着时间而不断增加的一组经验规律
相关模型如下:
- 指数曲线
- 逻辑曲线
- 勒歇尔模型
1.5 文献老化规律
描述文献信息价值随时间推移而不断下降的一组经验规律。
- 负指数老化模型
- 博顿-凯卜勒方程
举例来说,假设在 1700 年发表了一篇论文,讨论了地球是圆形的。这篇论文在当时是非常有价值的,因为它提出了一个新颖的观点,挑战了当时流行的地球是方形的观点。然而,随着时间的推移,人们逐渐认识到地球并不是圆形的,这篇论文的结论也不再准确或者可靠。这就是文献老化规律的体现,随着时间的推移,文献中的结论和价值会不断降低。
2. 情报学基础理论
核心知识点:
- 知识基础论(布鲁克斯):对客观知识进行组织和研究;知识地图
- 决策系统论(约维茨):情报是对于决策具有价值的数据资料,可以实现计算机仿真
- 科学交流论(米哈依洛夫):正式交流;非正式交流
- 规范论(卢太宏):S(研究情报源)、C(研究情报过程)、U(研究情报用户)三大规范,没有建立量化系统
- 原理论(王崇德):具有宏观参考意义
- 栈理论(严怡民):信息栈;栈交流;零栈交流
2.1 布鲁克斯的知识基础论
-
核心思想:对客观知识进行组织和研究
-
新知识是由已有知识加上新增知识构成
-
知识地图:找出人们进行创造和思考的相互影响与相互关联节点,像地图一样标识出来,真正揭示知识的有机结构
2.2 约维茨的决策系统论
-
情报是对于决策具有价值的数据资料。
-
情报学的研究对象是“广义情报系统”。
-
可以实现计算机仿真,在实证性研究方面优于布鲁克斯的“知识地图”说。
2.3 米哈依洛夫的科学交流论
-
科学交流是立论基础,人类社会中提供、传递和获取科学情报的种种过程是科学赖以存在和发展的基本机制,这些过程的总和称为科学交流。
-
科学交流分为正式交流和非正式交流
正式交流(间接交流):通过科学文献系统进行的传递交流。
优点:可检索、可核实、可引用;
缺点:滞后性。
非正式交流(直接交流):依靠人际交往、私人通信等进行的传递交流。
优点:高效、快速、简洁;
缺点:难以复核。
特色学派:
- 物理学模式:科技情报在用户间的扩散与热量在固体中的扩散类似(阿乌拉梅斯库,1973)。
- 生物学模式:情报交流类比为疾病传递(哥夫曼,1977)。
- 社会学模式:假设情报源(S)发出情报为M(S),经过情报工作者加工处理后的情报产品为M(R),当M(R)中特定情报I与用户会合后,具有知识结构K(1)的情报用户就吸收情报I,使自己的知识结构跃迁到K(2)(维克利,1987)。
2.4 卢太宏的规范论
情报科学的三个研究规范:
- S规范:面向情报源
- C规范:面向传递过程
- U规范:面向用户
优缺点:
-
优点:突出情报工作和情报学的研究重点
-
缺点:没有建立量化系统
2.5 王崇德的原理论
- 相似原理
- 耗散结构原理
- 马太效应
- 最小努力原则
- 随机过程原理
优缺点:
-
优点:具有宏观参考意义
-
缺点:体系上缺乏内在原理,结构过于松散
2.6 严怡民的栈理论
信息栈:信息从信息发送者(S)到信息接收者(R)流动过程中所经过的环节,即人或人工环节,如出版机构、传递机构。
- 零栈交流:S和R直接进行交流
- 栈交流
优缺点:
-
优点:有望学科界限展开研究
-
缺点:没有支持量化支持,只是一种模式假说
情报学是研究情报的产生、收集、管理、检索、分析和传递利用的一门科学
情报学三原则:
- 情报资源是基础
- 情报传递是关键
- 情报服务是目的
情报学有科技倾向,档案学有人文倾向,图书馆学有社科倾向
3. 情报学方法论
核心知识点:
- 2S2R模型:选题(Select)、检索(Search)、研究 (Research)、结果(Result)
- 通用方法:哲学方法、逻辑方法、数学方法
- 特色方法:引文分析法、德尔菲法、广义二重证据法
3.1 研究程式和学术规范
- 2S2R模型
界定研究问题:由研究问题形成的检索策略在任何单一数据库中检索出的文献量以10篇左右为宜。
提出研究假设:明确问题之后,为了解决问题,就需要提出各种假说、方案
选择研究方法:
- 用什么方法解决什么问题?
- 方法应与问题相适应
- 新方法需要证明
情报学属于社会科学,在情报学研究中,定量研究常用于无干扰实证,定性研究常用于干扰实证。
- 定性研究和定量研究在实际中的运用
学术规范
-
实体规范
-
形式规范
论著格式规范:标题、作者、摘要及关键词、引言、主论、结论、致谢、参考文献
引文格式规范:哈佛制、温哥华制、牛津制、芝加哥制
通用方法
哲学方法
- 系统论
- 控制论
- 信息论
逻辑方法
- 演绎法
- 归纳法
数学方法
- 数学分析法
- 严格按照逻辑演绎的符号分析方法
- 特征是用符号代表变量并寻求变量之间的关联
- 如微分方程、积分变换、矩阵分析、几何分析等
- 统计分析法
- 建立在概率论基础上
- 用部分信息推断全体(归纳推理),不一定得到正确的结论
- 概率论的作用在于充分利用所得到的信息并降低出错概率
特色方法
引文分析法
以引文统计数据为基础,对信息可计量单元之间的引用和被引用现象进行分析研究,从而揭示其数量特征和内在规律。
- 施引:引用别的文献作为参考文献
- 被引:列在参考文献中的叫被引
关键人物:加菲尔德
- ISI体系,侧重分析期刊;期刊影响因子
- CWTS体系,王冠指数CI
- ISSRU体系,采用相对测度
德尔菲法
- 是规定程序的专家调查法,具有匿名性、反馈性和统计性三大特点
是由调查组织者拟定询查表, 按照规定程序, 通过函件分别向专家组成员征询调查, 专家组成员之间通过组织者的反馈材料匿名地交流意见, 经过三轮征询和反馈, 专家的意见逐渐集中, 最后获得有统计意义的集体判断结果。
相关方法:头脑风暴法(专家会议法)
- 用会议的形式通过专家间的相互交流,激励智力碰撞,阐述思想火花,使专家的意见得到集中和精化
广义二重证据法
凡针对同一问题获得不同来源的两类证据指向同一结论,或采用两种方法得到相同结果,或实证检验与理论推演达成统一,皆可采信。(叶鹰,2017)
本质:采纳两种证据,或采用两种方法,或采用两个途径皆能获得一致结论,是发现“相对真理”的有效途径。
4.情报信息源
核心知识点:
- 一次、二次、三次文献
- 常见文献情报信息源:如图书、期刊、专利文献、学位论文等
- OA:开放存取信息资源
4.1 文献情报信息源
-
一次文献:原始文献,首次加工而形成的记载,反映作者在生产活动中的最原始的思想、数据等
-
二次文献:检索文献,按一定方法对一次文献进行加工、整理、提炼、浓缩、标引,并按其外部特征进行有序化处理后形成的文献形式。
二次文献是一次文献特征的汇集
-
三次文献:集成文献,利用二次文献,通过检索,筛选有关的一次文献,再加以分析、综合、加工编写出来的第三个层次的集大成式文献。
-
零次文献:未正式发表的原始文献或非正式出版的文献资料,如试验记录、设计草图等。
严格意义上的情报源多是一次文献。
十大文献情报信息源:
- 图书
- 期刊
- 专利文献
- 标准文献
- 科技报告
- 学位论文
- 会议文献
- 政府出版物
- 产品样本
- 档案文献
4.2 非文献情报信息源
4.2.1 电子传媒情报信息源
-
广播
-
电视
-
网络
搜索引擎
电子邮件
社交网站
4.2.2 口头情报信息源
是一种零星的情报源
-
优点:内容新颖,传递迅速
-
缺点:信息容易失真;信息保留困难;信息传播范围小
4.2.3 实物情报信息源
实物,包括自然实物和人工实物。
优点:直观性强;客观性强;实用性强;综合性信息;相对成本较低。
缺点:信息收集、传播和保管比较困难;容易引起知识产权纠纷
4.2.4 技术收集
技术收集是一种搜集、加工和处理非文字信息的过程。
- 又名为“测量与特征情报”
- 包括许多特殊情报来源:声学情报、红外情报、激光情报、核情报、光学情报和雷达情报
- 上述搜集手段都具有统一的主题:1)非文字信息搜集;2)特征的搜集;3)将一个特征与某个人、角色或物体联系起来,并识别出这个人、角色或物体的状态变化
4.2.5 开放存取信息资源
OA:开放存取
-
OA期刊:不向读者收取获取费用的的资金模式,用户利用网络可以不受限制地访问期刊论文全文。
-
OA仓储:对许多在学术活动中产生的非正式信息不能方便地加以查询利用的问题而诞生的,可分为学科范围开放的学科OA仓储和机构专属的机构OA仓储两类。
学科OA仓储:其中的文献可以是电子预印本或后印本
机构OA仓储:机构库或机构知识库,汇集了某个大学、研究机构研究人员在进行学术活动中产生的各种学术信息
5. 信息组织
核心知识点:
- 体系分类法:对文献内在特征和外表特征的概念进行逻辑分类和系统排列而构成的
- 组配分类法:在类目之间采用分面结构,将文献的内容分析为若干因素,从分面寻找相应的类号,然后将其排列组配成一个完整的分类号。
- 体系——组配分类法:又称半分面分类法,更接近于体系分类法
- 主题法:以直接表示文献主题的语词作为概念标识,按子顺序列组织,并通过参照系统揭示词间关系的标引及检索文献的方法
- 索引:记录和指引文献事项或知识单元,按一定系统组织起来的检索工具
- 常见的DC元数据
- 关联数据:采用RDF数据模型,利用URI命名数据实体,在网络上发布和部署实例数据和类数据,从而可通过HTTP揭示并获取这些数据
- 本体
- 语义网
5.1 分类组织法
5.1.1 体系分类法
体系分类法,又称等级分类法、枚举分类法,是对文献内在特征和外表特征的概念进行逻辑分类和系统排列而构成的。
核心思想:将所有类目组成一个等级式体系结构。
结构:主表、复分表(附表、辅助表)、说明和类目注释、索引
典型代表:
- 杜威十进制分类法
- 美国国会图书馆分类法
- 国际专利分类法
- 中国图书馆分类法
缺点:不能充分满足信息组织和检索的要求。
5.1.2 组配分类法
组配分类法是指在类目之间采用分面结构,将文献的内容分析为若干因素,从分面寻找相应的类号,然后将其排列组配成一个完整的分类号。
和体系分类法的区别:
- 体系分类法的分类标识是事先定义好的,固定的,不可拆分的,其中诸部分的位置不可改变。
- 组配分类法的分类标识是组合的,不固定的,可以拆分的,其中诸部分的位置是可以变换的,支持轮排,可达到按任何一个属性或特征集中文献和从多种角度检索文献的目的。
典型代表:冒号分类法
5.1.3 体系—组配分类法
体系—组配分类法,又称半分面分类法,更接近于体系分类法。
典型代表:国际十进制分类法
分类标引:赋予文献资源相应的类号而形成分类检索标识的过程
自动分类聚类:基于内容将对象自动分配给预定义的类别。可分为基于词表的自动分类和基于训练集的自动分类。
5.2 主题组织法
主题组织法是指以直接表示文献主题的语词作为概念标识,按子顺序列组织,并通过参照系统揭示词间关系的标引及检索文献的方法
-
标题法
标题法是用规范化了的语词来标引文献主题,并按字顺排列的方法。
-
单元词法
以单元词作为主题标识,通过字面组配的方式来表达文献的主题。
-
叙词法
1、叙词:从自然语言中精炼出来的,经过规范化处理的,以基本概念为基础的表达祖逖的词和词组。
2、叙词法:以受控的自然怨言词汇为标识,通过概念组配方式表达文献主题的主题法类型。
3、典型代表:《汉语主题词表》
-
关键词法
对语词基本不做规范化处理。
主题标引:对文献的主题进行分析,客观,全面,准确地提炼主题概念,在依据特定的主题语言和标引规则,将主题概念转换成标引词,赋予文献主题标识的过程。其目的是建立主题检索系统。
主要流程:
- 查重
- 选择标引方式
- 进行主题分析
- 将主题概念转换为主题词
- 做好业务记录
- 审核标引结果
自动标引:利用计算机系统给存储或检索出的文献赋予检索标识的过程。
5.3 索引文摘法
索引:记录和指引文献事项或知识单元,按一定系统组织起来的检索工具。
- 篇目索引
- 内容索引
主要流程:
- 选择题目和确定索引方法
- 文献标引和索引款目编制
- 著录
文摘:以简明扼要的文字摘述文献的主要内容和原始数据,向读者报导最新研究成果。
特点:
- 替代性
- 客观性
- 兼具报道和检索
5.4 元数据
元数据是关于数据的数据。
- 描述型元数据
- 管理型元数据
- 应用型元数据
作用:
- 描述
- 定位
- 检索
- 管理
- 评价
- 利用
DC元数据:
- 简单性
- 灵活性
- 可扩展性
- 通用性
RDF资源描述框架:
- 兼容性
- 灵活性
- 统一性
5.5 关联数据
采用RDF数据模型,利用URI命名数据实体,在网络上发布和部署实例数据和类数据,从而可通过HTTP揭示并获取这些数据。
5.6 本体和语义网
……
6. 情报检索
核心知识点:
- 情报检索
- 经典检索模型
- 文本检索技术
- 评价标准:查全率、查准率
- 情报检索系统的发展趋势
情报检索经典书籍:
- 《情报检索系统——特性、试验与评价》
- 《转折:在情境中集成信息查询与检索》
情报检索定义:
-
狭义的情报检索:“查询”或“搜索”的单一过程
-
广义的情报检索:包括情报的存储与检索两个互逆的过程,存储和检索缺一不可
情报检索系统的六大子系统:
- 文献选择子系统
- 标引子系统
- 词表子系统
- 检索子系统
- 交互子系统
- 匹配子系统
经典检索模型:
- 布尔检索模型
- 向量检索模型
- 概率检索模型
检索系统设计原则
-
高效原则
优良的排序算法
有序的分面精炼
相似结果建议
-
便利原则
基本检索
高级检索
专家检索
文档编排技术
- 顺排
- 倒排
文本标引技术
-
手动标引
-
标引深度
手工检索标引深度通常达到3(作者、分类、主题)
自动标引可达到任意标引深度
-
自动标引
文本检索技术
- 布尔检索:AND OR NOT
- 截词与通配检索:前截词,中截词和后截词
- 精确短语检索与模糊检索
- 字段检索
- 位置检索
- 大小写敏感检索
- 二次检索
检索策略设计要点
检索系统选择
- 最简途径:使用搜索引擎进行试查;对于学术信息检索则可以首先尝试使用学术搜索引擎。
- 原文直接检索途径:如所需信息非常明确,可利用出版社、学协会或包含全文的数据库直接检索
- 分领域检索途径:专业领域都有专业检索系统
- 综合检索途径:如Web of Science核心合集、Scopus、中国知网、维普、万方等综合检索系统
- 跨库检索途径:如:Web of Science平台、Google scholar和百度学术
-
逻辑检索式编制:是编制检索是指用户表达检索提问的逻辑表达式,也是计算机检索系统识别用户检索需求的桥梁。
-
反馈调整策略:情报检索都不会是一次完成的过程。
缩检策略:
-
增加检索概念
增加“AND”
-
运用一些增加准确性的检索技术
精确短语检索、字段限定检索、位置限定检索
-
进行聚类检索
分面浏览技术
扩检策略:
-
增加主题概念的相同或类似表达
受控主题词检索、检索词的缩写、全称等
-
减少检索主题
删除非核心的主题概念
-
采用族性检索
运用分类检索可以将同一类的结果都检索出来
-
减少使用限定检索
减少使用精确短语检索、字段限定检索、位置限定检索等
情报检索评价
经典情报检索评价
- 查全率
- 查准率
- 漏检率
- 误检率
- 响应时间
- 用户负担
- 显示输出
交互式情报检索评价
-
背景参数
系统类型、用户身份
-
交互参数
检索提问数量、检索时长、检索浏览行为等
-
性能参数
支持用户完成的任务数量、质量、时间消耗等
-
便利参数
系统的便利和友好体验
OpenUrl:依照规则动态生成开放链接URL,实现资源之间一对一、一对多的恰当链接,有效地解决了二次文献到一次文献资源、参考资源到原文、书目信息到原文等的动态链接问题。
元数据仓储机制:对分布异构资源的元数据进行手机和聚合,安装在本地,提供统一的检索和服务
元搜索的优势:
- 搜索范围广
- 不受数据库控制限制
- 查全率高
- 搜索范围大
- 即时性好
缺点:
- 查准率不高
- 翻译语法与各单库检索平台的检索语句之间在匹配上的差异
- 命中结果能否正确解析到跨平台检索系统显示界面的差异
- 各单库检索速度的差异而造成的检索结果输出的差异
情报检索系统发展趋势
- 跨语言检索技术
- 多媒体检索技术
- 可视化技术
- 个性化推荐技术
- 分面浏览技术
- 综合分析功能
上述检索技术的集成应用,将首先体现在搜索引擎中。
未来搜索引擎技术的发展趋势:
-
个性化
跟踪分析用户的搜索行为,利用这些信息来提高用户的搜索效率
-
智能化
一、对搜索请求的理解
二、对网页内容的分析
-
专业化
专门收录某一行业、某一主题和某一地区的信息而建立
7. 情报分析
- 情报分析的客观基础是信息和知识。
- 情报分析属于决策支持的范畴,是为决策服务的。
7.1 情报分析的原则
-
重视原始信息:高质量的原始信息至关重要
-
综合应用定性分析和定量分析
定量分析:提供数量依据,侧重于分析模型的建立和求解
定性分析:把握情报分析的目标和方向、鉴定数据、建立分析指标体系、阐述定量分析的结果和意义
-
公开数据来源和处理方法:增加分析结论的可信度
-
信度和效度相统一
信度:分析结果的可靠性
效度:分析结果的正确性
7.2 情报分析的流程
-
选题
a)提出课题:明确的目的、意义和要求
b)课题分析和论证:课题可行性论证
c)课题选定:撰写开题报告
-
方案设计
a)课题目的:说明背景和意义、主要问题、服务对象、效益
b)调研大纲:明确调研方式和范围、步骤、深度和广度等
c)研究方法和技术路线
d)预期成果形式:根据课题研究条件和用户要求基本明确成果的表现和提交形式
e)组织分工与经费预算:按照知识结构、能力、经验和特长进行具体任务的分配
f)实施时间和步骤:分阶段划分预计完成时间和实施步骤
g)其他:如完成课题研究所需软硬件设备条件等
-
信息搜集
文献调查和社会调查
a)文献调查:采用检索方法
b)社会调查:现场调查、访问调查、问卷调查和样品调查等
-
信息处理
a)信息整理:从无序到有序的组织过程
b)信息评价:可靠性、先进性、适用性……
c)信息汇总和存储:建立数据库
-
情报分析建模
如何确定一个能将现有数据很好地代入其中的、合适的分析模型,是分析过程中一个十分关键的环节
-
检验分析结果并得出结论
-
组织分析研究报告
情报分析报告的一般性结构:
a)题目
b)引言
c)正文
d)结论
e)参考文献和附录
7.3 特定领域情报分析
- 科学技术情报分析:历史最悠久、开展得最为广泛的情报分析领域,关注的对象为科学研究论文
- 技术情报分析:主要以专利信息资源为研究对象进行情报分析,始于20世纪50年代美国
科技情报分析的发展:
- 将科学文献、专利信息及其他信息资源综合起来,形成多源数据的科技情报分析。
- 如:对科学与技术之间的转化速度进行研究;为政府科研决策提供情报分析成果
社会科学情报分析:利用人文社会科学领域信息资源,专门面向人文社会科学领域开展的情报分析与服务。
- 替代性计量方法:基于社交网络来分析和描述学术成果的新计量指标
竞争情报分析:通过系统化的方法将信息转化为知识、情报和谋略的过程
竞争情报:关于竞争环境、竞争对手和竞争策略的信息和研究
竞争情报的作用:
- 认识和预警
- 优化决策
- 学习参考
SWOT分析:内部优势、内部劣势、外部机会、外部威胁
a)调查分析环境因素
b)构造SWOT矩阵
c)得出行动对策,制定行动计划
7.4 情报分析工作类型
(一)跟踪型情报分析
又称情报监测、情报跟踪、动态监测、动态跟踪,是最常用、最基本、最具时效性的情报分析报道形式。
需要注意的要点:
- 明确跟踪对象
- 做好分析加工
- 及时传递报道
方法:
-
人工跟踪情报分析
-
自动化跟踪情报分析
-
人工与自动化相结合
先发挥自动化技术的检索效率和检全率,再利用人工情报分析在检准率上的优势,由人来对情报信息做进一步的筛选。
成果和报道:
- 跟踪快报
- 跟踪分析报告
- 跟踪数据库
典型案例:《科技参考》
(二)评价型情报分析
评价型情报分析是核心情报分析工作,是针对特定主题,选择特定的研究方法,充分利用特定的分析工具,对来源于各种信息渠道的情报进行分析说明、归纳提炼、比较评测等。
方法:事实型数据+专用工具方法+专家智慧
(三)预测型情报分析
预测型情报分析是根据有关研究对象的大量已知信息,运用特定科学方法和分析工具,将研究对象的发展前景及其对国民经济和社会发展的各种可能的影响进行分析研究和预测所形成的成果。
由已知推未知的一种分析方法
方法:
- 基于时间序列外推方法:依赖历史性数据,且长期趋势分析不可靠
- 模型类方法
- 专家观点和情景分析类方法:广泛认可和应用,但成本高,耗时长,通常只适用于规模较大的国家级技术预见活动
7.5 大数据时代情报分析的发展
大数据带来的挑战:
- 给情报分析的基础理论和方法体系创新带来新挑战
- 传统的信息分析处理技术方法如何顺利转移到对大数据的管理和利用上来
- 大数据催生了新时代下科技情报工作的研究新范式
联系:
- 大数据分析于情报分析有着天然联系,可以更好地发挥情报分析的特色与优势
- 都是以数据为基础进行研究
- 大数据的价值链与传统情报工作的价值链是一致的,与情报分析的“事实型数据+专用工具方法+专家智慧”的方法论十分契合。
- 大数据能够丰富情报分析数据来源,大数据分析技术和工具可以有力地提升情报分析和处理数据的能力
- 可利用大数据分析技术和工具提升情报分析产品的质量水平,巩固情报分析的特色与优势
8.情报技术
8.1 数据库及数据仓库技术
数据管理的发展阶段
-
手工管理阶段:数据的电子处理阶段
先将程序和数据输入计算机,计算机运行结束后,将结果再输出,计算机并不直接存储数据;没有软件系统对数据进行管理,而是依靠手工进行,效率较低。
-
文件系统阶段:文件管理系统的出现
通过文件管理系统,数据可在计算机中长期保存,并且可以经由一定的存取方法来完成程序与文件中的数据之间的相互转换。存在数据冗余度大,共享性差,数据更新无法保持同步,数据和程序缺乏独立性等缺点。
-
数据库系统阶段
数据库系统建立了数据与程序之间的有机联系,实现了统一、集中、独立地管理数据,使数据的存取独立于使用数据的应用程序,实现了数据的共享。
数据模型
- 层次模型:采用树形结构
- 网状模型:没有方向性、查询可以从任意一个节点开始,也可向任意方向进行,存取效率高、性能较好,但结构复杂
- 关系模型:通过满足一定条件的二维表格来表示实体集合及数据之间联系的一种数据模型。大部分商业数据库采用此模型
- 对象模型:继承关系模型的许多优点,还能处理多媒体数据,并支持面向对象设计。
常用的数据库管理系统
- Access
- Oracle
- SQL Server
- DB2
数据仓库:面向主题的、集成的、稳定的、不同时间的数据集合。
组织结构:
- 当前细节数据层
- 历史细节数据
- 轻度综合数据
- 高度综合数据
- 元数据
联机分析处理(OALP)
8.2 数据挖掘
- 数据挖掘:从大量的数据中提取有用的信息和知识的过程
- 关联分析:在大量的数据中所隐含的项集之间的关系以及项集的频繁模式
- 分类:找出描述并区分数据类或概念的模型,一边能够使用模型预测类标记未知的对象类。
- 聚类:将数据对象分组成多个类或cluster
- 偏差检测:数据对象与数据的一般行为或模型不一致,这些数据对象就是偏差,又称孤立点。
- 时序演变分析:描述时间或对象行为岁时间变化的规律或趋势。
数据挖掘方法
- 统计分析方法
- 决策树方法
- 粗糙集方法
- 神经网络方法
- 遗传算法
文本挖掘:从大量文本数据中提取以前未知的、有用的、可理解的知识的过程
大数据:规模大到在获取、存储关联、分析等方面大大超过了传统数据库软件工具能力范围的数据集合就被称作大数据。
大数据的特征:
- 大规模
- 多样性
- 高速性
- 低价值性
大数据的精髓在于分析信息时的思维和方法的转变:从样本分析到总体分析、从精确分析到近似分析、从因果分析到相关分析。
大数据处理技术与工具:
- MapReduce
- Hadoop
8.4 情报支持技术
(一)多媒体技术中的关键技术:
- 数据压缩技术
- 多媒体交互技术
- 多媒体信息检索技术
- 大容量存储技术
(二)信息安全技术:
- 反病毒技术
- 防火墙技术
- 加密技术
- 数字水印技术
(三)其他支持技术:可视化技术、知识图示技术等
9. 用户行为与情报服务
9.1 以用户为中心
“以用户为中心”:满足用户需求为准则,以用户满意为最终目标的情报服务。
四个层次:
- 表现层:界面设计和元素的优化设计
- 结构层:信息资源的布局安排
- 内容层:服务内容的针对性
- 战略层:情报机构的服务目标和服务对象的定位
服务模式:
-
个性化服务
a)竞争情报服务:用户建模、情报资源的个性化表示、竞争情报推送
b)科技查新服务:定题情报服务和专题情报服务
c)书目推荐服务:个性化需求提供书目推荐
-
嵌入式服务
a)嵌入式参考资源服务:用户精准定位,根据特殊需求运用多样化的参考咨询服务手段
b)嵌入式科研支持服务: 推荐研究新方向、数据挖掘与支撑等
c)嵌入式知识发现服务:利用知识图谱揭示复杂现象
9.2 信息需求与行为模型
信息需求是由于人们对信息的不满足感而产生的,也是人类信息行为发生的前提。
-
方法论模型:从哲学高度去理解整个信息搜寻行为的抽象框架
-
Krikelas的信息搜寻行为模型:强调不确定性的作用,认为人们搜寻信息是因为意识到自己处于一种不确定的状态而试图将这种状态降低到可以接受的水平。
-
Bates的信息搜寻模式模型:信息需求会发生动态演进;演进式搜索准寻了“一次一点”的采莓模式。
-
Ellis的信息搜寻行为模式模型:启动;链接;浏览;辨别;追踪;抽取;验证;结束。
-
Kuhlthau的信息搜索过程模型:心智层面上的意义搜寻过程——启动、选择、探索、形成、收集、报告
-
Wilson的信息行为模型:信息搜寻行为的发生是因为信息用户感知到了信息需求,为了满足需求,用户会诉诸正式或非正式的信息源或信息服务,从而可能成功获取相关信息,也可能失败。
研究方法:
- 问卷法:优势在广度
- 访谈法:优势在深度
- 焦点小组法:重点在于参与者之间的动态交互
- 日记法:适合捕捉动态性强、容易发生变化的信息和一些不易察觉的隐性信息
- 实验法
- 内容分析法
- 元分析法
- 观察法:强调行为的过程而不是结果
9.3 现代情报服务内容体系
9.3.1 科技情报服务
科技情报服务发展历程:
- 从文献传递到信息服务
- 从信息服务到知识服务
- 从知识服务到智能服务
科技情报服务内容:
-
书目情报服务:是关于文献知识和效用信息的集合,产生于长期的书目交流工作实践,具有压缩性、二次性、知识性的特征。
-
科技查新服务:以反映查新主体内容的查新点为依据,以计算机检索为主要手段,以获取密切相关文献为检索目标,运用综合分析和对比方法,对查新项目的新颖性做出文献评价的情报咨询服务,并写出有依据、有分析、有对比、有结论的查新报告。
变化:
a)服务内容多样化
b)服务对象广泛化
c)服务模型趋于主动化
d)对服务平台功能有更高的要求
-
学科情报服务
a)学科情报定题服务模式
b)嵌入式学科情报服务模式
c)协同化的学科情报服务模式
9.3.2 竞争情报服务
主要内容:
- 环境情报
- 对手情报
- 技术情报
- 产品情报
作用表现:
- 预警作用:了解竞争对手,降低决策中的不确定性和市场活动的盲目性
- 提供决策支持:帮助企业投资、并购、经营、开发等方面做出科学合理的决策
竞争情报机构:
- 专门组织:中国科学技术情报学会竞争情报分会、湖南省竞争情报中心、麦肯锡公司等
- 竞争情报服务系统:主要包括竞争对手调研、行业分析研究、市场动态监测、经营数据监测、实时信息传递等模块
9.3.3 决策情报服务
决策情报:能够提供决策依据、满足决策者需求的情报。
主要内容:
- 态势分析服务:对搜集到的信息进行分析研究,总结有关国家及区域的重点研究对象的发展历史、现状和趋势,揭示其影响因素、发展动力等。
- 动态监测服务:搜集设计某些国家、机构或学科领域的最新动态情报,经整理之后及时、定期地提供给政府相关部门。
- 前瞻预测服务:分析现有情报来预测国家相关领域的未来发展趋势
主要情报机构:
- 政府主导的情报机构
- 学术性质的情报机构
- 兼具政府和学术性质的情报机构
- 市场化的专业咨询机构
现代情报服务的具体要求:
- 面向学术的情报机构:向以用户为中心转型
- 面向企业的竞争情报服务:注重用户服务的个性化、用户参与和用户协作
- 面向政府的决策情报服务:更需要了解服务主体——政府的需求;动态信息跟踪;建立舆情快速反映机制。
9.3.4 当代情报服务发展趋势
- 基于数据挖掘的情报服务:扩展服务范围,提高服务效率和准确性;为情报系统的建设提供有力支持,特别是数据获取和分析技术
- 基于云计算的情报服务:情报服务模式变得更为多样化,与SaaS对应的一站式个性化推送,情报参考咨询、专家顾问,与PaaS对应的情报软件开发测试平台、集成的情报知识库、情报分析与统计、情报智能采集与监测。与IaaS对应的桌面云、云存储。
- 基于大数据的情报服务:为情报服务带来更多的信息源,使信息的丰富性和可靠性大大提升。
- 情报服务的智库建设:加强机构管理,提高研究成果质量;重视人才队伍建设,尤其是专家智慧;调整情报服务机构,加强政府决策支持;加快技术创新,推动智库化转型。
10. 情报教育
情报教育分为专业教育和普及教育。
- 专业教育:由中等专业学校、高等院校和科研机构按照一定的规范和课程组织培养专业人才
- 普及教育:各类图书馆和文献情报机构开展的读者教育、高校开设相关课程以及各类机构开展的情报素养教育等
世界上第一所图书馆学院:1887, 美国, 哥伦比亚大学的图书馆经营学院
国内情报学发展问题:
现阶段情报学作为一门学科具有定位模糊性和未来发展的不确定性,缺乏一个充实的、确定的“理论内核“,研究方法有很多是借鉴、采用了其他领域的成熟方法,同时情报学研究还经常转换学科研究的主要对象,缺乏坚定的核心研究目标和稳定的研究方向。关键是要认清自身存在的内外部环境,按照满足社会对多种人才的需求去明确自身的专业定位和规范培养过程。
- 立足于图书馆学情报学
- 立足于情报学的独立定位
- 立足于“大情报”观
- 立足于信息管理
国外情报学教育发展:情报学教育开始呈现出于传统的图书馆学教育分离的趋势。
信息素养:一个具有信息素养的人能够确定何时需要信息,能够有效地获取、评价和利用所需要的信息。
情报素养:主要包括情报意识、情报能力和情报伦理三个方面
- 情报意识是情报素养的先导,是人们获取情报的内在动因
- 情报能力是情报素养的核心,在情报活动中起着组织和控制作用
- 情报伦理:遵守法律法规和一定的道德规范
如何提升情报素养?
- 在校学生可以加强理论和方法学习
- 从业人员在理论指导下增加实践和总结
- 普通大众应注重形成良好的逻辑思维习惯
- 情报素养教育将更加注重教学双方的互动与实践
11. 行业情报
主要知识点:
- 科技情报的数据基础、分析方法与技术、产品与服务
- 企业竞争情报发展现状、数据源、平台系统
- 公安情报要点
11.1 行业情报概述
-
在我国,情报主要包括科技情报、企业竞争情报(商业情报)、国防军事情报及公安边防情报
-
科技情报分为民用科技情报和国防科技情报
-
企业竞争情报具有很强的竞争属性
-
公安情报具有很强的对抗属性
-
国防军事情报兼具对抗情报和竞争情报双重属性
-
各项情报都非常注重公开信息源的分析
-
分析方法和手段:
a)科技情报:依赖文献信息为主的方法
b)企业竞争情报:对标比超、人际网络、SWOT分析等方法
c)公安情报:使用画像的方法,且注重线索分析方法
d)国防军事情报:多依赖人力情报
11.2 现代科技情报
- 我国第一家综合性科技情报机构:中国科技信息研究所(原中国科学技术情报研究所)
- 创新驱动,情报先行
11.2.1 科技情报数据基础
-
科技信息大数据:是科技活动要素及要素之间相关关系的多源异构大规模数据。
-
科技活动要素:科技投入、科技主体、科技平台条件、科技过程、科技交流、科技产出、科技规划与管理
-
科技信息大数据的特点:
a)多源异构性是科技信息大数据的一个突出特点
b)科技信息具有较强的动态增量性,对时效性有着很高的要求
c)科技信息大数据具有国际性,国内外交流、跟踪与对比成为科技信息大数据的一个突出特点
11.2.2 科技情报用户需求和任务
层次角度划分的情报用户:
- 高层次决策用户
- 中层管理用户
- 一般业务用户
国家角度划分的情报用户:
- 高端用户(最高决策用户):关注革命性的科技发展方向、需求和社会影响等
- 中端用户:关注科技优先领域的方向,现成的技术,设施的部署等
- 具体的科研人员:关注科技问题以及具体的技术路线
-
情报需求是依赖情报用户而存在的
a)传统情报需求往往是由情报用户提出来的或者由情报工作人员通过调查问卷或访谈的方式获取;
b)在大数据环境下,可通过新兴技术捕获一些情报需求,甚至可以挖掘潜在情报用户需求。
-
情报需求影响因素:
a)情报用户信息:受静态信息(专业背景、外语水平)和动态信息(最近活动、工作关系网络)的影响;
b)情报需求情境:政策环境、前沿热点、社会焦点问题、行业形势、竞争格局等
基于任务完整性理论的情报决策模型:
- 情报识别:从广泛的信息源中识别出有用的真信息(广而真)
- 情报跟踪:及时采集各渠道信息,全面跟踪与扫描最新信息(快而全)
- 情报比较:注重竞争关系与态势分析
- 情报评价:评价主要内容为科技现状、科技实力、科技机构或人才的能力评价与潜力评估、科技政策或举措实施后的效果评价
- 情报预测:主要包括时间节点、发展趋势、重大事件、机会预测等
11.2.3 科技情报产品与服务
情报的本质是情况之报告,是利用既有知识与新信息融合所形成的新认知、新判断。
- 情报产品的形式:报告
- 报告又分为动态快报、领域或专题深度分析报告和决策参报三种类型
三种不同类型的报告:
-
动态快报:反映国内外最新情况(包括重要事件、最新成果、最新举措等)
-
领域或专题深度分析报告:在文献信息的基础上,对某一领域或专题进行全面分析和总结,梳理出影响因素,厘清发展脉络,绘制技术路线图,识别关键技术,并对发展环境与竞争态势进行全方位的揭示与评估
-
决策参报:针对某一特定事件或问题,通过分析与调研,形成具有战略和政策含义的报告或资料,并给出各方案的优劣势等
大数据环境下情报服务的新特点:
- 主动服务:同过多源数据融合及时捕捉到情报需求,实时监测情报用户需求的变化
- 嵌入式服务:从全领域的客观情报视角为科技创新提供信息情报支撑
- 情报引领:在动态跟踪和态势分析的基础上,充分利用聚类分析、演化分析等方法,分析事物发展的规律,把握主要趋势和次要趋势,厘清长期战略和近期目标,从而实现前瞻预测。
11.2.4 科技情报方法与技术
科技信息大数据资源是现代科技情报工作的基础,精准的情报服务需要解决数据与服务之间的关系——需要方法和技术的支撑
- 多源异构数据融合技术
- 情报用户画像与需求探测技术
- 以属性计算与以情景计算为主的新型计算技术
- 以知识抽取与本体构建为主的知识体系技术
11.3 商业情报与竞争情报
-
商业情报又称商务智能,是对商业信息的搜集、管理和分析过程,目的是使企业的各级决策者获得知识或洞察力,促使他们做出对企业更有利的决策。
-
竞争情报使关于竞争环境、竞争对手和竞争策略的信息和研究,是一种过程,也是一种产品。
竞争情报的三大核心功能:
- 战略预警
- 决策支持
- 持续跟踪与学习
竞争情报相关机构:
- 企业内的情报中心
- 科技情报研究所相关业务部门
- 专门从事竞争情报系统开发或解决方案的
- 相关教育培训机构
11.3.1 商业情报的内容与过程
(一)界定竞争对手:产品层、品类层、属类层对手
(二)商业情报内容:
- 总体情报:多角度综合对手信息
- 产品情报
- 渠道情报
- 宣传情报
- 市场情报
- 人事情报
- 财务情报
- 口碑情报
(三)分析商业情报
(四)采取营销行动
商业情报的数据支撑:
- 企业自身数据
- 第三方数据
- 公开信息源数据
- 各类专门的数据网站
在实际情报工作中,一般都需要汇总多家网站数据才能掌握得更加全面一些。
竞争情报系统(competitive intelligence system, CIS)是基于信息采集、全文检索、文本挖掘等核心技术,对企业自身、竞争对手和企业外部环境的情报信息进行收集、存储、处理、分析的应用管理系统,为企业提供坚实的战略决策支持,从而提高企业的核心竞争力。
- 真正要获得有价值的情报还是要通过人的谋略,通过各种人际关系获取
11.4 公安情报
公安情报的研究内容是围绕“情报主导警务”这一主旨展开的,通过构筑一条从情报获取——情报传递——情报分析与研判——情报决策的“数据链”,实现对犯罪目标的快速反应和精确打击。
-
公安情报是警务的灵魂
-
当前面临的问题:数据资源、手段建设、业务功能没有充分整合
公安情报的分析方法:
- 碰撞比对方法
- 频率分析方法
- 数据挖掘方法
- 分词技巧方法
- 多维分析方法
公安情报的任务主要体现在防务与侦破上,注重线索分析,对有效线索进行深入分析是公安情报的关键。
11.5 行业情报前沿研究动向
(一)大数据情报分析
科技信息大数据主要包括三类:
- 科技信息核心数据:论文、专利等
- 科技信息支撑数据:科技主题词表、情感词表等
- 科技信息外围数据:博客、微博、微信公众号等
大数据环境下的科技情报服务不仅要借助大数据的理论方法,更要从实际应用中去践行大数据的理念
(二)智能情报分析
- 真正的智能情报一定是电脑与人脑的有机结合,只不过人脑与电脑在情报工作中有不同的分工和比重
- 人工智能取得重大进展的关键在于知识工程与搜索算法
12. 当代情报学发展
12.1 知识管理和竞争情报
知识管理:通过知识共享,运用集体的智慧提高应变和创新能力,为组织实现显性知识和隐性知识共享提供新的途径。(共享)
- 侧重对内部知识的发掘和创造
- 是为了企业建立知识交流的平台和方法
竞争情报:
- 包昌火(1998)定义:竞争情报是指关于竞争环境、竞争对手和竞争策略的信息和研究,是一种过程,也是一种产品。
- 美国竞争情报从业者协会:是对整体竞争环境的一个全面监测过程,通过合法的手段收集和分析商业竞争中有关商业行为的优势、劣势和目的的信息。
- 侧重对外部环境的关注,将竞争信息转化为情报和谋略
- 是为企业决策提供情报和技术
二者的差异性:
-
收集
知识管理侧重组织内部挖掘知识,而竞争情报是从组织内外部全方位地挖掘信息 -
组织
知识管理侧重编目和建档,提升检索与协作能力,促进知识共享与重复利用
竞争情报则在知识管理的基础上进行分析研究,为决策出谋划策
-
使用
知识管理侧重传播,竞争情报侧重行动
二者的关系:知识通过行动变为情报,行动进而影响战略决策和战略及战术行动的执行,竞争情报通过实施和行动,提升了知识利用的水平。所以二者是相互补充、相辅相成的关系。
12.1.1 竞争情报和知识管理的整合策略
整合的路径和方法是问题的关键
战略保护系数
战略保护系数(SPF,2005):用来描述和分析公司对于环境的敏感度,现实公司整体的知识状况和风险状况,以及在开发知识资产管理战略时所面临的挑战。
知识管理风险和竞争情报风险组合:
-
低知识管理风险——低竞争情报风险
管理者的独特天赋、运气和机遇 -
高知识管理风险——低竞争情报风险
与垄断企业竞争、协作的公司具有高知识管理风险
-
低知识管理风险——高竞争情报风险
处于成熟行业的公司,自身的知识资产很容易被发现 -
高知识管理风险——高竞争情报风险
高技术行业和制药行业
SPF策略框架
风险高低 | 低知识管理风险 | 高知识管理风险 |
---|---|---|
低竞争情报风险 |
|
|
高竞争情报风险 |
|
|
SPFs分析框架
- 国家层面
- 行业层面
- 组织(企业)层面
影子团队
影子团队:是由来自不同部门、不同职位的具有不同背景和知识结构的人员组成的情报小组
- 竞争情报成功的关键是整合来自各方面的信息和数据
- 竞争情报的目的是提供适当的情报以提高水平的战略思考
影子团队的功能和意义:
- 从竞争性知识中创造智力资本
知识资产要产生价值就必须通过竞争情报实践来完成 - 能将知识转化成情报
鼓励员工积极参与,将隐性知识转换为显性知识 - 是竞争情报与知识管理系统的粘合剂
影子团队实现了知识管理和竞争情报的共同目标,提高了企业的竞争力
12.2 科学计量学与学术评价
“三计学”:
- 文献计量学
- 科学计量学
- 信息计量学
相关定义:
- 科学计量学是一门试图利用科学文献产生、传播和利用过程中的数据,定量化描述科学及科学研究活动特征的学问(布劳温 1989)
- 科学计量学是用定量方法处理和计算科学活动的投入、产出和过程的研究领域(梁立明, 武夷山)
12.2.1 补充计量学(Altmetrics)
- 用于评估学术研究的社会影响力
- 用来描述基于网络的学术材料,将社会媒体视为数据来源
- 补充计量学主要用于统计科学研究成果在网络中被浏览、下载、点击、保存等情况
狭义的补充计量学:对社会网络中学术交互行为的测度
广义的补充计量学:涵盖引用数据以外的所有信息源,即使用、获取、提及、社交媒体等
补充计量学的特征和优势:
- 信息源多样化
- 时效性强
互联网的便利性,可实时获取和跟踪用户 - 计量影响力全面
学术成果对于专业学术研究者和非专业学术研究者均有影响 - 应用价值更大
可展现科研人员的社会影响力;发现潜在合作机会;促进科学研究的开放、公平
补充计量学的意义:
- 为读者筛选优质文章
- 为作者展示作品影响力水平
- 为资源管理者个性化服务提供参考
- 为科研管理层人员开展评价工作提供便利
12.3 信息可视化与科学知识图谱
信息可视化的目的是以高效的方式与大规模的数据进行交互,发掘信息内部的特征与规律。
国际研究进展与趋势:
- 整体呈增长趋势
- 有望在三维、动态、VR等模式上取得新突破
国内研究进展与趋势:
- 总体上升趋势
12.3.1 图情领域可视化分析
微观层次——基于内容(关键词、主题词等)
- 词频分析法
利用能够解释或表达文献可信内容的关键词或主题词在某研究领域文献中出现的频次高低来确定该领域研究热点及发展方向 - 共词分析法
两两统计一组词在一篇文献中出现的次数,并以此为基础对其做聚类分析,从而反映这些词之间的亲疏关系及其所代表的学科和主题的结构变化情况。
中观层次——基于利用过程(文献之间的联系)
- 引文分析法
利用数学和统计学的方法,分析科学文献的引用和被引用现象及规律,以此来揭示其数量特征和内在规律。 - 共引分析法
两篇文献同时被其他文献所引用,以共引强度来体现具有共引关系的文献之间的关联性和相似性 - 引文耦合分析法
共同引用了一篇或多篇的两篇文献之间存在的共引关系,共引数量值称为引文耦合强度,以耦合强度体现学科之间内在的关联度
宏观层次——基于知识网络
- 社会网络是指社会行动者及其间关系的集合
- 复杂网络是介于规则网络和随机网络之间的一种更为接近真实网络的网络模型,具有幂律分布、小世界和无标度等特性。
科学知识图谱
-
科学知识图谱是一种显示科学知识发展进程、现状和结构关系的图形
-
常用软件:
1)通用软件——SPSS
2)专用软件——Bibexcel、Histcite等
3)知识图谱绘制分析工具——CiteSpace和VOSviewer等
4)文本挖掘软件——TDA、Loet Leydesdorff等
科学知识图谱研究的起源:
- 计算机科学领域的数据、信息、知识和知识域可视化研究
- 图书情报学领域的引文分析可视化、知识网络和知识地图等研究
- 复杂网络、社会网络分析等研究
12.4 信息经济学与政策分析
在国内,信息经济学具有同时隶属经济学和情报学的特殊学科性质
-
宏观信息经济学
-
微观信息经济学
1)不对称信息经济学研究
2)信息经济和信息产业经济研究
3)电子商务经济研究
4)网络经济研究
5)知识经济研究
政策分析
- 国外定义:政策分析试图将现代科学技术应用于社会问题的解决中,寻求切实可行的行动过程,产生信息,列出有利证据,并预测行动过程的可能结果,帮助决策者选择最优行动方案(Quade and Carter, 1989)
- 国内定义:从政策分析的过程、目的来对其进行定义,对政府相关活动的原因和结果进行描述和解释,检验公共政策因果关系,为决策者提供政策决策过程中需要的相关知识。
12.5 网络信息管理与商业数据分析
我国信息管理的历程:
- 古代信息管理
信息量少且单调,依靠手工处理为主,主要是存储而非传递和利用 - 近代信息管理
图书馆的出现,将信息管理的目的从简单的存储发展到存储与使用相结合 - 现代信息管理
信息资源多样化、传播途径不断创新
大数据对于网络信息管理的机遇:
- 提高网络信息管理效率
- 体现了网络信息管理的科学性
- 突出网络信息管理的人性化
大数据对于网络信息管理的挑战:
- 数据收集和汇总工作更加复杂
- 对数据分析的要求更高
- 数据信息解析和管理更加多元化
大数据背景下信息管理者的应对措施:
- 保持时代意识,网络信息管理要围绕数据的持续增长和规则的不断增强而获得提升,信息管理思维要随着大数据技术的不断应用和丰富而调整
- 网络信息管理的发展离不开对大数据技术的有效利用
- 注重信息管理的安全性,建立符合数据规则的网络信息管理安全体系
平
3. 为资源管理者个性化服务提供参考
4. 为科研管理层人员开展评价工作提供便利
12.3 信息可视化与科学知识图谱
信息可视化的目的是以高效的方式与大规模的数据进行交互,发掘信息内部的特征与规律。
国际研究进展与趋势:
- 整体呈增长趋势
- 有望在三维、动态、VR等模式上取得新突破
国内研究进展与趋势:
- 总体上升趋势
12.3.1 图情领域可视化分析
微观层次——基于内容(关键词、主题词等)
- 词频分析法
利用能够解释或表达文献可信内容的关键词或主题词在某研究领域文献中出现的频次高低来确定该领域研究热点及发展方向 - 共词分析法
两两统计一组词在一篇文献中出现的次数,并以此为基础对其做聚类分析,从而反映这些词之间的亲疏关系及其所代表的学科和主题的结构变化情况。
中观层次——基于利用过程(文献之间的联系)
- 引文分析法
利用数学和统计学的方法,分析科学文献的引用和被引用现象及规律,以此来揭示其数量特征和内在规律。 - 共引分析法
两篇文献同时被其他文献所引用,以共引强度来体现具有共引关系的文献之间的关联性和相似性 - 引文耦合分析法
共同引用了一篇或多篇的两篇文献之间存在的共引关系,共引数量值称为引文耦合强度,以耦合强度体现学科之间内在的关联度
宏观层次——基于知识网络
- 社会网络是指社会行动者及其间关系的集合
- 复杂网络是介于规则网络和随机网络之间的一种更为接近真实网络的网络模型,具有幂律分布、小世界和无标度等特性。
科学知识图谱
-
科学知识图谱是一种显示科学知识发展进程、现状和结构关系的图形
-
常用软件:
1)通用软件——SPSS
2)专用软件——Bibexcel、Histcite等
3)知识图谱绘制分析工具——CiteSpace和VOSviewer等
4)文本挖掘软件——TDA、Loet Leydesdorff等
科学知识图谱研究的起源:
- 计算机科学领域的数据、信息、知识和知识域可视化研究
- 图书情报学领域的引文分析可视化、知识网络和知识地图等研究
- 复杂网络、社会网络分析等研究
12.4 信息经济学与政策分析
在国内,信息经济学具有同时隶属经济学和情报学的特殊学科性质
-
宏观信息经济学
-
微观信息经济学
1)不对称信息经济学研究
2)信息经济和信息产业经济研究
3)电子商务经济研究
4)网络经济研究
5)知识经济研究
政策分析
- 国外定义:政策分析试图将现代科学技术应用于社会问题的解决中,寻求切实可行的行动过程,产生信息,列出有利证据,并预测行动过程的可能结果,帮助决策者选择最优行动方案(Quade and Carter, 1989)
- 国内定义:从政策分析的过程、目的来对其进行定义,对政府相关活动的原因和结果进行描述和解释,检验公共政策因果关系,为决策者提供政策决策过程中需要的相关知识。
12.5 网络信息管理与商业数据分析
我国信息管理的历程:
- 古代信息管理
信息量少且单调,依靠手工处理为主,主要是存储而非传递和利用 - 近代信息管理
图书馆的出现,将信息管理的目的从简单的存储发展到存储与使用相结合 - 现代信息管理
信息资源多样化、传播途径不断创新
大数据对于网络信息管理的机遇:
- 提高网络信息管理效率
- 体现了网络信息管理的科学性
- 突出网络信息管理的人性化
大数据对于网络信息管理的挑战:
- 数据收集和汇总工作更加复杂
- 对数据分析的要求更高
- 数据信息解析和管理更加多元化
大数据背景下信息管理者的应对措施:
- 保持时代意识,网络信息管理要围绕数据的持续增长和规则的不断增强而获得提升,信息管理思维要随着大数据技术的不断应用和丰富而调整
- 网络信息管理的发展离不开对大数据技术的有效利用
- 注重信息管理的安全性,建立符合数据规则的网络信息管理安全体系