可靠的数据信息资源是智库生产高质量决策咨询成果的底层支持和重要保障。本文在系统调研国内外科技智库数据资源建设情况的基础上,选取国内外排名前列的科技智库,对其数据资源建设现状、建设特点和数据展示共享情况开展调查和对比分析,深入挖掘我们国家科技智库数据资源建设中存在的问题,提出对应的改进建议,以期为我们国家科技智库发展和数据资源建设提供参考。
智库(Think Tank)也称智囊团、思想库,指为政府、企业或社会集团的决策和行动出谋划策,通过生产创造性思想和智慧,提供解决具体问题的决策建议,并培养、储备和运输人才的独立性研究机构[1]。我国最早的“智库”可追溯到中国古代的智囊团和智囊人物,而现代意义上的智库是在改革开放后开始蒸蒸日上的。2013年4月,习首次提出要建设“中国特色新型智库”,推进决策科学化、民主化。科技智库作为中国特色新型智库的重要组成部分,在推动科技跨越式发展,提升国家科技战略规划和实施能力方面具备极其重大的作用。
参考2018年宾夕法尼亚大学智库和民间社会计划(TTCSP)出版的《全球智库报告2018》(2018 Global Go To Think Tank Index)[2]中的说明和定义,科技智库指在全世界内领先的科学和技术机构。该类智库提供包括电信、能源、气候和生命科学等领域的创新研究和战略分析,在研究、分析和公开讨论各类政策问题上有着明显的优势,能够在减少国家争议、促进多方合作、维持公开支持和资助及全面改善生活品质等方面发挥非消极作用。结合我国国情,本文认为科技智库是以科技政策领域重大问题为研究对象,以科技政策咨询人才为骨干,运用信息、知识与经验,识别科技政策咨询需求,提供咨询服务的研究机构[3]。科技智库是政府为促进科技发展,利用科学技术为国家目标服务而采取的集中性和协调性措施,是科学技术与国家发展的有机整合,在国家战略发展和科技发展中扮演着“智囊”和“外脑”的重要角色。
在科技智库提供决策服务的过程中,数据是重要的研究支撑。“没有数据就没有话语权”,数据是科技智库开展深度研究的重要挖掘对象,开展数据资源建设,实现数据利用共享是科技智库可持续发展的必然选择。当前,国内外科技智库数据的获取途径大致可归为直接生产创造的数据和间接搜集获取的数据。直接生产创造的数据主要来自于调研和实验;间接搜集获取的数据包括自身馆藏数据和合作交流共建数据。一些发达的科技智库会将收集的各类数据资源进行归类整合,形成自建数据平台/数据库,为科技智库的深度研究提供资源(表1)。
通过对比发现,在数据资源获取途径上,国内外科技智库基本一致。但在对智库研究成果积累所得的内生数据管理和智库项目数据的整理展示上,国内外差距明显,尤其在自建数据平台/数据库建设上,根据可公开查找的多个方面数据显示,在调研的34家国内科技智库中,仅有4家科技智库拥有一个或多个数据库,明显落后于国外。
为进一步探究我们国家科技智库数据在资源建设上与国外科技智库的区别,本文参考美国宾夕法尼亚大学发布的《全球智库报告2018》[2]中科技智库排名情况,考虑智库研究的影响力,选取了马普学会、兰德公司、美国国家农业部粮食与农业研究所、国际生物多样性中心作为国外科技智库数据建设分析案例。通过对拥有自建数据库的国内科技智库数据库网站的访问,参考上海社会科学院智库研究中心发布的《2018中国智库报告:影响力排名与政策建议》[4]中科技智库排名情况,选取数据开放性和易获取度相比来说较高的中国社会科学院作为案例,从数据建设现状、建设特点和数据展示共享三方面,进行国内外科技智库数据建设对比分析。
从数据建设现状上看,马普学会、兰德公司和NIFA都已建立了较为完善的自建数据资源库并提供了方便简洁的数据检索利用工具包;国际生物多样性中心通过自建与合建,也拥有了少数的数据资源;中国社会科学院数据中心拥有数量丰富的信息资源,但以文献资料居多,视频访谈类资源较少。从数据建设特点上看,马普学会从主题类别、数据库类型、开放性和资产金额来源等多个角度对数据库进行交叉描述,便于检索和获取资源;兰德公司采用规范的元数据标准,在保证数据规范可靠的同时,提高了检索效率;NIFA提供的数据和工具能够很好的满足并提升研究所项目运行、专家评审、事务管理和数据下载的需求;中国社会科学院自建的调查与数据信息中心目前拥有的数据资源多为非结构化数据,存在二次利用和再开发困难的问题。从数据展示与共享上看,为实现成果输出和数据共享,国外科技智库的网站上大多设有便捷快速的数据访问入口,可针对不一样的访问人群提供对应的数据和工具;对于可免费下载的数据,国外科技智库提供了在线浏览和下载链接。中国社会科学院数据库也提供了便捷的期刊导航和信息检索方式,免费的在线阅读和全文下载,检索结果支持多种排序、导出等。
通过对国内外科技智库数据建设的对比分析发现,我们国家科技智库在数据资源建设上还存在以下问题:
相对于国外科技智库充足且多元化的情报资源,我们国家科技智库的信息资源多以文献为主,各类统计数据、项目数据、研究成果数据的积累和开发利用不足,数据类型略显单一。智库的项目成果数据积累薄弱,数据历史纵深不够、粒度大、关联缺失,对内生数据的整理和利用意识滞后,自有特色数据资源库的建设缺乏数据的积累和支持。
国内科技智库在项目数据利用后,没有及时归档,应从数据采集阶段就介入的数据全生命周期管理跟进不及时,采集后的数据无法或缺乏统一的规模化流程加工处理,导致后期项目开展又得重新采集和整理,造成数据复用困难和重复建设。有的项目即使有数据,但是由于没有关要求或有所顾虑,正常情况下不会主动提交,智库的数据资源优势得不到发挥。而且,国内科技智库的数据访问入口较为隐蔽,多需注册后才可以获得数据的下载权,部分智库尚无英文访问页面,数据的交流共享难以实现。
国外多数专业型智库均会提供专业的数据工具,如世界银行有专对于经济统计数据的工具,国内的电子资源服务商也提供了类似的分析工具。智库的工具类功能能够更好地吸引客户,增加附带数据的利用率和推广度,提升智库综合影响力,但当前我们国家科技智库建设中数据的研发意识薄弱,数据挖掘分析工具开发滞后,数据利用率和推广度较低,不同数据库间交流融合较少,数据资源价值未能得到充分的利用,没办法吸引更多的用户,在智库数据资源竞争中缺乏优势。
为提升我们国家科技智库服务水平,提高我们国家科技智库国际影响力,本文对我们国家科技智库数据资源建设提出以下几点改进建议:
第一,扩大数据类型和容量,加强自有数据资源库建设。大数据时代,智库的情报部门要充分的利用数字挖掘、智能抓取等信息技术对文献信息和多媒体信息进行采集、筛选,扩大科技智库数据资源类型及数量。同时,在数据收集整理过程中要有顶层意识,注重对特色数据的积累,对智库研究项目的产出数据也要做好日常的维护和积累工作,为建设自有数据资源库积累数据。
第二,建设科技大数据平台。创新数据资源架构,优化提升基础设施保障水平,构建集数据采集、分析、展示与共享于一体的科技大数据平台,探索总结数据治理、技术与应用实践经验。建设跨领域、跨机构的数据资源协同服务,推动加强联合调研研究;选择性地与国际高端智库的信息化合作,让数据走出去并得到国际的认可,逐步扩大科技大数据平台数据资源架构及数据资源容量。
第三,开发多元化数据产品,创新数据服务模式。在数据的建设、处理、分析挖掘和推荐等环节,加强对大数据技术的引入和应用,实现对非结构化数据的处理和分析,提供切实可行的数据模型和算法及更多元化的研究成果展示方式,提高决策效率和咨政效果。深入研究知识图谱、机器学习、人工智能技术在科技大数据的应用,着力提升项目设计、指标构建、抽样设计、调查实施、数据分析、数学建模、大数据挖掘、数据库建设和相关软件开发等能力,提高数据驱动研究、数据服务决策能力。
[1] 佚名. 当代中国思想库:问题与对策[D]. 南京师范大学, 2007.
来源:中国科协创新战略研究院《创新研究报告》第19期(总第285期)2019-05-28
新闻推荐
【2024-04-27】
【2024-04-27】
【2024-04-26】
【2024-04-26】
【2024-04-25】
【2024-04-25】
【2024-04-25】
【2024-04-24】
【2024-04-24】
【2024-04-23】
【2024-04-23】
【2024-04-23】