美国雪城大学信息学院秦健教授谈数据科学发展

发布者:苏超发布时间:2018-06-12浏览次数:701

201868日上午浙江大学信息资源管理研究所在紫金港校区蒙民伟楼122会议室举行了一场专业座谈会,来自美国雪城大学信息学院的秦健教授就信息科学在美国的发展与应用,与研究所的硕博研究生分享了专业前沿研究体会。

秦健教授首先介绍了美国数字资源的数据分析。秦教授以耶鲁大学收藏的Vogue杂志用“girl”和“woman”两个词进行词频分析研究美国女性报道演变与女性研究为例,说明了数据科学如何利用信息技术对文献进行知识发现和数据挖掘。秦健教授讲述了美国村、镇级组织对记录(records)管理的重视,如美国雪城历史协会(History Society)收藏着本地的档案、文献和实物等,如房屋的面积、结构、所有权转让的记录,包括社区有否罪犯居住的信息,这些公共信息均可在社区、村镇的公共数据中心查阅。在数据科学发展进程中,专业教育如何培养专业化人才,秦教授以英国图书馆人员招聘启事为例,说明相关信息科学单位目前主要从责任心、团队精神、交流沟通能力和专业知识技能等方面进行考察应聘人员的资质,因而,作为雪城大学负责学生实习事宜与社会适应性的主管教授,她强调雪城大学信息学院在培养学生要从社会对毕业生的需求考虑,重点培养学生的综合能力。

秦教授认为在大数据时代,信息机构服务人员应该具备“数据素质”。具备数据素质可以在数据引用和挖掘过程中发挥辅导、咨询、开发、利用等作用,而数据素质指数据分析人员能够参与“研究生命周期”(Research Life Cycle)全部流程,了解相应研究团队课题的信息采集方法、组织和检索技巧,掌握学科所需数据、流程、应用平台、开发工具等,把握学科的研究方向,参与学科组织或团队的研究工作,以及时准确地提供咨询服务。秦教授介绍了当前她研究的大原数据分析(Big Metadata Analysis)方法,它与原来的元数据(Metadata)相比,更强调从宏观层面构建元数据的标准和、建库及与相关数据库之间的关联与整合工作。另外,鉴于这项工作的新颖性,她认为信息机构内部应该组织化(Institutionalization)予以体制保障,这样就不会由于管理人员的变更而导致该项工作的停止。

专业座谈会由信息资源管理系主任傅荣校教授主持。他就中美信息公共服务方向的差异作了比较分析,系副主任潘有能副教授结合他在美访学期的经历,就美国数据科学与大数据的研究谈了自己的一些体会。系所的硕博研究生就数据缺失、科研数据整合、记录数据检索、以及我国与美国记录数据的开发利用机制问题与秦教授作了交流和讨论,收获很大,专业座谈会圆满结束。

(供稿:浙江大学信息资源管理研究所何蔓)