摘 要 当前健康医疗大数据高速增长,针对医疗行业的数据科学与大数据技术专业存在着强烈的社会需求。为解决这个问题,在总结综合比较分析已被教育部批准开办数据科学与大数据技术专业的35家高校课程体系框架的基础上,我们发现,当前高校已经开设数据科学与大数据技术专业的课程体系都包括数据科学类和IT类课程,不同学校只是侧重点和具体课程有所不同。上海健康医学院提出专门针对医疗行业健康大数据的数据科学与大数据技术专业课程体系,突出选择与医学健康类、IT技术、数据科学与医学健康融合类相关的课程,增加医学健康类课程的学时,采用理实一体化的教学模式,从而保证专业培养目标的真正实现。
关键词 数据科学 大数据技术 课程体系 健康大数据 理实一体化
中图分类号:G642 文献标识码:A DOI:10.16400/j.cnki.kjdkx.2018.09.019
Abstract With the rapid growth of large data in health care, there is a strong social demand for data science and large data technology in medical industry. In order to solve this problem, on the basis of summarizing and analyzing the curriculum framework of 35 colleges and universities which have been approved by the Ministry of Education to set up the major of data science and data technology, we find that the current curriculum system of data science and data technology in Colleges and universities includes both data science and IT courses. Schools focus only on specific courses. Shanghai University of Medicine & Health Sciences put forward the curriculum system of data science and data technology specializing in health data of medical profession. It emphasized the selection of courses related to medical health, IT technology, data science and medical health integration, increased the teaching hours of medical health courses, and adopted the teaching mode of integrating theory with practice. And ensure the real realization of professional training objectives.
Keywords data science; big data technology; course system; health big data; integration of theory and practice
1 數据科学与大数据技术专业发展背景
国际国内一些高校已经开始举办大数据相关的专业,美国北卡州立大学、美国纽约大学等高校设立数据科学硕士学位。清华大学和北京大学于2014年秋开始培养第一批大数据硕士。根据教育部提供的本科“数据科学与大数据技术”专业设置数据,成功申请“数据科学与大数据技术”本科新专业的高校共有三批,318所高校。2016年2月第一批共有3所高校成功获得教育部批准“数据科学与大数据技术”专业,包括北京大学、对外经济贸易大学以及中南大学。第二批成功申请该专业的高校共有32所,包括中国人民大学、北京邮电大学、电子科技大学、复旦大学、华东师范大学、上海工程技术大学以及上海纽约大学等高校同时于2017年3月获得教育部批准。2018年获得教育部批准数据科学与大数据专业的高校有283所,包括华东师范大学、武汉理工大学以及上海健康医学院。
但是在这些大部分院校中,没有培养支持医疗健康卫生行业的医学及医学相关类应用型本科医学院校。在这种背景下,上海健康医学院结合行业特色,结合学校与附属医院协同培养学生的一体化平台特色和优势,聚焦特定医疗行业和领域,采取差异化战略,形成自己的竞争优势。在原有医学信息专业的基础上,经过补充师资、兴建健康大数据技术专业实训中心、云计算与医疗物联网实验室等教学基础条件,开始试办健康大数据方向的数据科学与大数据技术专业方向。我们基本厘清了本专业的专业定位和专业边界:培养出特色鲜明、服务于临床医学和人类健康的数据科学与大数据技术专业人才。以此专业定位和专业边界,进行我校 “数据科学与大数据技术” 本科专业的课程体系设计。
2 数据科学与大数据技术专业的通用课程体系框架
梳理318家国内各院校的数据科学与大数据技术专业课程体系,综合比较分析各院校专业特色,才能差异化我校的专业特色,形成自己的竞争优势。各大高校制定的课程体系(包括中南大学、对外经济贸易大学、中国人民大学、北京邮电大学、北京大学、复旦大学等)都包括数据科学类、IT类、数据科学类与IT类的复合三大类课程,每个高校在这三类中的侧重点和具体课程有所不同。同时,在以这三类课程为核心的基础上,适当增加了公共基础类、专业实践类以及部分专业选修类课程。具体课程如下:
公共基础类:高等数学、概率论、外语、普通物理、电工电子学等。
数据科学类:信息论与编码、计算思维和数据科学、离散数学、数据采集技术、云计算与数据中心、机器学习与模式识别等。
IT类:程序语言设计(C语言/python语言/R语言)、数据结构、面向对象程序设计(JAVA/C#语言)、计算机原理、操作系统、数据库原理、计算机网络技术、应用软件开发(桌面应用/网络应用/移动应用)等。
数据科学类与IT的复合类:数据分析与融合、数据可视化技术、图像视频与非结构化数据、分布式海量存储系统、大数据与领域建模等。
专业实践类:程序设计实训、数据分析与融合实训、数据可视化技术实训、操作系统实训、数据库系统实训、统计分析案例实训、毕业实训等。
专业选修类课程:数据采集技术、智能搜索引擎、网络安全、数据挖掘、人工智能、統计分析语言、分布式海量数据存储等。
从上述课程体系可以看出,大部分高校的课程体系中,计算机专业课程(即IT类)与数据科学类占有很大的比重。
3 专门针对医疗行业健康大数据的数据科学与大数据技术专业课程体系
但是,健康医疗大数据高速增长,涵盖了人的全生命周期生命健康的各个方面,既包括个人健康,又涉及医药服务、区域信息平台的医疗健康数据、疾病防控数据等多方面数据的汇聚和聚合。生物、医疗、医药等各个领域产生了海量的图像、文本、实验室指标等多元异构的健康数据。因此,本专业的培养目标是,培养满足社会多样化需求的、医疗以及大健康产业发展需要的,德、智、体、美全面发展,具有良好的职业道德、职业技能和创新精神,具备信息科学、数据科学、医学的基础知识和基本技能,掌握大数据科学及技术所需的计算机、网络、数据编码和数据处理的基本理论与知识,掌握大数据采集、处理、分析与应用的技术与核心技能,具备大数据的分析与应用能力,主要在医疗卫生机构、医疗信息行业、健康产业等相关企事业单位从事大数据分析、处理和开发,以及管理与维护等各方面工作的高素质应用型人才。
考虑到我校学生的实际情况以及教学管理规定和约束,设计出了专门针对医疗行业健康大数据的数据科学与大数据技术专业课程体系,具体课程如下:
公共基础类课程:思想道德修养与法律基础、线性代数、概率论与数理统计、大学生职业生涯规划等。这部分课程是学校规定的公共必修课,共10门课程、864学时。另有公共选修课3门(包括社会实践、创新创业)、160学时。合计共13门课程、1024学时,占总学时的32.7%。
医学健康类:预防医学、基础医学概论、临床医学概论等,这些课程密切关联健康大数据的研究本体,为医学健康信息内涵的认知,大数据应用的理解奠定了基础。这部分课程共11门课、288学时,占总学时的9.2%。
数据科学类与IT基础:离散数学、C语言程序设计、数据结构、数据库原理及应用、计算机网络技术、计算机操作系统、面向对象程序设计(JAVA)。这部分课程共7门课、362学时,占总学时的11.6%。
医学健康类、数据科学类与IT的复合类课程:医学信息学、医院信息系统分析与设计、云计算与大数据技术、数据处理与Python编程、健康信息智能处理、健康数据挖掘和可视化、医学数据统计分析、专业英语。此部分课程共9门课、528学时。再加上小学期集中实践课:程序设计综合实验、健康数据挖掘和可视化课程设计、医学数据统计课程设计、Python数据分析与应用课程设计、医院信息系统课程设计、医院见习,共6门课程、288学时,则医学健康类、数据科学类与IT的复合类课程应为15门课程、816学时,占总学时的26.1%。
专业实践类:顶岗实习、毕业设计。此部分课程共3门课、480学时,占总学时的15.3%。
专业选修类:数据采集技术、移动应用开发、医学信息分类与编码、生物医药实时大数据技术、智慧医疗、卫生管理信息技术、医学语言处理技术、医学图像分析与挖掘、远程医疗系统及应用、循证医学方法概述、分布式海量数据存储、信息与网络安全、数据隐私保护、智能搜索引擎技术。此部分课程中可以任选5门课程、160学时,占总学时的5.1%。
在这个课程体系的设置中,针对部分重要核心课程,我们将理论课程与实训课程合并在一起,并且结合医院以及医疗相关企业的实际案例,发挥我校产学研优势,实现“做中学、学中做” 的教学过程。例如, “健康数据挖掘和可视化实训” 是“健康数据挖掘和可视化” 和“医学信息学” 两门课程的一体化; “Python数据分析与应用课程设计” 是“健康信息智能处理” 和“Python数据分析与应用” 两门课程的一体化。
总体来说,目前设计的课程体系中,公共基础类课程所占学时太多,而医学健康类课程的数量和所占学时明显偏少,可能不能满足医疗行业对学生进入医学健康行业的需求,所以,我校针对大数据专业课程体系的下一步改革方向,要在此类问题进一步改进。要能保证学生真正掌握了本专业在医疗行业的大数据技术处理的看家本领,才能保证专业培养目标的真正实现。
参考文献
[1] 李娟,卢昕,薛皛洁.英国开放大学学习支持的整合性实践及启示[J].中国远程教育,2017.3:52-58.
[2] 陈池,王宇鹏,李超,张勇,邢春晓.面向在线教育领域的大数据研究及应用[J].计算机研究与发展,2014(51):67-71.
[3] 杨现民,唐斯斯,李冀红.发展教育大数据: 内涵、价值和挑战[J].现代远程教育研究,2016(1):50-61.
[4] 胡弼成,王祖霖.“大数据”对教育的作用、挑战及教育变革趋势——大数据时代教育变革的最新研究进展综述[J].现代大学教育,2015(4):98-104.
[5] 姜强,赵蔚,王朋娇,王丽萍.基于大数据的个性化自适应在线学习分析模型及实现[J].中国电化教育,2015(1):85-92.
[6] 赵慧琼,姜强,赵蔚.大数据学习分析的安全与隐私保护研究[J].现代教育技术,2016(3):5-11.