本文共 3316 字,大约阅读时间需要 11 分钟。
本文就当前环境下,网络安全与执法专业引入大数据相关课程体系的必要性进行了论述。结合该专业自身特性,对拟引入的大数据相关专业课程提出了选择建议,同时对拟引入的课程教学内容和其在网络安全与执法专业的业务应用方向进行了阐述。
引言
随着互联网的高速发展,信息技术这把双刃剑为我国公安部门提出了新的问题和发展方向。一方面,各种网络犯罪、网络突发舆情、网络泄密等危害国家安全和社会稳定的情况对网络安全与执法提出了更高要求;另一方面,方便快捷的网络生态又为侦查线索搜集,通缉追逃等传统手段提供了新的解决思路和方法。为此,我国部分公安院校陆续设立了网络安全与执法专业。
该专业的培养目标,主要是为公安机关培养网络安全与执法人才,要求其既懂技术,又会管理和执法。在其专业课程设置上,具有显著的公安特色,如法律、现场勘察,计算机取证等,同时,在技术层面上,又紧贴计算机及网络相关专业。要求其学员具备计算机科学与技术、信息安全学科的基本理论和知识,熟悉网络安全与执法工作的相关法律法规知识,具备网上发现和处置、网上侦查和网上违法违规行为防范和控制的能力,能胜任网络安全与执法方面的实际业务工作,有能力组织实施网络信息安全保护,具备搜集互联网情报信息的手段,有能力完成网络监管,以及对重要系统的网络安全监督。
当前,各院校在该专业的技术领域计算机技术方向上,主要偏重于计算机基础、网络技术、网络安全技术等,而大数据技术的发展,为其相关专业课程的引入提出了新的需求。
大数据相关专业课程的设置必要性
传统的侦查模式基本上是从案到人的侦查模式,而面对现代高智能犯罪、恐怖活动犯罪以及突发性群体事件,传统的侦查模式不能在事发前就对其进行预防,及时地发现犯罪迹象,对其进行控制和打击,以避免事态恶化。而现代侦查模式能及早地发现犯罪迹象,进而主动进行侦查,控制局面。大数据技术就是现代侦查模式中的一种,它的引入,为现代侦查带来了新的机遇,信息数据库的建立便于全面掌控犯罪信息,大数据技术中的数据分析和智能检索技术提高了侦查效率,侦查机关也可以利用数据挖掘和预测来进行犯罪预防和控制。世界范围内,运用大量数据进行犯罪侦查和控制,始于1994年纽约市的警察部门启用CompStat系统,该系统通过对数据统计报告的各种比较,进行犯罪预防,确定警力资源分配和打击对策。
大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据技术的意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换而言之,如果把大数据看作一种手段,那么这种手段实现预期目标的的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。 大数据在西方广泛应用于商业营销、群体事件预测、疾控、金融投资分析、精细化教育投放等,也运用于社会监控和预测、治安管理、恐怖主义打击等等方面。
随着大数据技术的发展,部分国家开始建立大数据驱动的犯罪侦查和控制体系,该体系利用大数据分析历史案件、发现犯罪趋势以及犯罪模式;通过挖掘城市和社交网络数据,进行犯罪预测;利用大数据优化警力资源分配等。总体来说,利用大数据技术,提升犯罪侦查和控制能力是未来的发展方向。
综上所述,在网络安全与执法专业,开设大数据相关课程,是有其必要性和紧迫性的。
大数据方向专业课程体系建设
虽然在网络安全与执法专业的教学中,引入大数据相关专业课程是有必要性和紧迫性的,但是要全面引入大数据的专业课程,明显是不现实的,同时,也并无必要。在此,笔者根据网络安全与执法专业的专业特性和需求,结合大数据相关技术的特点和应用方向,综合分析研究,推荐选择以下几门课程作为网络安全与执法专业大数据方向的专业课程,形成网络安全与执法专业大数据方向的专业课程体系。数据挖掘基础(专业基础课);多元统计分析(专业课);流式数据处理(专业课);大数据方向专业课程教学内容。
3.1 数据挖掘基础
数据挖掘是一门新兴的交叉性学科,是在信息技术领域迅速兴起的计算机技术。数据挖掘技术面向应用,在很多重要的领域,数据挖掘都发挥着积极的作用,是大数据应用的主要手段之一。在犯罪侦查、线索搜集、网络监管、舆情监控等各个方向上,都有重要的应用。
数据挖掘基础全面介绍数据挖掘的原理、方法和算法。主要内容包括数据挖掘的基本概念、数据挖掘算法的数据类型、输入和输出、决策树、数据挖掘的预处理和后处理、关联规则挖掘、分类和回归算法、支持向量机、聚类分析及多维数据可视化。
该课程作为专业基础课,通过该课程的学习,使学员了解数据挖掘技术的整体概貌,了解数据挖掘技术的主要应用及当前的研究热点问题,了解数据挖掘技术的发展方向,掌握最基本的概念、算法原理和技术方法。
3.2 多元统计分析
多元统计分析是从经典统计学中发展起来的一个分支,是一种综合分析方法,它能够在多个对象和多个指标互相关联的情况下分析它们的统计规律,是数理统计学中的一个重要的分支学科。主要内容包括多元正态分布及其抽样分布、多元正态总体的均值向量和协方差阵的假设检验、多元方差分析、直线回归与相关、多元线性回归与相关(Ⅰ)和(Ⅱ)、主成分分析与因子分析、判别分析与聚类分析、Shannon信息量及其应用。简称多元分析。
多元统计可以处理以下几类实际问题。
多重回归分析,简称回归分析。其特点是同时处理多个因变量。回归系数和常数的计算公式与通常的情况相仿,只是由于因变量不止一个,原来的每个回归系数在此都成为一个向量。该分析可以通过多个因变量的处理,统计分析某一因变量的变化趋势。
判别分析,由 k个不同总体的样本来构造判别函数,利用它来决定新的未知类别的样品属于哪一类,这是判别分析所处理的问题。它在网络安全与执法、侦察各方面都有广泛的应用。
聚类分析,又称数值分类。聚类分析和判别分析的区别在于,判别分析是已知有多少类和样本来自哪一类,需要判别新抽取的样本是来自哪一类;而聚类分析则既不知有几类,也不知样本中每一个来自哪一类。
主成分分析,又称主分量分析,是将多个变量通过线性变换以选出较少个数重要变量的一种方法。在根据样本进行主成分分析时又可分为R型分析与Q型分析。前者是用样本协差阵(或相关阵)的特征向量作为线性函数的系数来求主成分;后者是由样品之间的内积组成的内积阵来进行类似的处理,其目的是寻找出有代表性的“典型”样品,这种方法在地质结构的分析中常使用。
其他还有对应分析、因子分析、对应相关分析等。
该课程作为专业课,通过该课程的学习,掌握其各种分析方法,在网络舆情监控、犯罪侦查、线索搜集、犯罪预防、群体事件舆情事件防控等方面,都有较为广泛的应用。
3.3 流式数据处理
流式数据处理,指针对流式数据的一种分布式、高可用、低延迟、具有自身容错性的实时计算技术,它是根据一组规则来动作的工具,通过提取和分析来自各种分布式系统的信息,来解决监控和管理的各种问题。
该课程作为专业课设置,其主要教学内容包括实时数据采集,实时数据处理,实时查询服务,当前主流流式数据处理产品简要教学等内容。
流式数据处理技术主要针对数据时效性要求高,原始数据量大,数据量变化迅速,业务生命周期短的大数据应用。其应用特性和网络安全与执法专业所面对的数据特性具有高度契合性,可广泛应用于犯罪侦查,实时线索采集,实时追踪,网络舆情监管,突发事件防控,治安管理,警力调度,网络信息采集监管等各个方面。
结语
对于网络安全与执法专业来说,大数据相关专业体系的引入,对于侦查体系的提升,业务能力的加强,监管手段的丰富,覆盖面积的加大等各个方面来说,都有其重要的现实意义和紧迫性。同时,对于学员的个人能力提升和知识广度的扩大,增大学员的就业面,也有其实际作用。但是,当前现状下,大数据相关专业课程也存在人才储备不足,师资力量薄弱的问题。相关院校可在条件成熟时,结合自身条件,适时引入大数据相关专业课程体系,建设有特色的网络安全与执法专业。
本文转自d1net(转载)