5月25日,距高考还有十多天的时间,百度公司旗下的百度文库对外宣布,将通过大数据分析正式发布各省、自治区、直辖市的高考预测卷。这是互联网公司第一次利用大数据技术对高考试题进行预测。
百度预测高考卷
5月21日,百度已经在《北京晨报》A11版上,整版发布了2016北京高考数学预测卷,百度公司表示,之后几天将陆续发布全国各省、自治区、直辖市的高考数学和理综考试的高考预测卷。
据了解,百度文库将2010年至2014年五年来,全国各省市的高考数学试卷进行了详尽分析,从而理出了各地区五年来文、理考卷的核心考点及其相应分值。
以北京市为例。经大数据分析得出,在2010年至2014年间,理科试卷的核心点有数列递推式、函数在某点取得极值的条件、椭圆的应用等,分别平均占卷面分值18分、16分和14分;而文科试卷中以直线与圆锥曲线的关系、三角函数的恒等变换及化简求值、频率分布直方图等相关内容,各自占16分、15分和15分。
现在各种高考预测题种类繁多,但它们都有一个共同特点:对考点的把控几乎全部依据出题者的主观意识。不同的出题者,对今年考点和题型的预测必然有着自己主观见解的偏差,即使是国家级特级教师的判断也会存在。为了增加押题概率,多年来考生大多采用题海战术。
大数据的出现,为押题提供了一种新的可能性。成功预测考题的关键点不外乎海量的数据和精准的分析。百度文库试图用大数据技术对此进行探索。
据了解,2014年高考前夕,百度大数据部为考生预测出2014年高考作文的六大命题方向,包括“时间的馈赠”、“生命的多彩”、“民族的变迁”、“教育的思辨”、“心灵的坚守”和“发展的困惑”等,其中每个作文主题又划定多个作文关键词。从考后对比的情况来看,百度高考作文预测命中了全国18卷中12卷作文方向,以上海市为例,2014年上海卷高考作文题为“自由与不自由”,在百度大数据预测的出题概率第二大作文主题“生命的多彩”中,恰好命中作文关键词“自由”。
需要注意的是,百度的预测试题,并非精确押中题目本身,而是预测题目的类型、方向等。