8月21日,已经持续了四个多月的2014阿里巴巴大数据竞赛经历了两天的现场答辩决出前三名:由北京航空航天大学学生李森栋和中国科学院大学学生王涛组成的“Marvel”团队获得冠军,获得20万元冠军奖金。南京航空航天大学学生柯文玮的“KLMJV”,南京航空航天大学学生李国拯、徐菁风和东南大学学生肖志宇组成的“Fly402”分获二三名。
据了解,接下来比赛将进入第三阶段——第二阶段的前三支团队的选手将在今年的双十一参与实战,与天猫算法团队正面交锋,使用真实的第一手数据,让其算法上线接受真实流量的考验。
什么才是大数据?是实验室里电脑里的几千几万条数据?还是论文中的万条记录?在答辩现场,选手谈论自己参赛以来的最大感受是,通过这次数据竞赛,终于可以跟“高大上”的大数据贴身接触了,这对于他们理解数据挖掘带来了与以往听报告、看论文完全不一样的感观,这意味着他们从以往大数据研究的“试管捉鱼”状态进入到现在的“入海捕鱼”。
阿里巴巴天池项目负责人王一婷向记者介绍,目前学术界面临数据资源不足、计算能力有限的困境,事实上无法进行真正接地气的大数据研究。举办首届阿里巴巴大数据竞赛,一方面是为高校学子提供大数据的实战机会,推动高校和研究机构对大数据和算法的研究发展,另一方面也是为了培养相关领域的人才成长。
一位参加2014阿里巴巴大数据竞赛的中科大学生在其参赛随笔中写到,“大数据时代或许真的已经来临,起码'Big Data'已经成为了最近两年最buzzword的词汇。但是,如果没有这次的大数据比赛,就我而言,大数据可能永远只是一个概念,一个新技术,一个新前沿,几篇优秀的论文,永远不会走入我们。”
这次以天猫算法大挑战为主题的数据竞赛是在阿里巴巴大数据科研平台——“天池”上开展的,比赛通过建立算法模型分析用户在天猫上的行为日志,建立用户的品牌偏好,并预测他们在将来一个月内对品牌下商品的购买行为。大赛主办方阿里巴巴提供了总计5.7亿条经过脱敏处理的真实海量天猫用户行为数据,给选手们供应了真正意义上的大数据,同时给参赛队伍免费开放ODPS云计算数据处理平台,让选手免却搭建计算平台的后顾之忧。
根据阿里巴巴提供的资料显示,十支进入第二阶段的高校队伍来自中国科学院大学、清华大学、香港科技大学、浙江大学等知名大学。有意思的是,与目前中国数据挖掘领域的男女比例现状保持一致,在最后进入到TOP10排名的16位选手中,仅有一位来自浙江大学的王静是女性,其余都是男生。
在第一阶段比赛阶段产生的TOP10队伍,经过为期两天的现场答辩后,由专业的评审委员会评选出前三名。评审委员会中包括华为公司诺亚方舟实验室主任暨香港科技大学计算机系教授杨强、美国密歇根州立大学终身教授金榕、华东师范大学软件学院教授暨美国乔治亚理工学院计算所计算科学与工程系教授查宏远、电子科技大学大数据研究中心主任暨互联网科学中心主任周涛,以及阿里巴巴集团研究员薛贵荣博士等人。
这次“脚踏实地”数据竞赛,也获得了高校和科研机构的强烈反响,据阿里数据显示,从大数据竞赛3月10日宣布报名以来,在短短的一个月内,就迅速吸引了全球14个国家和地区7276支队伍参赛,经过几轮的循环竞赛,并在8月20日前诞生出了10强队伍。