南京大数据技术Meetup第十次会议 暨 2017 CCF BDCI数据大赛 YOCESF南京专场

阅读量:5
2017-11-03

活动时间

2017年11月04日 下午13:30-17:30

活动地点

南京市栖霞区仙林大道163号南京大学(仙林校区)计算机科学技术楼221多功能报告厅

南京地铁2号线 南大仙林校区站 下车直达 (百度地图: http://j.map.baidu.com/3gzAb)

活动主持:顾荣

活动内容

  1. 周德宇(东南大学计算机学院,教授,博导):大数据时代下的自然语言处理研究进展

  2. 朱颖航(灵犀联云,技术总监):大规模场景下的智能化硬盘故障预警及修复

  3. 冯娟(量子数聚,首席数据科学家):企业大数据在风控领域的应用与价值挖掘

中场茶歇 & 参展海报自由交流(25分钟,请有意参展的单位与我们联系,联系邮箱gurong@nju.edu.cn)

  1. 丁明(中电普华,数据挖掘工程师):数据挖掘思维的基础

  2. 李建峰(法海数据,技术总监):AI中的数据清洗

活动注意事项

  1. 本活动免费参加。请提前在线报名并后台审核,活动入场需签到,人数较多,请于尽量与12:45前抵达会场签到。

  2. 根据会场要求, 请务必认真填写报名问题,主办方有权取消恶意填写者的报名资格;

  3. 如果希望分享相关话题或赞助后续活动, 请发送邮件到 gurong@nju.edu.cn

活动主办方:

南京大学PASA大数据实验室

CCF YOCSEF南京分论坛

指导与支持单位:

中国计算机学会大数据专家委员会

江苏省软件新技术与产业化协同创新中心

江苏省计算机学会大数据专家委员会

活动合作媒体:

CSDN

南京大数据技术Meetup历次赞助单位(持续添加):

金牌赞助商:

华泰证券股份有限公司

烽火通信科技股份有限公司

南京杰世欣计算机科技有限公司

苏宁云商集团股份有限公司

深圳纳实大数据技术有限公司

银牌赞助商:

星环信息科技(上海)有限公司

南京商数信息技术有限公司

北京灵犀联云科技有限公司

先智数据科技股份有限公司

天泽信息产业股份有限公司

北京瀚思安信科技有限公司

附录:本次活动讲者简介

题目A:大数据时代下的自然语言处理研究进展

讲者简介:周德宇,东南大学计算机学院,教授,博导。2008年博士毕业于英国里丁大学计算机学院,2009年英国剑桥大学博士后回国就职东南大学。从事大数据分析、自然语言处理等相关研究。主要围绕如何利用统计模型来表示外界事物的不确定性,研究数据模型在社交媒体分析,生物文本理解等若干领域上的应用。发表论文30余篇。部分论文(第一作者)发表在领域内重要国际期刊,如《IEEE Transactions on Knowledge and Data Engineering》、《Bioinformatics》、《Artificial Intelligence in Medicine》等,以及领域内一流国际会议,如ACL’16, IJCAI’16、EMNLP’16 ’15、AAAI’15、ACL’14、CIKM’11、ECIR’11、COLING’08等。担任《Frontiers of Computer Science》青年编委、中国中文信息学会理事、中国中文信息学会社会媒体处理专业委员会委员、中国中文信息学会健康与生物信息处理专业委员会委员。

演讲内容简介: 本报告针对互联网时代下海量的网络文本,围绕自然语言处理的若干技术:关系抽取、事件抽取和情感分析展开阐述。报告主要包括三部分内容:1)基于深度学习的药物之间不良反应的信息抽取,2)基于概率图模型的热点事件发现及其可视化,3)面向网络文本的社会舆情分析。最后结合工业界具体的应用案例,分析自然语言处理技术可能的发展方向和热点问题。

题目B:大规模场景下的智能化硬盘故障预警及修复

讲者简介:朱颖航,服务器智能运维领域的知名专家。毕业于哈尔滨工业大学,曾在百度系统部担任多年资深系统工程师,是百度“智能数据中心”项目的核心贡献人员,现任灵犀技术合伙人。在40万+台服务器规模下,实现了从硬件数据采集、存储、分析和挖掘的全程经验,从而将服务器硬件监控带入细粒度覆盖、定位效能、自动治愈、智能预测的新时代。

演讲内容简介:在数据中心中,硬盘相关的故障占全部硬件故障的85%以上。随着大数据时代的到来,服务器数量大幅度增长,更多的存储需求、更低成本硬盘的使用,以及高温、高存储密度等技术的应用,硬盘故障及报废规模呈明显增加趋势。这对业务稳定、存储成本和运维效率都造成了严重的影响。基于数十万片硬盘近30个月的硬盘运行及故障大数据,使用机器学习技术,挖掘、分析海量数据,打造了可自动迭代的故障预测系统,支持全部厂商所有型号的 SATA 硬盘故障预测,准确率超过98%;同时与系统调度集成,能够提前避免故障对业务造成不良影响,有效降低云存储系统的平均故障修复时间(MTTR)。

题目C:企业大数据在风控领域的应用与价值挖掘

讲者简介:冯娟,量子数聚首席数据科学家,曾在业界领先的大数据应用服务提供商--龙信数据担任研发部经理、行业首席分析师等职务,有超过10年的企业大数据分析挖掘和应用经验。目前带领量子数聚研发团队,专注构建企业大数据价值体系,实现公司“用数据为组织赋能”之理念。

演讲内容简介:企业大数据正以星火燎原之态向传统风控领域渗透。在数据来源、数据内涵、覆盖群体和模型思路上,企业大数据都有自己的特点。利用大数据信息对企业进行信用评价,除可以作为借贷风控领域的有力补充,还可以在政府征信领域用于企业扶持、政府采购、政策评估、企业监管等多个场景。

题目D:数据挖掘思维的基础

讲者简介:丁明,北京中电普华信息技术有限公司,数据应用研究事业部,数据挖掘工程师。2016年从零基础入门数据挖掘行业,两年时间参与各类大数据相关比赛,荣获“KDD CUP 2017”第三名,“携程云海-未来出行”第一名,“2016 CCF BDCI 用电行为分析大赛”第二名,“智慧中国杯,助学金分配”第三名,“IBM马拉松-聊天机器人”优胜奖,“第二届中国创新挑战赛”第五名。

演讲内容简介:数据江湖中的“浪叫兽”讲述他在一年内快速入门数据挖掘的心得,从数据挖掘的思维框架讲起,实现一个比赛数据挖掘框架,需要实例化的代码模块,接着讲解数据分析的四个常见类型,在到对于特征工程的理解,多维度、多角度分析的概念,最后谈到了数据挖掘优化的工作中常常接触的8种常见的任务类型,为想从事数据科学家的数据挖掘新人们,提供基础指导。

题目E:AI中的数据清洗

讲者简介:李建峰,法海风控技术总监,原三星数据高级经理,从事技术相关工作十多年,目前负责光大银行总行、交通银行苏州分行、芝麻信用、京东金融、智能采集引擎等项目的统筹与领导工作。

演讲内容简介:数据清洗,是整个数据分析过程中不可缺少的重要环节,其结果质量直接关系到模型效果和最终结论。大数据时代,数据清洗越来越重要、越来越复杂,干净的数据是机器学习的基础。