中国R会议是由统计之都发起,并同国内高校共同举办的极有特色的数据科学会议。2008年,中国R会议在中国人民大学举办第一届,2016年已发展至全国九个城市先后举办,服务数据科学在校师生和业界人士数万人,内容覆盖数据科学相关的多个行业,R会议非常有幸见证了数据科学在中国的蓬勃发展。 2017年,第十届中国R会议(上海)由华东师范大学统计学院、教育信息技术学系、数据科学与工程学院携手共同主办。本届会议的主题包括但不限机器学习、数据可视化、数据挖掘、量化金融、人工智能、深度学习、图像识别、对抗学习、智慧营销、智慧医疗、智慧教育、智慧城市、社交网络、平台搭建、网络爬虫、文本挖掘、知识图谱等。其中12月2日特邀演讲会场设于思羣堂(大礼堂),12月3日将举办上述主题的平行分会场:逸夫楼一楼报告厅(分会场1);科学会堂二楼报告厅(分会场2);科学会堂一楼教室(分会场3)。 现已开放参会者报名系统http://r-shanghai-10.eventdove.com/ 会议时间及地点 2017年12月2日(周六)--12月3日(周日) 华东师范大学 中山北路校区 上海市普陀区中山北路3663号 (地铁3、4、13号线 金沙江路站) 12月2日: 思羣堂(大礼堂) 12月3日: 逸夫楼一楼报告厅(分会场1) 科学会堂二楼报告厅(分会场2) 科学会堂一楼教室(分会场3) 嘉宾介绍(一) 第十届中国R会议(上海) 暨华东地区数据科学会议演讲嘉宾介绍(一) 嘉宾介绍(二) 某微信公众号“异常”流量的 统计分析与司法实践 黄达 复旦大学管理学院统计学系 主讲人简介 统计学博士,北京大学毕业于光华管理学院商务统计与经济计量系,目前为复旦大学管理学院统计学系讲师。中国现场统计研究会计算统计分会理事。研究兴趣为:时间序列分析,计算统计,多元统计,统计学习,商务统计应用。 报告摘要 企业投放广告,投入了成本,自然希望对其收益进行评估。具体来说,企业想知道投放的广告有多少人会看,看了之后又有多少人购买,等等。但是在微信、微博等新媒体出现之前,相关数据是无法直接观测到的。新媒体的出现,后台程序记录了诸如阅读量等指标,这为企业进行广告评估在技术上提供了可能。 为了最大化广告的效果,企业往往会花重金在高阅读量的公众号(或大V的微博)上投放广告。但是,某些公众号为了经济利益,会使用种种手段进行刷阅读量,继而向企业索取高额广告费。在这种公众号上投放的广告的效果,大家可想而知。另有一种刷阅读量的目的,是为了提升自己的某些KPI数值,来迎合投资人的喜好,意图得到更多的资金。这两种情况不仅有违基本的商业道德与伦理,也扰乱了正常的市场秩序。与之相关的法律冲突案例,正在慢慢浮现。发生在2016年的X公司诉新榜网站案就是其中一例。 本文是作者作为专家辅助人参与X公司诉新榜网站案的数据分析,以亲身经历以及相关材料展示了如何识别数据“异常”。 数据在整车性能集成开发中的应用 童荣辉上海汽车集团股份有限公司技术中心 主讲人简介 工学硕士,毕业于同济大学机械制造及其自动化专业,2008年4月加入上汽集团技术中心,历任整车性能集成工程师,整车性能集成经理,整车性能集成高级经理。 报告摘要 电动化、智能化、网联化、共享化是未来汽车工业发展的趋势,在实现汽车工业‘四化’的道路上,数据始终起着至关重要的作用,具体表现在: 1.数据可以缩短车辆开发的周期、降低车辆开发成本2.数据可以实时了解客户的用车情况,从而为客户提供更贴心的售后服务; 3.数据可以判断客户的用车行为,从而给客户提供更舒适的用车体验; 本报告将从车辆集成的角度,为大家分享从车辆开发到终端用车过程中数据能够创造的价值 数据分析在主题乐园业 收益管理和预测规划中的应用 赵鑫阳 上海迪士尼度假区 主讲人简介 统计学硕士,毕业于北京大学光华管理学院商务统计与经济计量系,目前为上海迪士尼度假区预测与规划经理。 报告摘要 收益管理(英语:Yield management或Revenue management),又称产出管理,是通过理解、预测消费者行为,并与之互动的过程,从而实现收益最大化。产出管理是一种通过理解,预期和影响顾客行为,在资源固定数量且不可留存的情况下(如航班座位或者酒店客房预订),实现最大化收益的过程。 在上海迪士尼度假区,对公园每日的客流量、酒店间夜、人均门票收入、商品和餐饮消费进行预测规划以及产品定价是收益管理团队的主要工作,在盛大开园前后也经历了从没有数据参考其他迪士尼乐园的范式与模型,到逐渐积累自己的历史数据修正对市场的看法。本次演讲主要介绍数据分析在主题乐园收益管理中是预测、定价和产出管理中的典型应用,并着重介绍在客流量预测方面所使用的方法和模型。 基于客户生命周期价值(LTV)的 信贷风控策略实践 赵永鹏 杭州信喜商务咨询有限公司 主讲人简介 毕业于北京大学光华管理学院商务统计系,目前为某互金平台风控负责人。曾供职于GE Capital全球决策科学实验室、HSBC汇丰风险分析中心、阿里金融风控部门等。作为阿里金融创始团队成员之一,主持开发阿里金融第一代风控模型;专注于信贷业务的风控政策与风险分析技术,尤其是零售信用风险管理以及相关量化策略的开发,包括信用申请、账户管理、风险分析、催帐决策、损失回追等。 报告摘要 LTV(life time value),客户生命周期价值,是公司从用户所有的互动中所得到的全部经济收益的总和, 该指标被广泛应用于互联网企业的市场或运营策略中。 在信贷领域, 基于LTV的策略优化一直是痛点+难点。信贷业务的独特性是风险(risk), 风险因人群而已,且会随着时间&环境变化。痛点,痛在公司内部服务客户的流程上割裂的,既并不是每个部门都以LTV作为优化的目标函数; 难点,难在LTV的计算往往需要经过相当长的观察期(一般是几个月或几年的时间)且经受过压力的测试。 本次分享是主讲人在一家互联网金融公司的实践,分享会涉及到当前数据、算法、技术对信贷风控的影响,以及如何(部分)解决如上LTV问题, 如何利用增强学习的理念(部分)解决如上LTV问题。 R语言构建公众号服务的实践 郎大为 J.D. Power 主讲人简介 JDPower数据分析师,主要方向为汽车行业的数据咨询。浙江大学软件学院校外导师,统计之都编辑部成员,R语言脑残粉。人生目标是成为一名数据科学家, 但却一不小心走上了全栈工程师的道路, 从此日常纠结的事情从开发在哪里变成了时间在哪里。挖过很多R包的坑,有wordcloud2,REmap,leafletCN等, 与其他人共同挖的坑有recharts,RWeixin等。 报告摘要 微信公众号是市面上最流行的新媒体之一, 微信也开放了用于公众号的官方后台管理接口,与传统数据接口不同的是,数据接口一般是允许用户进行数据请求, 而管理接口起着要求用户被请求的过程,也就是需要进行后台服务器的开发。大部分脚本语言都有相应的开发方式,本次演讲将以用R语言构建微信公众号服务为例,介绍如何构建一个可以通过接口调用的服务器,以实现关注者与公众号聊天过程中的记录保存, 自动回复,管理页面等功能。 数据产品生成工具的技术探索 周宁奕 众安科技 主讲人简介 前建筑设计师,前阿里云datav可视化开发工程师,主攻webgl、webgis,数学的美学世界发起人,独立软件糊涂作者,现在众安科技负责数据科学实验室的可视化团队。 报告摘要 近2年来,数据可视化的组件的web生态圈愈发完整,可视化工程师会考虑2个重要的问题: 1.如何更专业,如在关系网络、地理可视化、渲染性能等专业方向上进行深化 2.更方便,如向后适配数据库、提升分析探索的体验、加快开发的速度等。 本次的分享,主要围绕这些问题,谈谈我们在今年做的一些产品探索,为了更好地去开发业务复杂、页面繁多、低并发的b端的数据产品,我们通过数据库查询适配、数据格式标准化、配置控制器自动化、代码自动生成等技术,进行的开发实践。 中国区域金融空间关联分析和解释 —基于网络分析法 袁野温州大学 主讲人简介 袁野,男,1991年5月生,现就读于温州大学数学与信息科学学院,应用统计与数理金融专业硕士,师从美国弗罗里达大西洋大学科学副院长,浙江省特聘专家,温州大学特聘教授钱莲芬教授。曾在2015年11月参加中国现场统计研究会第十七届学术年会并做题目为《大数据时代统计学与深度学习的思考》的报告。 报告摘要 本文基于1990年到2015年中国31个省份存贷款余额和 数据,将金融业空间区位熵作为衡量区域金融发展指标,利用Granger因果检验方法和网络分析法构造中国金融发展的空间关联和网络结构特征,借助 方法对中国区域金融发展的影响因素进行分析,有效解决传统空间计量方法难以在整体上把握金融联动全局特征和网络结构特征的缺陷。研究结果表明:(1)中国区域金融发展空间关联呈现明显复杂的网络结构,网络稳定性高,通达性好。(2)中国区域金融发展分为四个板块;第一板块: 主要西部欠发达地区的“主受益板块”,第二板块:“经纪人板块”,起着“桥梁”的作用;第三个板块:东部地区的“净溢出板块”,第四个板块:“双向溢出板块”,主要是中东部较发达省份。中国区域金融发展具有明显的能量传送梯度特征。(3)中国区域金融发展受到人均收入水平、对外贸易指数、第三产业发展指数、交通运输能力和政府干预能力的影响,与区域就业情况和地理位置是否相邻影响不大,进一步给出研究的结论和建议。 基于Vine-Copula模型的 房价与政策实证分析 曾嘉悦 中央财经大学 主讲人简介 中央财经大学统计学大四学生,曾在科学家在线,中国信息通信研究院实习,曾作为中国青年代表参加第23届联合国气候变化大会,并在新闻发布会上发言。 对R语言有着浓厚的喜爱,同导师一起在CRAN上发了R 包“dng”,关注R语言在文本分析方面的应用 报告摘要 北京市政府近年推出多项房地产相关政策,房价走势持续波动。政策的出台到底对房价又多大的影响仍然是一个值得探究的问题。本演讲结合房价走势以及房价、成交量与政策的相关关系展开,以2014年-2017年上半年北京市新建商品房成交价与每日成交量,结合各时期北京市出台政策,应用Vine-copula模型、时间序列模型以及主题模型进行分析与探索。 主办方介绍 华东师范大学 华东师范大学是由教育部主管,教育部与上海市人民政府重点共建的综合性研究型大学。1959年学校被中共中央确定为全国16所重点院校之一,1978年学校再次被确认为全国重点大学,1986年学校被国务院批准成为设立研究生院的33所高等院校之一。1996年被列入"211工程"国家重点建设大学行列。2006年教育部和上海市决定重点共建华东师范大学,学校进入国家"985工程"高校行列。2017年学校进入世界一流大学A类建设高校行列,全面开启建设中国特色世界一流大学的新征程。 本次大会具体由华东师范大学统计学院、教育信息技术学系、数据科学与工程学院承办。 统计之都(Capital of Statistics,简称COS)成立于2006年5月,是一个旨在推广与应用统计学知识的网站和社区。统计之都发源于中国人民大学统计学院,现由世界各地的众多志愿者共同管理维护。其旨在搭建一个开放的平台,使得科研人员、企业数据分析人员和统计学爱好者能相互交流合作,一方面促进彼此知识和技能的增长,另一方面为国内的统计学和数据科学贡献自己的力量。 统计之都大力欢迎所有应用和研究领域的朋友们与我们在实际应用问题上合作! GenePlan知几基因 长江众创 上海长江时代众创空间数字技术有限公司作为国内领先的场景金融智慧数据服务商,由长江时代通信股份有限公司联合深圳光启集团(股票代码:00439.HK,MJP.ASX,002625.SZ)共同出资成立. 长江众创积极响应“大众创业,万众创新”的国家战略,结合移动互联网与产业互联网融合发展趋势,打造数据协同工作平台,用“数据中央厨房”来做数据企业孵化,用MOM理念来做数据企业风险投资,构建了线上场景金融的智慧数据服务和线下数创空间站相结合的创新型服务生态体系。 IT大咖说 联系方式 微信公众号:统计之都 邮箱:chinar-2017-sh@cos.name |