“数据科学家”成为互联网时代新宠
——专访美国硅谷LinkedIn总部数据科学家王楠(Iris Wang)
来源:中国贸易报
![]() |
■本报记者 毛雯
世界迈进了大数据时代,数据已经渗透到当今美国每一个行业和业务职能领域,同时也催生了提取、分析、解读海量数据的新工作岗位——“数据科学家”。最近,《中国贸易报》记者采访了来自美国硅谷科技公司LinkedIn(领英)总部的数据科学家、《Data Science Interviews Exposed》的作者之一王楠(Iris Wang),同大家分享这本新书的观点数据、科学家在美国高科技公司的实践以及对大数据运用的思考。
记者:《Data Science Interviews Exposed》作为第一本系统介绍数据科学家这个行业的书,最近在亚马逊网站(Amazon)热销,您作为这本书的作者之一,能谈谈这本书的由来吗?
王楠:数据科学家在最近几年比较火,很多人想进入这个行业。但是由于这是个新兴职业,数据科学家的内涵界定众说纷纭,企业招聘说明中,有各种大数据新名词、算法和技能的表述。不同的企业或从业者有着不同的理解,对这个职业的定义等没有统一的标准,也没有太多成功经验可借鉴。所以大家就非常需要了解具体的职业规范、在企业组织架构中的职能定位、数据分析团队的架构、具体的岗位技能要求,以及面试的评价标准、考核的实例、方法等等。针对这些需求,我们是摸着石头过河,在实践中探索,结合对领英、谷歌、亚马逊、微软等高科技企业数据科学家的研究,写了这本书。希望能抛砖引玉,提供一条捷径,让那些拥有数学/统计、计算机能力、在特定业务领域知识、想入行或想转行成为数据科学家的人,了解该选择加入什么样的公司、什么样的团队及岗位,以最快的速度找到一份适合自己专长和潜质的数据科学家职位;也让国内那些“望子成龙”的家长及以数据科学家为就业目标申请留学的同学们,了解数据科学家岗位有什么规范、技能和背景要求,以便更有针对性地选择学校和专业,为将来进军这个最具潜在丰厚回报的行业开好头、起好步。
记者:LinkedIn最近评选出了2014年前25大最受欢迎职场技能,其中“统计分析与数据挖掘”名列第一。《哈佛商业评论》的评论文章称数据科学家为21世纪“最性感”的工作。作为一名数据科学家,您认为这个职业这么受欢迎的原因是什么?
王楠:数据科学家最受欢迎的原因,是他们能够在IT技术、数据分析和商业决策之间架起一座桥梁,用数据对现实和未来作出准确的判断,起到支持决策、解决经营管理中问题的作用,支撑企业赢得竞争优势、提高盈利水平。数据科学家受欢迎的程度,取决于他们把IT知识和经验运用到现实中让企业因此不断获利的效果。无论是领英、亚马逊等高科技企业,还是商业银行、证券公司、保险公司等传统企业,数据科学家都可以用独特的综合技能,从不同来源的海量数据碎片中找出规律,再通过这些规律来推断客户行为,找准客户行为的触发点并写出相关的统计模型。通过模型的运用提炼出各类有用信息,来帮助企业开源节流,精益管理。同时,还可以依托科学的数据分析结果,洞察客户的需求并制定经营策略,细化营销措施,为用户提供精准周到的产品和服务,从而实现精准营销、特色发展。此外,对于政府和公共事业部门来说,可以通过数据采集和分析,精准又实时制定更有效的政府、民生、环境保护、社会保障、城市规划等各项政策;对于创业者也可以充分利用大数据,抢抓市场机遇,创业、展业。
记者:结合您的工作举个例子,介绍一下互联网企业是怎样依托数据科学家们用数据创造巨大价值的。
王楠:LinkedIn和Amazon通过互联网手段,获取非常丰富的用户行为信息,并且进行深度分析与挖掘,依托数据科学家们用数据创造了巨大价值:他们通过用户行为分析并提高用户粘性让搜索结果变得更准确,准确投放广告获得更高点击率,向用户推荐“可能认识的人”等等,适时推出许多改进和有价值的产品,并形成了核心竞争力。
具体来说,本人所服务的LinkedIn的数据科学团队通过对用户使用产品过程中的所有数据(包括下载量、使用频率、访问量、访问率、留存时间等等)进行收集、整理、统计、分析用户使用产品的规律,将这些规律与网络营销策略等结合起来,找出目前产品及网络营销活动中可能存在的问题,为产品的后续发展、优化或者修正网络营销策略等提供了有力的数据支撑,推动了业务的增长和公司的发展。如,LinkedIn率先采取“推理算法”推出了“您可能知道的人”这个功能,极大地推进了公司增加用户粘性和提高用户口碑的传播。此外,LinkedIn的数据科学团队还通过对各个行业的用户数据分析,对行业或者整个经济进行一些预测:比如说某个行业进行了裁员,或者某些行业的招聘计划增加等等,这些用户实实在在的行为数据,不仅对企业的发展起到了重要的作用,有的还被美国总统经济政策报告采用。