来源:青海新闻网作者:朱锦燕发布时间:2015-09-02 10:34:58编辑:朱锦燕文/张莎
8月29日下午,七牛公司主办了主题为“数据重构未来”的“七牛数据时代峰会”。峰会在上海国际时尚中心举行,今日头条副总裁杨震原受邀参与并发表了,就今日头条的数据技术进行了分享。
杨震原首先向与会的人们简单介绍了今日头条,他自豪地讲到:今日头条是一个平台。也是一个基于机器学习的个性化推荐引擎。它拥有超大的用户量,累计激活用户达到2.9亿,各端DAU超过2700万,每用超过40分钟,这个常大的量。对于头条号拥有大量的作者,这些数据创作者没都在发布创作文章。杨震原强调,今日头条在大数据方面投入了非常多的精力做研发,希望能通过这样的方法把新闻或用户感兴趣的内容精确地推荐给用户。
杨震原还列出了一些数据:今日头条每天训练数据达到100T,每日日志行数100亿条。特征组合数每天750亿,线上model330亿。今日头条服务器增长也非常快,目前公司已经有四千台服务器。今日头条不仅是一个做服务的公司,更多是做的公司。杨震原讲到今日头条的创建,主要是三个方面:介质的变化,机器学习的发展和个性化的需求。他解释道,介质变化是随技术发展而持续发生变化的,是驱动人们获取信息方式的重要原因。目前的移动互联网时代,人们更加倾向于可以跟创作者讨论、参与发布内容等可以和创作者交互的信息平台。杨震原预计,因为手机移动端的发展,介质的变化,接下来的几年里,人们获取逆袭的方式会发生剧变。由此,他强调,这也是机器学习技术得以发展的契机。杨震原还讲到,今日头条拥有很大量的数据,也拥有强大的存储计算的能力,可以分析出结果,大规模的抹平信息鸿沟。从而可以实现个性化推荐的需求。
杨震原用简单的生活例子讲述了在移动时代信息的大量过剩的,人们通常只想看感兴趣的内容。今日头条正是运用这一点,基于推荐引擎的模式,产生良好的创作分发和互动。内容分发的效率提升了,就会更高效的刺激创作,更高效的分发会让用户体验变好,用户会聚集在今日头条的平台上,产生互动,互动又会刺激内容创作。这个模式是属于今日头条的独特模式,也是未来很有发展前景的一个模式。这使得今日头条用三年时间积累下2.5亿用户。
杨震原着重讲了今日头条在实践方面的总结。第一,要尽量全面的记录用户的行为,根据用户喜好,重塑目标。第二,统一模型,要有统一的团队,才可以做更好的梳理,得到更好的效率。第三,充分优化核心工程,通用系统不能实现大量数据的快速更新。
通过这次峰会的,今日头条副总裁杨震原向大家系统地介绍了今日头条在数据技术上的与实践经验,让从数据技术方面,更加了解今日头条的实力、潜力和先进的数据运用,为数据时代峰会增添了亮彩的一笔新色。