当前位置 : 首页> 交流分享 > 资深算法架构师实例解析今日头条用了哪些算法

资深算法架构师实例解析今日头条用了哪些算法

时间:2019-03-06 14:34:02   已访问:278次
热门专业

算法架构师做什么的?有哪些职责所在?作为资深的算法架构师以实例告诉你算法的用途,今日头条大平台,相信大家都不陌生,今天就是来说说今日头条用了哪些算法,对算法感兴趣的朋友们,可以和资深算法架构师一起交流互动。

资深算法架构师实例解析今日头条用了哪些算法_www.cnitedu.cn

今日头条都运用到了哪些算法?

算法分发并非是把所有决策都交给机器,我们会不断纠偏,设计、监督并管理算法模型。这次分享能让更多的人理解算法,并共同参与到算法模型的制定中来,以改善算法,更好的为用户服务,让算法为社会创造更大的价值。

今日头条旗下几款产品都在沿用同一套大的算法推荐系统,但根据业务不同,每套系统的架构会有所调整。 今日头条使用的五种推荐算法,包括传统的协同过滤模型,监督学习算法Logistic Regression模型,基于深度学习的Factorization Machine,以及DNN和GBDT。 现在很难有一套通用的架构模型适用于所有的推荐场景,所以很多公司会做多个算法的组合,比如现在很流行将LR和DNN结合,甚至前几年Facebook也是将LR和GBDT算法做结合。今日头条也基本是一套大算法,根据业务不同再具体调整结构。

头条的推荐如何工作?主要有四类最重要的用户特征,将会输入给算法,影响到推荐算法的工作。

第一类是相关性特征,就是评估内容的属性和维度与用户是否匹配。显性的匹配包括关键词匹配、分类匹配、来源匹配、主题匹配等。像FM模型中也有一些隐性匹配,从用户向量与内容向量的核心距离可以得出。

第二类是环境特征,包括地理位置、时间。这些既是bias(基础)特征,也能以此构建一些匹配特征。

第三类是热度特征。包括全局热度、分类热度,主题热度,以及关键词热度等。热度信息在大的推荐系统特别在冷启动的时候非常有效。

第四类是协同特征,它可以在部分程度上帮助解决所谓算法越推越窄的问题。协同特征并非考虑用户已有历史。而是通过用户行为分析不同用户间相似性,比如点击相似、兴趣分类相似、主题相似、兴趣词相似,甚至向量相似,从而扩展模型的探索能力。


推荐内容