前言
随着互联网技术的高速发展,信息的数据量暴增,人工智能技术不断深入社会的方方面面。图神经网络可以灵活高效地建模大数据中的复杂交互关系,可针对图数据进行高效挖掘,因此成了人工智能领域最重要的分支之一。在学术界,图神经网络也引起了学者的广泛关注,在计算机视觉、文本处理,以及数据挖掘等多个顶级会议期刊上,图深度学习的相关探究工作有了明显增长。现实世界的许多问题都可以用图结构数据刻画,因而图神经网络的工业应用场景也非常丰富,如电商广告推荐、金融风控、社交短视频、自然语言处理、药物研发等。京东自研的图计算平台(Galileo)将图神经网络技术落实到具体业务,团队也积累了对图深度学习的浅显认知与实践经验。以此为契机,期望通过本书,能将我们在相关领域的实践经验分享给大家。
本书共分10章。第1、2章主要介绍深度学习的基础和图数据的特点,帮助初学者理解图神经网络是深度学习在图结构数据上的重要研究方向。由浅入深,首先以经典的多层感知机为基准,介绍深度学习的基础,然后介绍图数据的特点,以及图神经网络的发展简史和应用场景,帮助未接触深度学习和图数据的读者入门。第3~7章主要介绍图深度学习研究和实践中涌现出的一些典型算法。介绍图表示学习,即如何将图数据进行向量化建模,是图数据建模的基石;还介绍图卷积神经网络,讲述谱域神经网络和空域神经网络。然后介绍较为热门的图注意力网络和序列图神经网络;考虑到经典图神经网络算法,在实际工业级网络中并不能工作得很好,存在过平滑、计算复杂度高、扩展性较差,以及难以适用于异质图等问题,对图卷积神经网络扩展模型进行介绍。第8~10章介绍图神经网络的实战,先从工程角度出发,介绍业界在图模型通用性、计算平台构建上的贡献,并详细介绍京东的Galileo图神经框架;然后从真实业务场景出发,介绍图神经网络在推荐系统和以流量风控为代表的京东互联网业务中的实战场景,帮助读者理解图神经网络解决实际问题的过程。
本书由京东数据智能部图计算团队成员姚普、陈晓宇、刘健、胡俊琪、张维编写。在写作过程中得到京东零售数据算法通道委员会颜伟鹏、包勇军、朱小坤等领导的指导和支持,书中的大量插图得到赵森的大力支持,算法的代码实现得到杜华的全力支持。本书初稿完成后,赵夕炜、杨庆广、刘雅、刘玉家、郭锦荣、白涛、王三鹏、纪厚业等分别审阅全部或部分章节。诚挚感谢为本书写作和出版付出努力的每一位同事。
由于作者水平有限,书中难免会出现一些错误或者不当的地方,欢迎各位专家和读者批评指正。书中算法实现可从https://github.com/JDGalileo/galileo、https://gitee.com/jdplatform-opensource/galileo网址下载。如果您有更多的宝贵意见,也欢迎发送邮件至yaoweipu@126.com,期待得到您的真挚反馈。
作者
2022年3月