学术交流

热烈祝贺山东大学信息检索实验室师生论文被TOIS2022接收

2022年11月10日

近日，山东大学计算机科学与技术学院信息检索实验室师生撰写的 1 篇论文被TOIS录用。

ACM信息系统学报（ACM Transactions on Information Systems）是由美国计算机学会（ACM）出版的SCI核心期刊，被中国计算机学会（CCF）定位为数据库/数据挖掘/内容检索领域A类国际期刊，主要聚焦于信息检索，在文本和推荐系统等领域享有较高学术声誉。

录用的文章如下：

标题：On the User Behavior Leakage from Recommender System Exposure
作者：辛鑫，杨纪元，王涵冰，马军，任鹏杰，罗恒亮，史鑫磊，陈竹敏，任昭春
内容简介：现有的推荐系统被训练为根据用户历史行为数据预测用户未来的潜在交互物品。在交互过程中，虽然数据来自用户侧，推荐系统也生成曝光数据以向用户提供个性化的推荐列表。与稀疏的用户行为数据相比，系统曝光数据的数量要大得多，因为只有很少的曝光项目会被用户点击。此外，用户历史行为数据是敏感的个人隐私，通常由一些访问授权进行保护。然而，由服务提供商自身生成的大量推荐系统曝光数据通常受到较少关注，并且该数据可以在各种信息寻求者甚至潜在对手的相对较大范围内访问。

在本文中，我们研究了推荐系统领域中的用户行为泄漏问题。我们表明，可以通过建模系统曝光来推断用户过去的行为数据隐私。换言之，我们可以通过对该用户当前系统曝光数据的观察来推断该用户之前点击了哪些项目。鉴于系统曝光数据可以从相对更大的范围内被广泛访问，我们认为用户过去的行为隐私在推荐系统中泄露的风险很高。更准确地说，我们构建了一个攻击模型，其输入是用户当前推荐的项目列表（即系统曝光），而输出是用户的历史行为。具体而言，我们利用编码器-解码器结构来构建攻击模型，并应用不同的编码和解码策略来验证其隐私攻击性能。对两个真实世界数据集的实验结果表明，用户行为泄露的风险很大。为了解决这一风险，我们提出了一个两阶段的隐私保护机制，该机制首先从曝光列表中选择一个项目子集，然后用基于均匀分布或流行度的曝光数据替换所选项目。实验评估揭示了推荐准确性和隐私泄露风险之间的权衡效应，这是推荐系统中隐私保护方面的一个有趣而重要的话题。

图: 本工作(b)与现有推荐系统(a)的区别