基于轨迹时空词向量的用户特征识别

发布时间：2024-04-11 19:21

　　用户移动上网访问基站的轨迹数据从时间和空间上反映了用户的生活习惯和行为模式,时间和空间信息同时产生不应分别考虑,因此在传统的TF-IDF方法的基础上提出了与时间相关的TFT-IDFT方法,用以提取轨迹点语义信息,进而采用word2vec的方法将轨迹数据转化为文档分析,提取包含位置信息和语义信息的轨迹时空词向量,在此基础上建立多分类模型对用户所属年龄段进行识别。实验结果表明,改进的TFT-IDFT方法在提取轨迹语义时更具合理性,且基于此方法构建的轨迹时空词向量应用于分类模型,对用户所属年龄阶段的识别效果更好。此外,采用K-Means方法对4G用户进行了聚类分析,并对每个类别的用户特征进行了分析。结果表明利用用户移动上网的时空数据,可以较好地将用户聚类为4组,这4组的特征分别为:活动重复度高且活动范围较小的人群,活动重复度高但活动范围较大的人群,活动重复度低但活动范围较小的人群,以及活动重复度低且活动范围较大的人群。此外还从工作日和休息日的不同活动情况推断了用户的活动重复度高低和活动范围大小是由于主观懒散还是客观条件造成。

【文章页数】：83 页

【部分图文】：

图４ＣＢＯＷ和Ｓｋｉｐ－ｇｒａｍ模型构架图本文采用模型对于给定的一系列

７期吴浩等：基于轨迹时空词向量的用户年龄特征识别述其对应单词的语义相似度。Ｗｏｒｄ２ｖｅｃ有两类模型：ＣＢＯＷ（ＣｏｎｔｉｏｕｓＢａｇ－ｏｆ－Ｗｏｒｄｓ）模型和Ｓｋｉｐ－ｇｒａｍ模型。其区别在于ＣＢＯＷ利用上下文预测目标词，Ｓｋｉｐ－ｇｒａｍ模型通过目标词来预测上下文，如图４所示....

图1-1技术路线图

上海交通大学硕士学位论文81.5论文结构安排本文将对基于轨迹时空词向量识别用户特征的问题进行俺就，论文的结构安排如下：第一章介绍本文的研究背景与意义，研究的主要内容，关于本文的国内外相关文献，以及本研究所面临的挑战。第二章介绍了轨迹数据、词向量模型、分类预测模型、聚类模型等相关的....

图2-1CBOW和Skip-gram模型构架图

上海交通大学硕士学位论文25是该词的概率，然后通过softmax函数对输出值进行归一化处理，计算公式为yuzq，其中u是隐含层到输出层的权重，q为偏置项。2.4.4Skip-gram和CBOW模型Word2vec有两类模型：CBOW（ContiousBag-of-Words）模型....

图3-1剪枝无效点Fig.3-1Rawtrajectory

上海交通大学硕士学位论文30根据实际经验，普通公路上的速度上限一般在60km/h~120km/h，人的步行速度一般在15km/h，同时一般而言，用户不可能在3秒内以任何交通工具方式形成锋利锐角的轨迹夹角，因此，在本文中，速度阈值=15vkm/h，距离阈值=200dm，时间阈值12....

本文编号：3951022

资料下载

论文发表

支付宝下载
微信下载
会员下载

本文链接：https://www.wllwen.com/kejilunwen/shengwushengchang/3951022.html

上一篇：基于用户反馈信息的评分预测算法的设计与实现
下一篇：再生水条件下灌水器内生物膜生长对流量的影响