Current Location:home > Detailed Browse

Article Detail

名字嵌入向量方法

Submit Time: 2020-10-19
Author: 何沧平 1 ; 许涛 2 ;
Institute: 1.微博; 2.曙光信息产业(北京)有限公司;

Abstracts

在进入推荐系统之前,商品名、人名等实体名字需要嵌入低维向量。word2vec这样的流行嵌入算法的出发点是“相同语法位置上的词具有相似的向量”,而名字序列没有语法结构,导致名字向量的质量不高。 本文从“相邻的名字具有相似的向量”出发,提出一个称为名字嵌入的新方法。名字嵌入使用了一些新技巧:公式比word2vec更简单,向量模长固定为1、用相对权重处理低频名字、优化目标使用简单的均方差。 以名字相似度作为衡量标准,在NBA球队名人造集、球队名微博集和微博点赞集上,名字嵌入均显著优于word2vec。
Download Comment Hits:1016 Downloads:117
From: 何沧平
DOI:10.12074/202010.00007
Recommended references: 何沧平,许涛.(2020).名字嵌入向量方法.[ChinaXiv:202010.00007] (Click&Copy)
Version History
[V2] 2020-10-19 09:56:41 chinaXiv:202010.00007V2 Download
[V1] 2020-10-15 22:04:08 chinaXiv:202010.00007v1(View This Version) Download
Related Paper

5. 滑动均值聚类 2019-11-26

9. 接圆回归 2019-04-10

Download

Current Browse

Change Subject Browse

Cross Subject Browse

  • - NO