熵选择多重二进制编码
[Abstract]:In order to solve the problem of high cost Euclidean distance and high memory occupancy, the high-dimensional floating-point data is mapped to low-dimensional binary code by hash mapping function. The normalized distance of the same sample point in two kinds of space satisfies the similarity. In order to reduce the retrieval complexity, the lower cost hamming distance can be used to replace the Euclidean distance. In order to ensure that the binary code generated by the hash function has better nearest neighbor retrieval performance, the binary label of the data set adapted to spatial distribution is obtained based on the lookup mechanism. Then the classification plane of binary label is obtained by SVM algorithm, and the plane function with maximum entropy is selected as the final hash mapping function. In order to further improve the performance of nearest neighbor retrieval, in the training stage, many different coding centers are initialized to generate multiple binary tags, and corresponding multiple hash functions and multiple binary codes are obtained. In the retrieval process, the nearest neighbor retrieval system based on multiplex binary coding is established, and the sample point with small average hamming distance is returned as the final retrieval result. The experimental results show that the proposed algorithm can transform floating-point data into binary code quickly and effectively, and the performance of nearest neighbor retrieval based on these binary codes is better.
【作者单位】: 吉林大学计算机科学与技术学院;吉林大学符号计算与知识工程教育部重点实验室;华东师范大学计算机科学与软件工程学院;
【基金】:国家自然科学基金项目(61101155) 吉林省自然科学基金项目(20140101184JC;20150520063JH) 吉林大学研究生创新基金项目(2015051)
【分类号】:TP391.41
【相似文献】
相关期刊论文 前10条
1 孟祥萍,梁志珊,张化光;一种基于二进制编码的优化方法[J];控制与决策;1998年S1期
2 吴俊杰;;信息的编码:四位二进制编码[J];中国信息技术教育;2014年05期
3 刘鹏林;浅谈计算机采用二进制编码的合理性[J];三明高等专科学校学报;2003年04期
4 张东阳;李战;李文彬;;一种新型的二进制编码理论的研究[J];微计算机信息;2010年12期
5 李良敏;温广瑞;王生昌;;基于二进制编码的改进杂交策略[J];兰州理工大学学报;2008年05期
6 孟祥萍,张化光,何巍;一种基于二进制编码的改进遗传算法[J];吉林工业大学自然科学学报;1999年03期
7 黄伟力;焦娇;;基于题号二进制编码的遗传组卷算法[J];科技信息;2009年21期
8 王智永;;基于二进制编码ERP数据质量研究[J];现代电子技术;2010年08期
9 张国富;周鹏;蒋建国;苏兆品;田敬北;刘扬;;基于虚拟联盟的重叠联盟形成算法[J];电子学报;2012年01期
10 陈云;周武雷;;基于二进制编码尺的水位测量仪设计[J];吉首大学学报(自然科学版);2014年01期
相关会议论文 前2条
1 安斌;严卫东;郑江玲;陈华;;两种基于光谱形状描述的二进制编码分类新方法[A];中国航空学会信号与信息处理专业全国第八届学术会议论文集[C];2004年
2 缪亚林;卞正中;;基于最佳二进制编码的医学B超信号研究[A];2009中国仪器仪表与测控技术大会论文集[C];2009年
相关重要报纸文章 前1条
1 ;XML“减肥”记[N];网络世界;2005年
,本文编号:2121332
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2121332.html